正则表达式——极速入门

　2010-01-15 10:44:36　来源：WEB开发网　　　

核心提示：正则表达式：正则表达式可以让用户通过使用一系列的特殊字符构建匹配模式，然后把匹配模式与数据文件、程序输入以及WEB页面的表单输入等目标对象进行比较，正则表达式——极速入门，根据比较对象中是否包含匹配模式，执行相应的程序，中间用'.'分隔19 puts "IP"20 num = /^\

正则表达式：

正则表达式可以让用户通过使用一系列的特殊字符构建匹配模式，然后把匹配模式与数据文件、程序输入以及WEB页面的表单输入等目标对象进行比较，根据比较对象中是否包含匹配模式，执行相应的程序。正则以其简单、实用、快速深得广大编程人员的热爱。

编写正则一些思维：

1、首先，确定规则。你需要匹配一个什么样字符串，它有哪几部分构成，它有哪些特征。

2、提出最小单位。有的时候，一些匹配规则是重复的，我们可以试着找到共同点，规划为一条规则。

3、根据其规则、最小单位，逐一写出正则

4、将这些单位正则组合统一，构成你想要的完整正则。

在这里我们就需要了解一些基本的标记和用法，任何的规则都是用基本标记组合而成的。而正则的标记也很简单，大家不妨了解一下。

正则表达式中常用的标记

1 正则表达式中常用的标记 2　^　　|　行或字符串开头 3 $　　|　行或字符串末尾 4　.　　|　除换行符外的字符 5　\w　 |　单词字符（数字、字母或下划线） 6　\W　 |　非单词字符 7　\d　 |　数字（等同于【0-9】） 8　\D　 |　非空白字符 9 10　\A　 |　字符串开头11　\Z　 |　字符串末尾或最后的换行符钱12　\z　 |　字符串末尾13 14　\s　 |　空白字符15　\S　 |　非空白字符16 17　\b　 |　单词边界（【】外）18　\B　 |　非单词边界19　\b　 |　退格（在【】内）20 []　 |　集合中的任何一个字符,中间使用连字符，则表示范围，如:[0-9],[a-z]21　?　　|　 0或1个之前的表达式22　|　　|　或23 （） |　子表达式编组24 25　*　　|　零或多个之前的表达式26　*?　 |　零或多个之前的表达式（非贪婪）27　+　　|　 1个或多个之前的表达式28　+?　 |　 1个或多个之前的表达式（非贪婪）29 {m,n}|　 m-n个之前的表达式30 {m,n}? | m-n个之前的表达式（非贪婪的）31 32 33 还有{?=} {?!} (?>) (?#) (?imx-imx)等

最基本的实例：

1 #匹配整个字符串 2 puts /ruby/ =~ "ruby"　 # 0 3 puts /ruby/ =~ "Ruby"　 # nil 4　5 #匹配行或字符串开头与结尾 6 str = "abcdef" 7 puts str 8 puts /^abc/ =~ str　 # 0 9 puts /def$/ =~ str　 # 310 11 str = "abc\ndef\n"12 puts /^abc/ =~ str　 # 013 puts /def$/ =~ str　 # 414 puts /abc/ =~ str　　# 015 puts /def/ =~ str　　# 416 17 #匹配字符串本身的开头和结尾18 str = "abc\ndef\n"19 puts /\Aabc/ =~ str　　# 020 puts /def\Z/ =~ str　　# 421 puts /def\z/ =~ str　　# nil22 23 #匹配单词字符24 puts "匹配单词字符"25 pattern = /\w/26 puts pattern =~ "abc"　# 027 puts pattern =~ "."　　# nil28 29 #匹配整数30 # \d 数字31 # \D 非数字32 puts "匹配数字"33 puts /\d/ =~ "122"　 #034 puts /\D/ =~ "122"　 #nil35 puts /\D/ =~ "abc"　 #036 37 38 #边界39 str = "This is your friend!"40 puts str41 puts str.gsub(/\b/,"|")　 # |This| |is| |your| |friend|!42 puts str.gsub(/\B/,"-")　 # T-h-i-s i-s y-o-u-r f-r-i-e-n-d!-43　

限定符实例

1 puts "限定符" 2 puts "限定符：*" 3 puts /(abc)*/ =~ "a"　　　# 0 4　puts /(abc)*/ =~ "abc"　　# 0 5　 6　7 puts "限定符：+" 8 puts /(abc)+/ =~ "a"　　　# nil 9　puts /(abc)+/ =~ "abc"　　# 010　11 puts "限定符：?"12 puts /(abc)?/ =~ "c"　　　# 013　puts /(abc)?/ =~ "abc"　　# 014 15 16 puts "限定符： {n}"17 puts /(abc){2}/ =~ "abc" # nil18 puts /(abc){2}/ =~ "abcabc" # 019 20 puts "限定符： {n,}"21 puts /(abc){2,}/ =~ "abc" # nil22 puts /(abc){2,}/ =~ "abcabc" # 023 24 puts "限定符： {n,m}"25 puts /(abc){2,3}/ =~ "abc" # nil26 puts /(abc){2,3}/ =~ "abcabcabc" # 027 28 puts "限定符： *?"29 puts /(abc)*?/ =~ "a"　　　# 030 puts /(abc)*?/ =~ "abcabc" # 031 32 puts "限定符： +?"33 puts /(abc)+?/ =~ "a"　　　# nil34 puts /(abc)+?/ =~ "abcabc" # 035 36 puts "限定符： ??"37 puts /(abc)??/ =~ "a"　　　# 038 puts /(abc)??/ =~ "abcabc" # 039 40 41 #匹配， {1} {3}42 # {3}能匹配，那{1}肯定能匹配，反过来不成立43 # 匹配范围：{1} > {3}

常用实例：

1 puts "例子" 2 #匹配电话号码： 3 #一般中国的电话号码为7-8位,区号3-4位整数，区号第一位是0，中间用分隔符‘-’ 4 #注意首尾限制符 5 pattern = /^0\d{2,3}-\d{7,8}$/ 6 puts pattern =~ "010-82809999"　 # 0 7 puts pattern =~ "00010-82809999" # nil 8　9 #匹配手机号码10 # 1开头，第二位为3、5、8，11位数字11 pattern = /^1[3,5,8]\d{9}$/12 puts pattern =~ "15810990001"　#013 14 #身份证号码15 pattern = /\d{18}|d{15}/16 17 #匹配ip18 #四组不大于255的整数组成，中间用'.'分隔19 puts "IP"20 num = /^\d|[01]?\d{1,2}|2[0-4]\d|25[0-5]/21 pattern = /^(#{num}\.){3}#{num}$/22 #一个整体：pattern =　 /^(^\d|[01]?\d{1,2}|2[0-4]\d|25[0-5]\.){3}^\d|[01]?\d{1,2}|2[0-4]\d|25[0-5]$/23 puts pattern =~ "127.0.0.1"　　# 024 puts pattern =~ "254.255.255.255"25 26 #匹配电子邮箱27 pattern = /^\w+@\w+.\w+$/　　　　 #这个没有 ‘-’28 pattern = /^[\w-]+@[\w-]+.[\w-]+$/29 puts pattern =~ "abc@Gmail.com"　#030 31 # 匹配url32 # http://www.google.cn33 pattern = /(http|https|ftp):(\/\/|\\\\)((\w)+[.]){1,}(net|com|cn|org|cc|tv|[0-9]{1,3})(((\/[\~]*|\\[\~]*)34 (\w)+)|[.](\w)+)*(((([?](\w)+){1}[=]*))*((\w)+){1}([\&](\w)+[\=](\w)+)*)*/35 36 puts pattern =~ "http://www.google.cn?uid=123"　#0

其它

贪婪的意义
1 puts "贪婪的" 2 #贪婪的，就是匹配尽可能长的字符串 3 # '.' 含义：除换行符外的字符 4 str = "where the sea meets the moon-blanch'd land" 5 puts str 6 match = /.*the/.match(str) 7 puts match[0]　#　where the sea meets the，*是贪婪的。如果不想贪婪就在其后加+ '?' 8 #*?非贪婪 9 match = /.*?the/.match(str)10 puts match[0]　# where the11 12 str.insert(0,"Hello \n")13 match = /.*?the/.match(str)14 puts match[0]　 #where the

正负预查
1 #正负预查 2 puts "正负预查" 3 s1 = "New World Dictionary" 4 s2 = "New World Symphony" 5 s3 = "New World Order" 6　7 reg = /New World (?=Dictionary|Symphony)/ 8 m1 = reg.match(s1) 9 puts m1.to_a[0]　　　# "New World"10 m2 = reg.match(s2)11 puts m2.to_a[0]　　 # "New World"12 puts reg.match(s3)　# nil13 14 puts "负预查"15 16 reg = /New World (?!Symphony)/　# "New World "后面没有“Symphony”17 puts reg.match(s1).to_a[0]　　 # "New World"18 puts reg.match(s2).to_a[0]　　 # nil19 puts reg.match(s3).to_a[0]　　 # "New World"