WEB开发网
开发学院WEB开发ASP 正则表达式——极速入门 阅读

正则表达式——极速入门

 2010-01-15 10:44:36 来源:WEB开发网   
核心提示:正则表达式:正则表达式可以让用户通过使用一系列的特殊字符构建匹配模式,然后把匹配模式与数据文件、程序输入以及WEB页面的表单输入等目标对象进行比较,正则表达式——极速入门,根据比较对象中是否包含匹配模式,执行相应的程序,中间用'.'分隔19 puts "IP"20 num = /^\
正则表达式:

正则表达式可以让用户通过使用一系列的特殊字符构建匹配模式,然后把匹配模式与数据文件、程序输入以及WEB页面的表单输入等目标对象进行比较,根据比较对象中是否包含匹配模式,执行相应的程序。正则以其简单、实用、快速深得广大编程人员的热爱。

编写正则一些思维:

1、首先,确定规则。你需要匹配一个什么样字符串,它有哪几部分构成,它有哪些特征。

2、提出最小单位。有的时候,一些匹配规则是重复的,我们可以试着找到共同点,规划为一条规则。

3、根据其规则、最小单位,逐一写出正则

4、将这些单位正则组合统一,构成你想要的完整正则。



在这里我们就需要了解一些基本的标记和用法,任何的规则都是用基本标记组合而成的。而正则的标记也很简单,大家不妨了解一下。



正则表达式中常用的标记



1 正则表达式中常用的标记 2 ^  |  行或字符串开头 3 $  |  行或字符串末尾 4 .  |  除换行符外的字符 5 \w  |  单词字符 (数字、字母或下划线) 6 \W  |  非单词字符 7 \d  |  数字(等同于【0-9】) 8 \D  |  非空白字符 9 10 \A  |  字符串开头11 \Z  |  字符串末尾或最后的换行符钱12 \z  |  字符串末尾13 14 \s  |  空白字符15 \S  |  非空白字符16 17 \b  |  单词边界(【】外)18 \B  |  非单词边界19 \b  |  退格(在【】内)20 []  |  集合中的任何一个字符,中间使用连字符,则表示范围,如:[0-9],[a-z]21 ?  |  0或1个之前的表达式22 |  |  或23 ( ) |  子表达式编组24 25 *  |  零或多个之前的表达式26 *?  |  零或多个之前的表达式(非贪婪)27 +  |  1个或多个之前的表达式28 +?  |  1个或多个之前的表达式(非贪婪)29 {m,n}|  m-n个之前的表达式30 {m,n}? | m-n个之前的表达式(非贪婪的)31 32 33 还有{?=} {?!} (?>) (?#) (?imx-imx)等


最基本的实例:

1 #匹配整个字符串 2 puts /ruby/ =~ "ruby"  # 0 3 puts /ruby/ =~ "Ruby"  # nil 4 5 #匹配行或字符串开头与结尾 6 str = "abcdef" 7 puts str 8 puts /^abc/ =~ str  # 0 9 puts /def$/ =~ str  # 310 11 str = "abc\ndef\n"12 puts /^abc/ =~ str  # 013 puts /def$/ =~ str  # 414 puts /abc/ =~ str  # 015 puts /def/ =~ str  # 416 17 #匹配字符串本身的开头和结尾18 str = "abc\ndef\n"19 puts /\Aabc/ =~ str  # 020 puts /def\Z/ =~ str  # 421 puts /def\z/ =~ str  # nil22 23 #匹配单词字符24 puts "匹配单词字符"25 pattern = /\w/26 puts pattern =~ "abc" # 027 puts pattern =~ "."  # nil28 29 #匹配整数30 # \d 数字31 # \D 非数字32 puts "匹配数字"33 puts /\d/ =~ "122"  #034 puts /\D/ =~ "122"  #nil35 puts /\D/ =~ "abc"  #036 37 38 #边界39 str = "This is your friend!"40 puts str41 puts str.gsub(/\b/,"|")  # |This| |is| |your| |friend|!42 puts str.gsub(/\B/,"-")  # T-h-i-s i-s y-o-u-r f-r-i-e-n-d!-43 


限定符实例



1 puts "限定符" 2 puts "限定符:*" 3 puts /(abc)*/ =~ "a"   # 0 4 puts /(abc)*/ =~ "abc"  # 0 5  6 7 puts "限定符:+" 8 puts /(abc)+/ =~ "a"   # nil 9 puts /(abc)+/ =~ "abc"  # 010 11 puts "限定符:?"12 puts /(abc)?/ =~ "c"   # 013 puts /(abc)?/ =~ "abc"  # 014 15 16 puts "限定符: {n}"17 puts /(abc){2}/ =~ "abc" # nil18 puts /(abc){2}/ =~ "abcabc" # 019 20 puts "限定符: {n,}"21 puts /(abc){2,}/ =~ "abc" # nil22 puts /(abc){2,}/ =~ "abcabc" # 023 24 puts "限定符: {n,m}"25 puts /(abc){2,3}/ =~ "abc" # nil26 puts /(abc){2,3}/ =~ "abcabcabc" # 027 28 puts "限定符: *?"29 puts /(abc)*?/ =~ "a"   # 030 puts /(abc)*?/ =~ "abcabc" # 031 32 puts "限定符: +?"33 puts /(abc)+?/ =~ "a"   # nil34 puts /(abc)+?/ =~ "abcabc" # 035 36 puts "限定符: ??"37 puts /(abc)??/ =~ "a"   # 038 puts /(abc)??/ =~ "abcabc" # 039 40 41 #匹配, {1} {3}42 # {3}能匹配,那{1}肯定能匹配,反过来不成立43 # 匹配范围:{1} > {3}


常用实例:



1 puts "例子" 2 #匹配电话号码: 3 #一般中国的电话号码为7-8位,区号3-4位整数,区号第一位是0,中间用分隔符‘-’ 4 #注意首尾限制符 5 pattern = /^0\d{2,3}-\d{7,8}$/ 6 puts pattern =~ "010-82809999"  # 0 7 puts pattern =~ "00010-82809999" # nil 8 9 #匹配手机号码10 # 1开头,第二位为3、5、8,11位数字11 pattern = /^1[3,5,8]\d{9}$/12 puts pattern =~ "15810990001" #013 14 #身份证号码15 pattern = /\d{18}|d{15}/16 17 #匹配ip18 #四组不大于255的整数组成,中间用'.'分隔19 puts "IP"20 num = /^\d|[01]?\d{1,2}|2[0-4]\d|25[0-5]/21 pattern = /^(#{num}\.){3}#{num}$/22 #一个整体:pattern =  /^(^\d|[01]?\d{1,2}|2[0-4]\d|25[0-5]\.){3}^\d|[01]?\d{1,2}|2[0-4]\d|25[0-5]$/23 puts pattern =~ "127.0.0.1"  # 024 puts pattern =~ "254.255.255.255"25 26 #匹配电子邮箱27 pattern = /^\w+@\w+.\w+$/     #这个没有 ‘-’28 pattern = /^[\w-]+@[\w-]+.[\w-]+$/29 puts pattern =~ "abc@Gmail.com" #030 31 # 匹配url32 # http://www.google.cn33 pattern = /(http|https|ftp):(\/\/|\\\\)((\w)+[.]){1,}(net|com|cn|org|cc|tv|[0-9]{1,3})(((\/[\~]*|\\[\~]*)34 (\w)+)|[.](\w)+)*(((([?](\w)+){1}[=]*))*((\w)+){1}([\&](\w)+[\=](\w)+)*)*/35 36 puts pattern =~ "http://www.google.cn?uid=123" #0


其它



贪婪的意义
1 puts "贪婪的" 2 #贪婪的,就是匹配尽可能长的字符串 3 # '.' 含义:除换行符外的字符 4 str = "where the sea meets the moon-blanch'd land" 5 puts str 6 match = /.*the/.match(str) 7 puts match[0] # where the sea meets the,*是贪婪的。如果不想贪婪就在其后加+ '?' 8 #*?非贪婪 9 match = /.*?the/.match(str)10 puts match[0] # where the11 12 str.insert(0,"Hello \n")13 match = /.*?the/.match(str)14 puts match[0]  #where the


正负预查
1 #正负预查 2 puts "正负预查" 3 s1 = "New World Dictionary" 4 s2 = "New World Symphony" 5 s3 = "New World Order" 6 7 reg = /New World (?=Dictionary|Symphony)/ 8 m1 = reg.match(s1) 9 puts m1.to_a[0]   # "New World"10 m2 = reg.match(s2)11 puts m2.to_a[0]   # "New World"12 puts reg.match(s3) # nil13 14 puts "负预查"15 16 reg = /New World (?!Symphony)/ # "New World "后面没有“Symphony”17 puts reg.match(s1).to_a[0]   # "New World"18 puts reg.match(s2).to_a[0]   # nil19 puts reg.match(s3).to_a[0]   # "New World"

Tags:正则 表达式 入门

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接