正则表达式常用字符整理

2017年9月21日18:17:11 发表评论 38
摘要

正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。正则表达式中可以使用 ASCII 编码。

这都不知道是第几次来看正则:arrow: ,看完没两天就给忘了。。。。。今天就把常用的列个清单方便以后查看。

  • .(点)-------->除 "\n" 之外的任何单个字符。 任何字符:[.\n]
  • \w-------->任意字类字符,包括下划线,不含中划线。等价于'[A-Za-z0-9_]'。
  • \W-------->非单词字符,\w的补集,等价于 '[^A-Za-z0-9_]'。
  • \d-------->一个数字字符。等价于 [0-9]。
  • \D-------->匹配一个非数字字符。等价于 [^0-9]。
  • \s-------->空白符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
  • \S-------->非空白符,等价于 [^ \f\n\r\t\v]
  • ^-------->匹配字符串的开始
  • $-------->匹配字符串的结尾
  • \b-------->匹配单词的开始和结尾(边界)
  • \B-------->匹配单词的非边界
  • +-------->匹配前面的子表达式一次或多次
  • *-------->匹配前面的子表达式零次或多次
  • ?-------->匹配前面的子表达式零次或一次
  • {n}-------->限定匹配的次数
  • {n,m}-------->限定匹配n-m次
  • .+-------->贪婪模式
  • .+?-------->非贪婪模式
  • \1-------->后向引用,部分语言(nginx)中是$1
  • \r-------->回车符,等价于 \x0d 和 \cM。
  • \n-------->换行符,等价于 \x0a 和 \cJ。
  • \t-------->制表符,等价于 \x09 和 \cI。
  • \f-------->匹配一个换页符。等价于 \x0c 和 \cL。
  • \t-------->匹配一个制表符。等价于 \x09 和 \cI。
  • \v-------->匹配一个垂直制表符。等价于 \x0b 和 \cK。
  • \\-------->“\”转义字符簇 ,代表 "\" 本身
  • ( )-------->标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。
  • [ ]-------->包含一系列字符,能够匹配其中任意一个字符。
  • [^ ]-------->包含一系列字符,则能够匹配其中字符之外的任意一个字符。
  • x|y-------->匹配 x 或 y。
  • (exp)-------->匹配exp,并捕获文本到自动命名的组里
  • (?<name>exp)-------->匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
  • (?:exp)-------->匹配exp,不捕获匹配的文本,也不给此分组分配组号
  • (?=exp)-------->匹配exp前面的位置
  • (?<=exp)-------->匹配exp后面的位置
  • (?!exp)-------->匹配后面跟的不是exp的位置
  • (?<!exp)-------->匹配前面不是exp的位置
  • (?#comment)-------->用于提供注释让人阅读
  • \cx-------->匹配由 x 指明的控制字符。
  • \xn-------->匹配 n,其中 n 为十六进制转义值。
  • \num-------->匹配 num,其中 num 是一个正整数。对所获取的匹配的引用。
  • \un-------->匹配 n,其中 n 是一个用四个十六进制数字表示的 Unicode 字符。
  • i-------->就代表正则不区分大小写, /[a-z A-Z ]+/ --->/[a-z ]+/i
  • s-------->单行模式, 就代表把整个文件看成一个"单行"
  • u-------->用这种模式来匹配中文,正则匹配中文只能用unicode编码
  • g-------->全局匹配,标志表示正则表达式使用的global(全局)的状态。
  • m-------->表示允许跨行。

正则表达式详细文件下载

  • 博主微信
  • 赶快加我来聊天吧
  • weinxin
  • 站长技术资源群
  • 群号:483950522
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: