简介

在一些实际项目中,我们可能会遇到需要匹配对应的数据,例如爬虫时候需要匹配等,这时候就需要使用到正则表达式了

正则匹配常用规则

  • 固定字符
  • {abc} a/b/c
  • [^abc] 取所有不是a、b、c中的内容
  • [a-z]: 获取字母元素
  • .[0-9]: 获取纯数字
  • . 除换行符的所有字符

贪婪匹配:尽可能匹配长度较长的
非贪婪匹配:一般在* + 后面添加?

  • +:匹配一次或多次

  • \w: 字母数字下划线汉字

  • \d: 数字

  • *: 重复0次或多次

  • +:重复1次或者多次

  • ? 重复0次或者1次

  • {n}:重复n次

  • {n, }: 重复n次或者大于n次

  • {n, m}: 重复n-m次

分组(括号)

提取括号中的部分值

单个括号

提取括号中的部分值

多个括号

列表中嵌套元组形式返回

括号中嵌套括号

将会把括号中的值一一匹配到列表中的对应元组中去

  • ^ :起始
  • $:末尾

对于特殊符号(*,. {}, (), +)可以进行转义
re.ASCII: 只会匹配字母数字下划线,没有中文

正则:命名分组(正则)L:(?P<名称>正则)

findall
finditer

正则取反:^((?!你的规则).)*

跨行匹配

在匹配时添加标识符re.S或者re.DOTALL使其匹配换行符,例如:

re.match(pattern, content, re.S)

注意事项

  • 当需要匹配字符或时,需要注意的时需要添加括号将其括起来,有两种方式,一个是(),还有一种是[],()代表匹配整个单词,[]代表匹配单个字符,例如
    ^[test|sad](.*?)\n
    

    上述匹配的是以t字符或者s字符开头的字符串

    ^(test|sad)(.*?)\n
    

    上述匹配的是以test单词或者sad单词开头的字符串

原文地址:http://www.cnblogs.com/xy-bot/p/16573002.html

1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长! 2. 分享目的仅供大家学习和交流,请务用于商业用途! 3. 如果你也有好源码或者教程,可以到用户中心发布,分享有积分奖励和额外收入! 4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解! 5. 如有链接无法下载、失效或广告,请联系管理员处理! 6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需! 7. 如遇到加密压缩包,默认解压密码为"gltf",如遇到无法解压的请联系管理员! 8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载 声明:如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性