简介
在一些实际项目中,我们可能会遇到需要匹配对应的数据,例如爬虫时候需要匹配等,这时候就需要使用到正则表达式了
正则匹配常用规则
- 固定字符
- {abc} a/b/c
- [^abc] 取所有不是a、b、c中的内容
- [a-z]: 获取字母元素
- .[0-9]: 获取纯数字
- . 除换行符的所有字符
贪婪匹配:尽可能匹配长度较长的
非贪婪匹配:一般在* + 后面添加?
-
+:匹配一次或多次
-
\w: 字母数字下划线汉字
-
\d: 数字
-
*: 重复0次或多次
-
+:重复1次或者多次
-
? 重复0次或者1次
-
{n}:重复n次
-
{n, }: 重复n次或者大于n次
-
{n, m}: 重复n-m次
分组(括号)
提取括号中的部分值
单个括号
提取括号中的部分值
多个括号
列表中嵌套元组形式返回
括号中嵌套括号
将会把括号中的值一一匹配到列表中的对应元组中去
- ^ :起始
- $:末尾
对于特殊符号(*,. {}, (), +)可以进行转义
re.ASCII: 只会匹配字母数字下划线,没有中文
正则:命名分组(正则)L:(?P<名称>正则)
findall
finditer
正则取反:^((?!你的规则).)*
跨行匹配
在匹配时添加标识符re.S
或者re.DOTALL
使其匹配换行符,例如:
re.match(pattern, content, re.S)
注意事项
- 当需要匹配字符或时,需要注意的时需要添加括号将其括起来,有两种方式,一个是
()
,还有一种是[]
,()
代表匹配整个单词,[]
代表匹配单个字符,例如^[test|sad](.*?)\n
上述匹配的是以t字符或者s字符开头的字符串
^(test|sad)(.*?)\n
上述匹配的是以test单词或者sad单词开头的字符串
原文地址:http://www.cnblogs.com/xy-bot/p/16573002.html
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,请务用于商业用途!
3. 如果你也有好源码或者教程,可以到用户中心发布,分享有积分奖励和额外收入!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如遇到加密压缩包,默认解压密码为"gltf",如遇到无法解压的请联系管理员!
8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载
声明:如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性