PYTHON RE模块 正则表达式的使用

     分类: Python,编程开发 发布时间: 2018-08-23 10:48 1,202人浏览
import re #引用RE模块

1.
概述:
正则表达式可以匹配与表达式相同的内容,如’ABC’可以在”ABCDE”中匹配到’ABC’.
亦可以使用匹配符号用于匹配一些不固定的内容。

2.
使用方法:

pattern = re.compile('这里是正则表达式')
result = pattern.findall(text) #用pattern的表达式在text文档中查找结果,返回result

3.
常用符号:

       用于转义
*       匹配前面的子表达式任意次
+       匹配前面的子表达式至少一次
{n}     匹配前面的子表达式确定的n次,也可以用{n,m}限定范围n~m
?      匹配为非贪婪模式
.       匹配任意单个字符
[a-z]   匹配任意小写字母,同理也用于匹配大写字母、数字等
[abc]   只匹配a,b,c单个字母
()     将括号中间匹配的字符串保存到一个临时区域,定义为一组,可用 \1 到\9 的符号来引用

4.
一些固定搭配:

.*?     .和*代表可以匹配任意无限多个字符,加上?表示使用非贪婪模式进行匹配,也就是会尽可能短地做匹配
(.*?)   代表一个分组

5.
一点进阶:
re.s参数可以将.匹配的作用扩展到整个字符串,即包括\n
点击查看详情
使用时将re.s写于表达式之后即可


上一篇文章:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注