1、compile():
-
编译正则表达式模式,返回一个
正则对象
的模式。(可以把那些常用的正则表达式编译成正则表达式对象,这样可以提高一点效率。) -
格式:
re.compile(pattern[,flags=0])
-
pattern
: 编译时用的表达式字符串。 -
flags
: 编译标志位,用于修改正则表达式的匹配方式,如:re.I(不区分大小写)、re.S等
-
import re
tt = "Tina is a good girl, she is cool, clever, and so on..."
rr = re.compile(r'\w*oo\w*')
print(rr.findall(tt)) #查找所有包含'oo'的单词
# 执行结果如下:
# ['good', 'cool']
2、match()
- 决定RE是否在字符串刚开始的位置匹配。
- //注:这个方法并不是完全匹配。当pattern结束时若string还有剩余字符,仍然视为成功。
-
格式:
re.match(pattern, string[, flags=0])
print(re.match('com','comwww.csdn').group())
print(re.match('com','Comwww.csdn',re.I).group())
#执行结果如下:
#com
#com
3、search()
-
格式:
re.search(pattern, string[, flags=0])
- re.search函数会在字符串内查找模式匹配,只要找到第一个匹配然后返回,如果字符串没有匹配,则返回None。
print(re.search('\dcom','www.4comcsdn.5com').group())
执行结果如下:
# 4com
-
注:match和search一旦匹配成功,就是一个match object对象,而match object对象有以下方法:
- group() 返回被 RE 匹配的字符串
- start() 返回匹配开始的位置
- end() 返回匹配结束的位置
- span() 返回一个元组包含匹配 (开始,结束) 的位置
import re
a = "123abc456"
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0)) #123abc456,返回整体
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(1)) #123
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(2)) #abc
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(3)) #456
###group(1) 列出第一个括号匹配部分,group(2) 列出第二个括号匹配部分,group(3) 列出第三个括号匹配部分。###
4、findall()
- re.findall遍历匹配,可以获取字符串中所有匹配的字符串,返回一个列表。
-
格式:
re.findall(pattern, string[, flags=0])
p = re.compile(r'\d+')
print(p.findall('o1n2m3k4'))
执行结果如下:
['1', '2', '3', '4']
import re
tt = "Tina is a good girl, she is cool, clever, and so on..."
rr = re.compile(r'\w*oo\w*')
print(rr.findall(tt))
print(re.findall(r'(\w)*oo(\w)',tt))#()表示子表达式
执行结果如下:
['good', 'cool']
[('g', 'd'), ('c', 'l')]
5、split()
- 按照能够匹配的子串将string分割后返回列表。
- 可以使用re.split来分割字符串,如:re.split(r'\s+', text);将字符串按空格分割成一个单词列表。
-
格式:
re.split(pattern, string[, maxsplit])
-
maxsplit
: 用于指定最大分割次数,不指定将全部分割。
-
print(re.split('\d+','one1two2three3four4five5'))
# 执行结果如下:
# ['one', 'two', 'three', 'four', 'five', '']
6、sub()
- 使用re替换string中每一个匹配的子串后返回替换后的字符串。
-
格式:
re.sub(pattern, repl, string, count)
import re
text = "JGood is a handsome boy, he is cool, clever, and so on..."
print(re.sub(r'\s+', '-', text))
执行结果如下:
JGood-is-a-handsome-boy,-he-is-cool,-clever,-and-so-on...
其中第二个函数是替换后的字符串;本例中为'-'
第四个参数指替换个数。默认为0,表示每个匹配项都替换。
- re.sub还允许使用函数对匹配项的替换进行复杂的处理。
- 如:re.sub(r'\s', lambda m: '[' + m.group(0) + ']', text, 0);将字符串中的空格' '替换为'[ ]'。
import re
text = "JGood is a handsome boy, he is cool, clever, and so on..."
print(re.sub(r'\s+', lambda m:'['+m.group(0)+']', text,0))
执行结果如下:
JGood[ ]is[ ]a[ ]handsome[ ]boy,[ ]he[ ]is[ ]cool,[ ]clever,[ ]and[ ]so[ ]on...
审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
格式
+关注
关注
0文章
22浏览量
16807 -
字符串
+关注
关注
1文章
552浏览量
20126 -
python
+关注
关注
51文章
4675浏览量
83467
发布评论请先 登录
相关推荐
linux正则表达式匹配字符串
在Linux操作系统中,正则表达式是一种强大的模式匹配工具,它可以用于在文本中查找、替换和筛选特定的字符串。准确掌握正则表达式的语法和常见应用,对于Linux系统的管理员和开发人员来说
什么是正则表达式?正则表达式如何工作?哪些语法规则适用正则表达式?
正则表达式又称规则表达式(Regular Expression,在代码中常简写为 regex、regexp 或 RE),是一种用于匹配、查找、替换文本的强大工具。它能够以特定的模式匹配字符串,从而
Java Lambda表达式的新特性
Java Lambda表达式是Java 8中最重要的新特性之一。 它们是一种可传递的匿名函数,可以作为参数传递给方法或存储在变量中,因此可以在需要的时候调用它们。 基础 1. 简介 Lambda
zabbix触发器表达式 基本RS触发器表达式 rs触发器的逻辑表达式
zabbix触发器表达式 基本RS触发器表达式 rs触发器的逻辑表达式 Zabbix是一款开源的监控软件,它能通过监控指标来实时监测服务器和网络的运行状态,同时还能提供警报和报告等功能来帮助管理员
如何使用lambda表达式提升开发效率?
Java8 的一个大亮点是引入 Lambda 表达式,使用它设计的代码会更加简洁。当开发者在编写 Lambda 表达式时,也会随之被编译成一个函数式接口。
发表于 08-24 10:25
•172次阅读
Python中的正则表达式
字符串的特征,这样我们就可以快速、高效地处理大量的文本数据。 基础语法 在Python中,使用re模块来操作正则表达式。re模块提供了很多函数,用于对字符串进行正则匹配和替换。以下是一
shell脚本基础:正则表达式grep
在Linux上有许多命令可以使用正则表达式,其中最常见的是grep命令和sed命令。正则表达式有多种类型,每种类型中可以使用的元字符类型不同。最常见的是基本正则表达式和扩展正则表达式。
KiCad 7中添加网络类(一):通配符与正则表达式
类中的网络没有“通用”特征,那该怎么办呢?要么去修改原理图中网络的名称,要么就只能用土办法,挨个添加。如下图,因为没法批量匹配,只能一行行的网络添加到网络类。
灵活使用正则表达式,对于需要使用网络类
发表于 05-24 14:41
Linux入门之正则表达式
正则表达式是用来表达字符串匹配模式的方法,利用正则表达式,可以让我们轻易地实现对目标字符串的**查找**、**删除**、**替换**等操作。
正则表达式并不复杂,它并不包含难以理
评论