0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

教您快速学习python程序设计中正则表达式的运用

NJ90_gh_bee81f8 来源:互联网 作者:佚名 2017-11-21 08:10 次阅读

(一)正则表达式:

通用的字符串表达框架;

简洁表达一组字符串的表达式;

针对字符串表达“简洁”和“特征”思想的工具;

判断某字符串的特征归属;

正则表达式在文本中的常见作用:

  1. 表达文本类型的特征(病毒);

  2. 同时查找或替换一组字符串;

  3. 匹配字符串的全部或部分;

正则表达式的使用:

编译:将符合正则表达式语法的字符串转换成正则表达式特征。

(二)正则表达式的语法

(三)正则常用的操作符

(四)正则表达式实例

(五)re库的主要功能函数

正则表达式的表示类型

(1)raw string类型(原生字符串类型)

re库采用raw string类型表示正则表达式,表示为r’text’

例如:大陆地区的邮政编码: r’[1-9]\d{5}’

国内的电话号码:r’\d{3}-\d{8}|\d{4}-\d{7}’

原生字符串类型是不包含转义符的字符串。

(2)string类型,更加繁琐

例如’[1-9]\\d{5}’

’\\d{3}-\\d{8}|\\d{4}-\\d{7}’

所以当正则表达式包含转义字符时,使用raw string

1、re.search(pattern,string,flags=0)

在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象。

pattern:正则表达式的字符串或原生字符串的表示;

string:带匹配字符串;

flags:正则表达式使用时的控制标记;

代码

2、re.match(pattern,string,flags=0)从一个字符串的开始位置起匹配正则表达式,返回match对象

3、re.findall(pattern,string,flags=0)

搜索字符串,以列表类型返回全部能匹配的子串。

4、re.split(pattern,string,maxsplit=0,flags=0)

将一个字符串按照正则表达式匹配结果进行分割,返回列表类型。

maxsplit:最大分割数,剩余部分作为最后一个元素输出。

5、re.finditer(pattern,string,flags=0)

搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象。

6、re.sub(pattern,repl,string,count=0,flags=0)

在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串。

Pattern:正则表达式的字符串或原生字符串表示;

Repl:替换匹配字符串的字符串;

String:待匹配的字符串;

Count:匹配的最大替换数;

(六)re库的另一种用法

(七)match对象

1、match对象的属性

2、match对象的方法

(八)re库的贪婪匹配和最小匹配

Re库默认采用贪婪匹配,即输出匹配最长的字符串。

1、最小匹配操作符

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 字符串
    +关注

    关注

    1

    文章

    546

    浏览量

    20102
  • python
    +关注

    关注

    51

    文章

    4667

    浏览量

    83441
  • 正则表达式
    +关注

    关注

    0

    文章

    25

    浏览量

    3432

原文标题:Python爬虫学习笔记——正则表达式

文章出处:【微信号:gh_bee81f890fc1,微信公众号:面包板社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    shell正则表达式学习

    程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式在检索或替换上远比之前用到的通配符要强大的多,用在批处理上绝对好用,比
    发表于 07-25 17:18

    正则表达式运用解析

    正则表达式运用
    发表于 09-11 08:59

    初识 Python 正则表达式

    正则表达式是一个特殊的字符序列,用于判断一个字符串是否与我们所设定的字符序列是否匹配,也就是说检查一个字符串是否与某种模式匹配。Python 自 1.5 版本起增加了re 模块,它提供 Perl
    发表于 03-17 16:44

    精通正则表达式

    详细的快速正则表达式的查询电子书,简单而丰富
    发表于 05-16 18:04 5次下载

    正则表达式应用一例

    易语言是一门以中文作为程序代码编程语言学习例程:正则表达式应用一例
    发表于 06-07 10:41 3次下载

    正则表达式学习心得

    正则表达式学习心得
    发表于 10-30 08:41 8次下载
    <b class='flag-5'>正则表达式</b><b class='flag-5'>学习</b>心得

    快速入门IPv6和正则表达式

    对于日常开发中只接触IPv4,并没有深入研究过正则表达式的开发者,面对IPv6和正则表达式,容易产生畏惧心理,觉得是两座难以翻越的大山。本文通过一些表格整理对IPv6的表示方法,以及正则表达式的特殊符号进行了分类和说明,带领大家
    的头像 发表于 03-30 09:31 8433次阅读
    <b class='flag-5'>快速</b>入门IPv6和<b class='flag-5'>正则表达式</b>

    Python正则表达式教程之标准库的完整介绍及使用示例说明

    本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写
    发表于 01-23 16:00 3次下载
    <b class='flag-5'>Python</b><b class='flag-5'>正则表达式</b>教程之标准库的完整介绍及使用示例说明

    Python正则表达式学习指南

    本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写
    发表于 09-15 08:00 0次下载
    <b class='flag-5'>Python</b><b class='flag-5'>正则表达式</b>的<b class='flag-5'>学习</b>指南

    Python正则表达式指南

    本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写
    发表于 03-26 09:13 10次下载
    <b class='flag-5'>Python</b><b class='flag-5'>正则表达式</b>指南

    初识 Python 正则表达式

    正则表达式是一个特殊的字符序列,用于判断一个字符串是否与我们所设定的字符序列是否匹配,也就是说检查一个字符串是否与某种模式匹配。 Python 自 1.5 版本起增加了re 模块,它提供 Perl
    的头像 发表于 03-17 16:44 1206次阅读

    python正则表达式中的常用函数

    编译正则表达式模式,返回一个正则对象的模式。(可以把那些常用的正则表达式编译成正则表达式对象,这样可以提高一点效率。)
    的头像 发表于 03-18 16:12 1550次阅读

    Linux入门之正则表达式

    正则表达式是用来表达字符串匹配模式的方法,利用正则表达式,可以让我们轻易地实现对目标字符串的**查找**、**删除**、**替换**等操作。 正则表达式并不复杂,它并不包含难以理
    的头像 发表于 05-12 15:31 561次阅读
    Linux入门之<b class='flag-5'>正则表达式</b>

    Python中的正则表达式

    字符串的特征,这样我们就可以快速、高效地处理大量的文本数据。 基础语法 在Python中,使用re模块来操作正则表达式。re模块提供了很多函数,用于对字符串进行正则匹配和替换。以下是一
    的头像 发表于 06-21 16:52 704次阅读

    linux正则表达式匹配字符串

    是非常重要的。本文将详细介绍Linux正则表达式的基本语法和常见用法,帮助读者深入了解并灵活运用正则表达式。 第一部分:正则表达式的基本语法 元字符的使用 在
    的头像 发表于 11-23 10:26 321次阅读