0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Python强大的模式匹配工具—Pampy的使用

python爬虫知识分享 来源:python爬虫知识分享 作者:python爬虫知识分享 2022-06-17 16:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在自然语言处理界,模式匹配可以说是最常用的技术。甚至可以说,将NLP技术作为真实生产力的项目都少不了模式匹配

什么是模式匹配呢?在计算机科学中,往往是检查给定的序列或字符串中是否有符合某种模式的片段。比如说:“啊,你的AK-47打得真准”,如果我们将 “啊,你的_____打得真准 ” 作为一种模式,则会将AK-47匹配出来。

实现模式匹配往往都是用正则表达式,但是如果你想识别特别复杂的模式,编写正则表达式就会变得非常非常麻烦。而Pampy这个项目能解决你不少的烦恼。https://github.com/santinic/pampy

下面是一个使用例子:

from pampy import match, _
input = [1, 2, 3]
pattern = [1, 2, _]
action = lambda x: "it's {}".format(x)
match(input, pattern, action)

1.准备

开始之前,你要确保Pythonpip已经成功安装在电脑上。

如果你用Python的目的是数据分析,可以直接安装Anaconda, 它内置了Python和pip.

请选择以下任一种方式输入命令安装依赖
1. Windows 环境 打开 Cmd (开始-运行-CMD)。
2. MacOS 环境 打开 Terminal (command+空格输入Terminal)。
3. 如果你用的是 VSCode编辑器 或 Pycharm,可以直接使用界面下方的Terminal.

pip installpampy

看到 Successfully installed pampy-0.3.0 则说明安装成功。

2.使用

特性1:HEAD 和 TAIL

HEAD和TAIL能代表某个模式的前面部分或后面部分。

比如将特定模式后的元素都变成元组:

frompampy importmatch, HEAD, TAIL, _
x = [-1, -2, -3, 0, 1, 2, 3]
print(match(x, [-1, TAIL], lambdat: [-1, tuple(t)]))
# => [-1, (-2, -3, 0, 1, 2, 3)]

将特定模式前的元素设为集合,后面的元素设为元组:

frompampy importmatch, HEAD, TAIL, _
x = [-1, -2, -3, 0, 1, 2, 3]
print(match(x, [HEAD, _, _, 0, TAIL], lambdah, a, b, t: (set([h, a, b]), tuple(t))))
# => ({-3, -1, -2}, (1, 2, 3))

特性2:甚至能匹配字典中的键

在你不知道哪个键下有某个值的时候,这招非常好用:

frompampy importmatch, HEAD, TAIL, _
my_dict = {
'global_setting': [1, 3, 3],
'user_setting': {
'face': ['beautiful', 'ugly'],
'mind': ['smart', 'stupid']
}
}
result = match(my_dict, { _: {'face': _}}, lambdakey, son_value: (key, son_value))
print(result)
# => ('user_setting', ['beautiful', 'ugly'])

特性3: 搭配正则

不仅如此,它还能搭配正则一起使用哦:

importrefrompampy importmatch, HEAD, TAIL, _
defwhat_is(pet):
    returnmatch(
    pet, re.compile('(\w+),(\w)\w+鳕鱼$'), lambdamygod, you: you + "像鳕鱼"
    )
print(what_is('我的天,你长得真像鳕鱼'))
# => '你像鳕鱼'

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • python
    +关注

    关注

    57

    文章

    4858

    浏览量

    89590
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Termux中调试圣诞树Python代码

    调试代码(逐行执行) 用Python交互模式: 输入python回车,进入>>>交互界面; 逐行输入代码,比如: >>>
    发表于 12-09 09:02

    termux调试python猜数字游戏

    用termux做一个猜数字游戏 下面是在Termux中创建猜数字游戏的步骤及完整实现方案,结合Python实现(最适配Termux环境): ? 一、环境准备(Termux基础配置) 1.
    发表于 08-29 17:15

    termux如何搭建python游戏

    安装Python及包管理工具 ```bash apt install -y python python-pip# 自动安装Python3
    发表于 08-29 07:06

    低功耗测量工具案例:使用 Nordic nRF9151-DK 开发板测量LTE不同节能模式

    如何为IoT选择节能模式? PSM和eDRX分别适合的应用场景是什么?本文使用Python脚本测试不同的LTE节能模式
    的头像 发表于 08-06 09:01 590次阅读
    低功耗测量<b class='flag-5'>工具</b>案例:使用 Nordic nRF9151-DK 开发板测量LTE不同节能<b class='flag-5'>模式</b>

    双工不匹配如何修复它

    ,确保所有相关设备的双工模式一致,例如都设置为全双工或半双工。 启用自动协商功能:推荐在所有端口启用自协商功能,以便设备能够自动匹配最佳的双工模式和速度。现代设备通常支持智能匹配,可以
    的头像 发表于 07-02 09:46 412次阅读

    基于LockAI视觉识别模块:C++模板匹配

    模板匹配是一种在图像中寻找特定模式的技术。它通过滑动一个模板图像(较小的图像)在输入图像上进行比较,找到最相似的区域。本实验提供了一个简单的模板匹配案例,并将其封装为一个自定义函数performTemplateMatching,
    的头像 发表于 05-13 14:14 550次阅读
    基于LockAI视觉识别模块:C++模板<b class='flag-5'>匹配</b>

    python入门圣经-高清电子书(建议下载)

    和Pygal 等强大Python 库和工具介绍,以及列表、字典、if 语句、类、文件与异常、代码测试等内容; 第二部分将理论付诸实践,讲解如何开发三个项目,包括简单的Python
    发表于 04-10 16:53

    如何确保模拟示波器的输入阻抗匹配

    输入阻抗匹配是确保信号完整性和测量精度的关键。模拟示波器通常提供 1 MΩ ± x%(高阻)和 50 Ω 两种输入阻抗模式,需根据被测信号特性选择匹配模式。以下是确保
    发表于 04-08 15:25

    ​如何在虚拟环境中使用 Python,提升你的开发体验~

    。RaspberryPiOS预装了Python3。干扰系统Python的安装可能会给你的操作系统带来问题。安装第三方Python库时,请务必使用正确的包管理工具。在Lin
    的头像 发表于 03-25 09:34 631次阅读
    ​如何在虚拟环境中使用 <b class='flag-5'>Python</b>,提升你的开发体验~

    零基础入门:如何在树莓派上编写和运行Python程序?

    在这篇文章中,我将为你简要介绍Python程序是什么、Python程序可以用来做什么,以及如何在RaspberryPi上编写和运行一个简单的Python程序。什么是Python程序?
    的头像 发表于 03-25 09:27 1531次阅读
    零基础入门:如何在树莓派上编写和运行<b class='flag-5'>Python</b>程序?

    OSS Nokalva:适用于Python的OSS NAS工具

    执行以下任务:编写软件来创建、处理、调试和测试 NAS 消息。在处理 3GPP 版本中的更改时,此任务特别耗时且容易出错。现在客户可以专注于他们的核心业务。 用于 Python 的 OSS NAS 工具
    的头像 发表于 02-09 09:16 779次阅读
    OSS Nokalva:适用于<b class='flag-5'>Python</b>的OSS NAS<b class='flag-5'>工具</b>

    Python绘图Matplotlib快速参考手册

     PYTHON
    发表于 02-07 14:04 0次下载

    SPC200强大的音频工具

    )配置,具有独特的串行和并行路由组合,不同于任何动态处理器。将这种路由能力与模拟任何其他压缩器的能力相结合,很明显SPC2000是一个强大的音频工具。 软拐点 压缩 “拖尾” 的过冲范围。 模拟建模 SPC2000插件可以模拟各种老式和现代压缩器的实现方式——包括串行和并
    的头像 发表于 02-07 11:31 755次阅读
    SPC200<b class='flag-5'>强大</b>的音频<b class='flag-5'>工具</b>

    使用Python实现xgboost教程

    使用Python实现XGBoost模型通常涉及以下几个步骤:数据准备、模型训练、模型评估和模型预测。以下是一个详细的教程,指导你如何在Python中使用XGBoost。 1. 安装XGBoost
    的头像 发表于 01-19 11:21 2229次阅读

    AWK工具介绍

    的意思 如何学awk awk的语法格式 awk 指令是由模式,动作,或者模式和动作的组合组成. 模式即 pattern,可以类似理解成 sed 的模式
    的头像 发表于 12-17 11:21 943次阅读
    AWK<b class='flag-5'>工具</b>介绍