0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

评价Python字符串相似度的六种度量方法

汽车玩家 来源:今日头条 作者:我爱学Python 2020-01-18 17:33 次阅读

字符串的相似性比较应用场合很多,像拼写纠错、文本去重、上下文相似性等。

评价字符串相似度最常见的办法就是:把一个字符串通过插入、删除或替换这样的编辑操作,变成另外一个字符串,所需要的最少编辑次数,这种就是编辑距离(edit distance)度量方法,也称为Levenshtein距离。海明距离是编辑距离的一种特殊情况,只计算等长情况下替换操作的编辑次数,只能应用于两个等长字符串间的距离度量。

其他常用的度量方法还有 Jaccard distance、J-W距离(Jaro–Winkler distance)、余弦相似性(cosine similarity)、欧氏距离(Euclidean distance)等。

python-Levenshtein 使用

使用 pip install python-Levenshtein 指令安装 Levenshtein

1. difflib

2. hamming距离,str1和str2长度必须一致,描述两个等长字串之间对应位置上不同字符的个数

3. 编辑距离,描述由一个字串转化成另一个字串最少的操作次数,在其中的操作包括 插入、删除、替换

4.计算莱文斯坦比

5.计算jaro距离

6. Jaro–Winkler距离

输出:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 字符串
    +关注

    关注

    1

    文章

    548

    浏览量

    20105
  • python
    +关注

    关注

    51

    文章

    4671

    浏览量

    83457
收藏 人收藏

    评论

    相关推荐

    USB字符串描述符里面的序列号字符串到底是什么东西?

    在设备描述符里面,有一个表示序列号字符串描述符的编号,请问这个序列号字符串的描述符是什么东西呢? 厂商字符串和设备字符串都能理解,而且在电脑的“设备与打印机”里面都找到了。但请问这个
    发表于 01-24 08:06

    oracle字符串split成多个

    Oracle是一种广泛使用的关系型数据库管理系统,它提供了许多强大的功能和函数,用于处理和操作数据。其中之一就是字符串分割(split)方法,该方法用于将一个字符串按照指定的分隔符分割
    的头像 发表于 12-06 09:54 1073次阅读

    c语言字符串定义

    C语言是一种强大而广泛使用的编程语言,字符串是其中一个非常重要的概念。在C语言中,字符串是由一系列字符组成的数组,它可以表示文本、数字等各种类型的数据。在本文中,我们将详尽、详实、细致地介绍C语言
    的头像 发表于 11-24 10:02 842次阅读

    python如何统计字符串中字母个数

    Python中统计字符串中字母个数的方法有多种,下面我会详细介绍一些常用的方法方法一:使用循环遍历
    的头像 发表于 11-23 16:29 5267次阅读

    python输出固定长度的字符串

    Python 是一种强大而灵活的编程语言,具有许多用于处理字符串的功能。在 Python 中,有多种方法可以输出固定长度的字符串。下面将详细
    的头像 发表于 11-22 10:41 1201次阅读

    python怎么把字符串变成数字

    计算中的值。在一些应用场景中,需要将字符串转换为数字,以便进行数值计算、条件判断或数据处理等操作。在本文中,我们将详细探讨Python字符串到数字的转换方法,并讨论其在实际应用中的常
    的头像 发表于 11-22 09:47 1456次阅读

    字符串如何转换成日期型

    同编程语言将字符串转换为日期类型。 正文: 一、Python中的字符串转日期转换 在Python中,使用datetime模块可以方便地将字符串
    的头像 发表于 11-17 16:27 5479次阅读

    mysql字符串包含某个字符串

    将详尽、详实、细致地探讨MySQL中字符串包含的实现方法。 在MySQL中,可以通过使用内建函数和通配符来实现字符串包含的操作。下面将详细介绍几种常用的方法: 使用LIKE通配符: L
    的头像 发表于 11-16 14:52 1091次阅读

    Python 小坑之字符串驻留

    本文整理了许多 字符串驻留 的坑,部分整合自wtfpython英文版,并增加了大量的后续说明。 # example1: >>> a = "wtf" >>> b = "wtf
    的头像 发表于 11-03 11:55 221次阅读

    Python 如何判断字符串是否包含子串

    方法 使用 字符串 对象的 find 方法,如果有找到子串,就可以返回指定子串在字符串中的出现位置,如果没有找到,就返回 -1 >> > "hello,
    的头像 发表于 11-02 10:55 250次阅读

    代码字符串分割方法

    的 String#split 来分割。 使用 String#split 方法 String 类中 split 方法,是我们平常处理字符串分割最常用的方法之一,它可以根据给定的分隔符或正
    的头像 发表于 09-25 11:42 420次阅读

    C++字符串string

    string是C++编程语言中的字符串。在C++中字符串处理可以使用c语言字符串形式char *,也可以使用string类格式。
    的头像 发表于 07-10 00:26 881次阅读
    C++<b class='flag-5'>字符串</b>string

    Python字符编码转换

    UNICODE字符串可以与任意字符编码的字节进行相互转换,如图: 那么大家很容易想到一个问题,就是不同的字符编码的字节可以通过Unicode相互转换吗?答案是肯定的。 Python2中
    的头像 发表于 07-05 16:25 824次阅读
    <b class='flag-5'>Python</b><b class='flag-5'>字符</b>编码转换

    Python2与Python3中对字符串的支持

    其实Python3中对字符串支持的改进,不仅仅是更改了默认编码,而是重新进行了字符串的实现,而且它已经实现了对UNICODE的内置支持,从这方面来讲Python已经和JAVA一样优秀。
    的头像 发表于 07-05 16:15 525次阅读

    Python中检查字符串包含的方法

    Python 有多种处理字符串方法。今天我们介绍如何检查一个字符串中是否包含另一个字符串
    的头像 发表于 05-14 16:02 1.4w次阅读