0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

两个跟中文相关的资源工具介绍

电子工程师 来源:未知 作者:李倩 2018-09-17 09:32 次阅读

【导读】平常为大家推荐的资源中,以英语语言占据大多数。今天 特别要为大家推荐两个跟中文相关的资源工具。先简单介绍下这两个资源工具都是什么。第一个,汉字转拼音的工具——即将中文字符转换成它的拼音。除了支持 JavaScript,还可以支持 Python、Go、Rust 等多种语言。可以说是非常 nice 的一个中文资源工具了。第二个是新华字典的 API,收录包括 14032 条歇后语,16142 个汉字,264434 个词语,31648 个成语。有需要的同学可以收藏留着用,觉得不错记得分享点赞。

汉字转拼音工具

▌功能

将中文字符转换为拼音。可用于汉字注音、排序、检索任务。

▌特性

根据词组智能匹配最正确的拼音。

支持多音字。

简单的繁体支持, 注音支持。

支持多种不同拼音/注音风格。

▌支持版本

1.Node.js/JavaScript 版

注:这个版本同时支持在 Node 和 Web 浏览器环境运行;

作者:hotoo;来源:GitHub

https://github.com/hotoo/pinyin

2.Python 版

作者:mozillazg;来源:GitHub

https://github.com/mozillazg/python-pinyin

3.Go 版

作者:mozillazg;来源:GitHub

https://github.com/mozillazg/go-pinyin

4.Rust 版

作者:mozillazg;来源:GitHub

https://github.com/mozillazg/rust-pinyin

▌一些注意事项

1.为什么没有 y, w, yu 几个声母?

1>>>frompypinyinimportStyle,pinyin2>>>pinyin('下雨天',style=Style.INITIALS)3[['x'],[''],['t']]

因为根据《汉语拼音方案》, y,w,ü (yu) 都不是声母。

声母风格(INITIALS)下,“雨”、“我”、“圆”等汉字返回空字符串,因为根据《汉语拼音方案》, y,w,ü (yu) 都不是声母,在某些特定韵母无声母时,才加上 y 或 w,而 ü 也有其特定规则。 —— @hotoo

如果你觉得这个给你带来了麻烦,那么也请小心一些无声母的汉字(如“啊”、“饿”、“按”、“昂”等)。 这时候你也许需要的是首字母风格(FIRST_LETTER)。 —— @hotoo

参考:

hotoo/pinyin#57,#22,#27,#44

如果觉得这个行为不是你想要的,就是想把 y 当成声母的话,可以指定strict=False, 这个可能会符合你的预期,详见strict 参数的影响

1>>>frompypinyinimportStyle,pinyin2>>>pinyin('下雨天',style=Style.INITIALS)3[['x'],[''],['t']]4>>>pinyin('下雨天',style=Style.INITIALS,strict=False)5[['x'],['y'],['t']]

2.拼音数据

单个汉字的拼音使用pinyin-data的数据

词组的拼音使用phrase-pinyin-data的数据

3.node 版和 web 版有什么异同?

pinyin目前可以同时运行在 Node 服务器端和 Web 浏览器端。 API 和使用方式完成一致。但 Web 版较 Node 版稍简单,拼音库只有常用字部分,没有使用分词算法, 并且考虑了网络传输对词库进行了压缩处理。

由于分词和繁体中文的特性,部分情况下的结果也不尽相同。由于这些区别,测试不同运行环境的用例也不尽相同。

更多详细安装与使用教程可访问 GitHub 链接进行访问~

各版本 GitHub 地址:

https://github.com/hotoo/pinyin

https://github.com/mozillazg/python-pinyin

https://github.com/mozillazg/go-pinyin

https://github.com/mozillazg/rust-pinyin

新华字典 API

▌介绍

作者本来的目的是想可以实现成语接龙,苦于没有现成可用的数据库,自己就从各个网站抓取整理了一份。所有的数据都作者从网上找的。放在 Github 是为了方便自己的使用,同时也能方便有类似需求的人不用去做这些 trival 的工作。所有抓取数据的脚本都在仓库里。

中华新华字典数据库和 API 。收录包括 14032 条歇后语,16142 个汉字,264434 个词语,31648 个成语。所有的数据放在 data/ 目录。

▌数据库与 API 介绍

1.成语(idiom.json)

2.词语(ci.json)

3.汉字(word.json)

4.歇后语(xiehouyu.json)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网络传输
    +关注

    关注

    0

    文章

    130

    浏览量

    17214
  • python
    +关注

    关注

    52

    文章

    4686

    浏览量

    83506

原文标题:汉语转拼音工具、新华字典API——两个支持Python的中文资源

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Nokia 5800拆机图解,中英版(中文版)

    描述:本文拆卸Nokia 5800使用了39步骤。开篇是分解总览图、软件升级工具介绍以及使用工具介绍,后篇则是详细的39
    发表于 03-26 12:37

    转:最新EDA工具相关厂商介绍(数字设计)

    本帖最后由 eehome 于 2013-1-5 09:47 编辑   前记:在很多电子网站上看到很多介绍IC或者FPGA设计工具系统的资料,但是感觉都不是很综合。所以这里尝试做一2012
    发表于 12-28 17:00

    两个常见的特定功能电路的分析

    这里有两个常见的功能电路大家分享一下,希望懂得朋友帮忙分析一下,这两个电路有什么功能?怎么分析的?谢谢了。
    发表于 11-06 17:00

    CC2530怎么同时使用;两个串口?

    CC2530怎么同时使用;两个串口?zigbee2007pro协议里面可以同时使用两个串口吗?急急急!新项目要求CC2530要与电脑通信,还要单片机通过串口通信,但是zigbee
    发表于 02-23 14:41

    控件中出现的中文如何变为英文?例如visa资源名称下拉里的刷新两个字,去掉也行。

    本帖最后由 jiutianshenjian 于 2017-7-20 15:52 编辑 visa资源名称下拉里的刷新两个字,去掉也行。不能显示中文,我labview2013中文版的
    发表于 07-20 15:24

    ML之MLiR:输入两个向量,得出两个向量之间的相关

    ML之MLiR:输入两个向量,得出两个向量之间的相关
    发表于 12-24 11:54

    串行写入和读取两个端口

    要求:NI-VISA驱动程序,两个串行设备操作步骤:1. 确保VISA资源(写入)和VISA资源(读取)中指定的资源为有效的串行设备。2. 在两个
    发表于 04-22 09:40

    有什么方法能够在lineoutheadphone两个输出通道实现不同信号的输出?

    我现在需要输出两个不同的信号,我一直用aic23的命令:while (!DSK6713_AIC23_write(hCodec, x[sample])) 来实现输出,不过lineout
    发表于 08-15 10:16

    最全面的PCB设计工具资源汇总

    主流的PCB设计工具Altium Designer:国内外最普及的PCB设计工具,设计资源丰富,社区完善,目前已经更新到了AD19,并提供一月的免费试用,目前仅提供Windows版本
    发表于 08-29 17:58

    单片机的两个问题

    单片机的两个问题1.图片这里写了三内存空间,都是啥意思呢?一般都是flash/ROM、RAM表示,这里没看懂2.EFR32BG22C22是带蓝牙收发器功能的SOC芯片哪个用过的?对比TI的CC2640 这颗物料有哪些优势?美国芯科Silicon Labs的芯片
    发表于 05-14 23:17

    实现一按键控制两个LED灯

    本文说明项目功能实现一按键控制两个LED灯在两个状态下的自由切换一状态是跑马灯,另一状态是双闪相关
    发表于 08-17 09:00

    中文安卓ide中文安卓单片机编程源码相关资料下载

    IDE源码(易语言源码,用中文开发app程序)中文单片机开发工具源码(易语言源码,支持51,arduino,esp8266,stm,内置上千例子源码,可直接使用官方所有
    发表于 02-28 06:35

    如何在OpenVINO trade工具包中推断两个图像?

    无法在OpenVINO™工具包中对两个输入图像运行推理。
    发表于 08-15 08:24

    哈尔滨站-贾宁:ADI技术支持资源及各类ADC工具应用介绍(2)

    专家面对面哈尔滨站-贾宁-ADI技术支持资源及ADC工具介绍(2)
    的头像 发表于 08-09 06:05 2361次阅读

    哈尔滨站-贾宁:ADI技术支持资源及各类ADC工具应用介绍(1)

    专家面对面哈尔滨-贾宁-ADI技术支持资源及ADC工具介绍(1)
    的头像 发表于 08-09 06:04 1838次阅读