0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英文胜在口语,中文胜在书面语,谁能成为AI的母语?

如意 来源:今日头条 作者:猴军集 2020-10-19 14:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能是当前很热门的技术,各国都在投入资金和人力进行研究。谁错过了人工智能,谁就丢掉了未来。

语言文字在人工智能中占有非常重要的地位,它是人和人工智能交互的工具,人工智能只有准确理解语言文字才能做出准确应对,才能表现出高智商。今天就谈谈中文和英文是不是优秀的人工智能语言,以及未来前景。

一、语音识别

虽然我不想承认,但英文语音识别确实比中文更准确、高效。

英文由26个字母构成,逻辑结构更简单,发音以字母为基础,音标和音标区之间区分比较明显,只要说的不是很快,AI能比较容易、准确识别每一个字母,加上同音单词比较少,所以英文的语音识别效率领先中文许多。

中文发音则要复杂的多。汉语拼音有23个声母,6个单韵母,18个复韵母,还有16个整体认读音节,整套方案共63个发音元素。除此之外,汉语还有四种音调,加上种类繁多的方言,发音不准的话,非常影响AI识别。

AI在进行中文识别的时候,需要先进行发音识别,再根据单词进行汉字判断,识别效率低于英文,识别错误率也高于英文。

语音识别,英文胜。

二、文字识别

到文字识别环节,我们终于可以扬眉吐气了,中文文字识别的效率和准确度比英文更胜一筹。

中文有几个特点,让AI识别更高效:

1、汉字信息密度高,更少的字数可以承载更多的信息,中文文章永远比英文短,综合来看,中文信息密度比英文高37.5%。

2、中文以汉字为单位,可以灵活排列,横竖都可以,而英文是线性文字,只能横排,竖排、错乱排列的识别效率会骤降!

3、汉字独立表意能力强。比如“他去吃早饭”,你看一个字就能多明白一个字的意思。而英文“He went to have breakfast”,你即使看到“have”这个词,你依然不明大概的意思,只有到“breakfast”你才知道原来have是吃,went to是去,整句是去吃早饭。英文表意比较依赖“短语”,甚至整句,不看完整句话,你往往不能知道句意。这就给AI识别造成了难度,因为AI跳跃识别能力较差。

文字识别,中文胜。

三、同音字词

中文发展人工智能比较大的障碍就是同音字词现象!比如,他姓zhang,到底是“张”还是“章”呢?如果是口语的话,还要补一句弓长张,或立早章。中文里有多少同音字、同音词,很难准确的统计。同音字词也是英语使用者攻击中文表意不清比较大的借口。

英语虽然也有同音字,如right正确的、write写字;meet遇见、meat 肉;hole 洞穴、whole 全部的;pear梨子、pair双;flower花、flour面粉等,但英语同音字词数量远比中文同音词数量少。英语是通过造更多单词的方法,来减少同音词现象的。

AI现在不能准确处理多音字,出错在所难免。难道为了AI准确,人类只能通过语言文字改革消灭多音字词?这工程也太大了,人类也很难适应这么大的改革!

同音字词,英文胜。

四、多义字词

一词多义,是每种成熟语言都难免的,世间万事万物这么多,情感这复杂,如果每个词汇只表达一个准确的意思,那几百万字词都收不住。无论是中文还是英文,一个字词不会只表达一个意思,通常有很多意思,有时候区别还很大!

比如“close”,其意思非常多:关闭、合拢、合上、不开放、(使)关门、关闭(一段时间)、结束、终结、接近、几乎(处于某种状态)、可能(快要做某事)、亲密的、密切的、接近、靠近、不远地、死胡同、断头路、大教堂所属的周围场地及建筑物等。

现在人工智通过上下文识别词义的能力还比较弱,遇到多义词的时候经常出错,这也是人工智能发展的难关。

多义字词,中文和英文彼此彼此。

五、整段识别

让人工智能翻译一个短句,一句话,其实没多大意义,实用价值也不高,只有具备整段文字识别,才有实用价值。让我们以中英文互译来考察AI对中文和英文的识别能力了!

原文如下:

“Things that trend in these two countries are insanely different. For example: knowledge-basedcontent is extremely popular in China, and less so in the U.S. Also, this was wild to me: thosecreators that did the most dance videos in China are users born in the 60s (!!), whereas in theUS, it seems that it‘s mostly teenagers who are creating the dances,” she wrote.

她写道:“这两个国家的趋势截然不同,比如:知识性内容在中国很流行,但在美国稍差一些。而且,这一点对我来说很疯狂:中国最喜欢拍舞蹈视频的是60后(!!),但在美国,好像是年轻人最喜欢拍舞蹈视频。”

AI将“英文原文”翻译成中文如下:

“这两个国家的趋势截然不同。例如:以知识为基础的内容在中国非常受欢迎,而在美国却很少。此外,这对我来说很疯狂:在中国制作舞蹈视频最多的创作者是 她出生于60年代(!!)的用户,而在美国,似乎是大多数年轻人在创作舞蹈。”她写道。

有一句失真比较严重:“在中国制作舞蹈视频最多的创作者是 她出生于60年代(!!)的用户。”

这句话的英文原文是: “those creators that did the most dance videos in China are users born in the 60s ”。这是一句英语长句,词序比较复杂,又夹杂了乱七八糟的介词,导致人工智能的大脑错乱,没能准确识别!

这个英文识别错误很有典型性,暴露了英文在语法上、词序上太过复杂的弊端。如果是翻译更复杂的英语长句,AI将束手无策!这也是每个表音文字的弱点!

AI将“中文原文”翻译成英文如下:

“The trends in these two countries are quite different. For example, intellectual content is very popular in China, but a bit worse in the United States. Moreover, this is crazy to me: China’s favorite dance video is born in the 60s (! !), but in the United States, it seems that young people like to shoot dance videos the most,” she wrote.

中文翻译非常精准,和原文在表意上几乎没有任何差别,如实还原了原文的意思!可见,在整段话、整篇文章的识别上,中文比英文更有优势!

中文是由一个个汉字构成,长句很少,语法简单,词序简单,在语句结构上比线性的英语简单的多,更有利于AI识别。

六、谁才是人工智能的未来?

在人工智能领域,英文胜在口语,中文胜在书面语,各有所长,谁能成为AI的母语还言之过早。但在比较复杂的内容表达上,AI对中文的识别领先英文,所以我更看好中文的未来。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38303

    浏览量

    297391
  • 语音识别
    +关注

    关注

    39

    文章

    1804

    浏览量

    115615
  • 语言
    +关注

    关注

    1

    文章

    97

    浏览量

    24767
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    从直接接入到互感器配合:三相电能表最大功率分级与场景适配解析

    直接接入式胜在便捷经济,外接 CT 式赢在量程灵活,VT+CT 组合式强在高压大功率适配。
    的头像 发表于 12-11 11:36 545次阅读
    从直接接入到互感器配合:三相电能表最大功率分级与场景适配解析

    稀土为何能成为中国反制的关键筹码?#国产芯片

    行业资讯
    芯广场
    发布于 :2025年11月25日 17:00:01

    kconfig里写的英文,setting里面显示的是中文,这是什么原因导致的?

    最近在学习artpi2,发现图片显示的这里 这里用的是英文,但是setting这里是中文 gpio的setting上也有类似的现象,请问这是什么原因导致的
    发表于 09-22 06:10

    AIDC如何成为AI发展的关键一棒?

    AI
    脑极体
    发布于 :2025年09月21日 12:21:23

    IBM研究报告:体育粉丝对AI助力的动态数字内容的需求增长

    IBM(纽约证券交易所代码:IBM)委托开展的一项新的全球研究显示,体育爱好者正转向更具互动性的数字内容体验,其中AI、个性化服务及实时功能成为他们参与体育活动的核心要素。
    的头像 发表于 08-26 17:33 546次阅读

    芯海科技董事长卢国建:破解健康测量难题,芯海构建芯片+AI诊断新方案

    近日,在上海举办的人工智能大会上,AI赋能智慧医疗,为健康赋能成为行业关注的焦点。如何应对慢病预防,肥胖诊断这一挑战?芯海科技董事长卢国建表示:“场景驱动创新,但创新需要什么,需要芯片和算法给予赋能,我们通过垂直的AI技术,能够
    的头像 发表于 08-15 11:03 9323次阅读
    芯海科技董事长卢国建:破解健康测量难题,芯海构建芯片+<b class='flag-5'>AI</b>诊断新方案

    腾视科技TS-SG-SM7系列AI算力模组:32TOPS算力引擎,开启边缘智能新纪元

    从城市管理到工业生产,从物流运输到消费终端,TS-SG-SM7系列AI算力模组以 “超强算力、超低功耗、灵活扩展” 的特性,成为边缘智能落地的关键支点。腾视科技正通过持续的技术创新,推动AI算力从云端下沉至场景一线,让每一个边缘
    的头像 发表于 07-07 16:44 1538次阅读
    腾视科技TS-SG-SM7系列<b class='flag-5'>AI</b>算力模组:32TOPS算力引擎,开启边缘智能新纪元

    AI时代研华如何领跑智慧医疗长赛道

    AI时代,如何让影像诊断更快速、手术操作更精准?面对多元化场景与高壁垒挑战,哪些技术路径能成为破局关键?近期,研华嵌入式物联网平台事业群资深业务总监肖健萍女士接受了数智锐角记者刘敏专访,分享了研华在智能医疗的规划,看研华如何领跑智慧医疗长赛道。
    的头像 发表于 05-14 16:10 1418次阅读

    小智AI语音助手调试成功,母亲节祝福演示来啦

    、OLED 屏幕、麦克风模块、喇叭驱动模块、小喇叭、以及电源连接线、面包板。 因为有面包板,所以搭建就非常的容易,不需要焊接电路板,就十分的方便,体验感也是很不错的。 整体体验感很不错的,这个套件也是非常的安逸,可以很容易的搭建小智AI助手,非常的有趣。 演示视频来啦,让小智写一段母亲节祝福
    发表于 05-12 22:02

    新生态 智未来「飞凌嵌入式2025嵌入式及边缘AI技术论坛」开启报名!

    在这个技术日新月异的时代,每一场思想的碰撞都可能成为推动行业前行的力量,每一次深度对话都可能迸发出改变时代的强光——2025年4月22日,飞凌嵌入式将在深圳举办“2025嵌入式及边缘AI技术论坛”,本次论坛以“新生态,智未来”为主题,旨在汇聚行业智慧,探讨嵌入式技术与边缘
    的头像 发表于 03-28 08:05 1039次阅读
    新生态 智未来「飞凌嵌入式2025嵌入式及边缘<b class='flag-5'>AI</b>技术论坛」开启报名!

    2.5D封装为何成为AI芯片的“宠儿”?

    2.5D封装领域,英特尔的EMIB和台积电的CoWoS是两大明星技术。众所周知,台积电的CoWoS产能紧缺严重制约了AI芯片的发展,这正是英特尔EMIB技术可以弥补的地方。本文我们将以英特尔EMIB为例,深入解析2.5D封装之所以能成为
    的头像 发表于 03-27 18:12 605次阅读
    2.5D封装为何<b class='flag-5'>成为</b><b class='flag-5'>AI</b>芯片的“宠儿”?

    中科创达受邀出席ICDT 2025 AI能成像与显示专题论坛

    近日,ICDT 2025—“AI能成像与显示专题论坛”在厦门佰翔会展中心成功召开。本次论坛聚焦AI技术在成像与显示领域的创新应用,汇聚了行业专家、企业领袖及技术精英,共同探索AI赋能
    的头像 发表于 03-27 10:51 1060次阅读

    中科视入选甲子光年《2025 中国AI Agent行业研究报告》

    告旨在挖掘AI智能体领域的创新典范与行业标杆,中科视坤川智能体应用平台的入选标志着其在AIAgent技术研发与商业化落地方面的综合实力获得高度认可。大模型点燃智
    的头像 发表于 03-13 16:24 938次阅读
    中科视<b class='flag-5'>语</b>入选甲子光年《2025 中国<b class='flag-5'>AI</b> Agent行业研究报告》

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    开发一个视频内容生成Agent。 访问AI平台官网 ,进行注册或登录。 在平台首页,了解语聚AI的功能和应用场景,特别是其支持的视频生成相关的AI模型和工具。 在
    发表于 03-05 19:52

    宝骏汽车灵智舱与DeepSeek完成深度融合

    近日,宝骏汽车灵智舱与DeepSeek大模型已完成深度融合,是行业首批将AI前沿技术应用于量产车型的品牌,宝骏享境成为行业首个完成实车装载车型!
    的头像 发表于 02-08 15:41 1167次阅读