0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为了到2025年实现采用AI的实时同声传译,日本正推进研究

ss 来源:日经中文网 作者:日经中文网 2021-01-20 14:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

为了到2025年实现采用人工智能AI)的实时同声传译,日本正推进研究。目前已完全可以实现语音识别,以后的目标是提高翻译准确率和速度。世界上有很多和日语具有相同特征的语言,如果能实现日语的同声传译,就有望推进国际性普及。

演讲者用英语做大约1分钟的演讲,背后的屏幕上显示出基于AI的日语同声传译。这是日本情报通信研究机构(NICT,注:日语的“情报”有“信息”之意)2020年11月举行的发布会上的一幕。从演讲者发言到出现译文大约需要10秒,但几乎没有翻译错误。

同声传译一般是对说话内容进行语音识别,然后由使用AI的翻译软件将其转换成其他语言。现有的服务大多是从说完话才开始翻译。因此,语速快的对话很难翻译,表达相同的内容时,同声传译所用时间是母语会话时间的2倍。按这样的水平很难用于商务用途,亟需可以克服这一缺点的技术。

现在同声传译的翻译准确率提高,但存在延时

日本情报通信研究机构通过2019年度之前的日本国家研究项目,已在语音识别方面实现了充分的性能。该机构的目标是从2020年度开始兼顾翻译准确率和速度。发布会上有10秒的延时,但今后有望缩小到跟同声传译人员相当的2、3秒。

日本情报通信研究机构开发的是在发言过程中就可以开始翻译的AI。断句的预处理技术是其中的关键。

翻译软件由断句的预处理和对句子进行翻译的翻译引擎构成。现有技术要想顺畅翻译,只能以句子单位进行断句,因此会有延时。如果在说完话之前就开始翻译,则可以缩短时差。

日本情报通信研究机构在预处理中采用按“语块”(chunk,或称:语义块)断句的方法,比以句子为单位断句翻译得更精准。专业的同声传译人员也使用这种方法。这样可以保证翻译准确度,并减少延时。

日本情报通信研究机构在开发中将使用大量的数据。该机构在2021年度末之前,将从同声传译人员等手中收集划分语义的位置及其译文的数据。2022年度将开发按照语义断句并翻译的AI。

与英译日相比,日译英的同声传译难度更高。因为断句的预处理比较难。

在日语中,动词及表示否定等的重要词语出现在句尾,因此需要预读,然后进行翻译。而动词等关键词语在句子前半部分出现的英语等更好翻译。在日语中,句子省略主语的情况也很多,AI要补充完整句子以后再翻译,因此容易出错。

为了防止误译,需要进行修正的技术。比如提前给AI提供演讲内容相关数据,让它进行学习,它就能够读懂后面要说的话,从而更准确地完成同声传译。

日本情报通信研究机构还将改进翻译引擎。通过日英、英日及所有语言翻译都使用的技术来控制翻译准确度。如果这项性能不高,即使预处理速度再快、修正功能出色,也起不到作用。

日本情报通信研究机构的翻译引擎除了市售的便携式翻译机以外,还被松下、NTT docomo及NEC等的语音翻译服务采用。该机构的研究员隅田英一郎自信地说“英日翻译准确率换算成托业考试(TOEIC)分数的话,相当于900分左右”。

在提高翻译准确率方面值得期待的是,得到美国特斯拉首席执行官(CEO)马斯克等人资助的研究企业OpenAI在2020年6月公布了语言AI“GPT-3”。这款AI可以写出跟人水平接近的比较自然的文章。

GPT-3利用巨大的“大脑”学习大量文件,获得了很强的能力。开发中使用的数据相当于数千亿词汇量。如果能在翻译引擎中应用GPT-3的系统,就有可能大幅提高性能。

围绕同声传译,全球的大型IT企业都在竞争,不过日本情报通信研究机构仍有胜算。隅田研究员指出“美国微软、中国百度及美国谷歌都是以句子为单位进行断句,以语块断句的方法尚未取得成果。都在同一水平上”。各公司都在下力气开发的中英语同声传译也跟日本情报通信研究机构开发一样,存在10秒左右的延时。

如果能实现日语翻成其他主要语言的同声传译,在国际上就会占据优势。

英语、中文及法语等使用人数较多的语言都是动词跟在名词后面的类型。占到全球语言的约4成。其实,世界上有一半语言和日语一样,把动词放在句尾。同类型的语言之间更容易实现同声传译。如果在不同类型语言之间的同声传译方面,能开发出优异的技术,则有可能应用于9成的语言。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296526
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261486
  • 翻译
    +关注

    关注

    0

    文章

    47

    浏览量

    11134
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    视美泰发布AI即时翻译机解决方案,硬核配置+多语种覆盖破解跨语言沟通难题

    、机器翻译、语音合成和大模型四项能力构建高效同声传译链路,实现70+种语言全覆盖的强大能力,为跨境商贸、文化交流、户外出行等场景提供高效精准的翻译解决方案,推动AI
    的头像 发表于 12-03 10:50 554次阅读
    视美泰发布<b class='flag-5'>AI</b>即时翻译机解决方案,硬核配置+多语种覆盖破解跨语言沟通难题

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件AI湿件

    生物化学计算机,它通过离子、分子间的相互作用来进行复杂的并行计算。因而未来可期的前景是AI硬件将走向AI湿件。 根据研究,估算出大脑的功率是20W,在进行智力活动时,其功率会增大25
    发表于 09-06 19:12

    是德科技与Heavy Reading合作发布2025AI集群网络报告

    是德科技(NYSE: KEYS )日前宣布其与Heavy Reading合作发布了《超越瓶颈:2025AI集群网络报告》。报告指出,人工智能(AI)的
    的头像 发表于 08-28 15:43 579次阅读

    2025嵌入式行业现状如何?

    →CTO。跨界方向:智能硬件产品经理、芯片设计工程师。 2025嵌入式行业正处于技术变革与市场需求爆发的黄金期,架构革新、AI融合、实时性与安全强化成为核心驱动力。就业市场呈现“初级
    发表于 08-25 11:34

    技术迭代引领同传行业变革,时空壶 X1 同声传译器夯实品牌标杆地位

    在全球化沟通需求日益旺盛的背景下,AI同传设备已从辅助工具升级为跨语言交流的核心基础设施。时空壶X1同声传译器凭借持续的技术突破与功能革新,不仅构建起差异化的技术护城河,更以行业领先的解决方案重新
    的头像 发表于 08-25 10:47 718次阅读
    技术迭代引领同传行业变革,时空壶 X1 <b class='flag-5'>同声传译</b>器夯实品牌标杆地位

    大语言模型升级!时空壶 X1 同声传译器的上限在哪里?

    传准确度方面实现了质的飞跃,为用户带来了更优质、高效的使用体验,进一步巩固了其作为全球最为先进的AI同传产品的市场地位。自推出以来,时空壶X1AI同声传译器凭借其
    的头像 发表于 06-18 09:40 724次阅读
    大语言模型升级!时空壶 X1 <b class='flag-5'>同声传译</b>器的上限在哪里?

    从“鸡同鸭讲”“心有灵犀”,CC\\-Link IE转Ethernet/IP做对了什么?

    始终达不到预期。 这时,耐达讯通信技术协议转换设备就像一位专业的\"同声传译\"。它通过内置的协议解析模块,将CC-Link IE协议的控制指令、运行状态等数据,实时转换
    发表于 06-16 15:18

    亮相深圳文博会,时空壶的“AI同传”实力震惊在场老外

    在刚刚落幕的第二十一届深圳文博会,文化与科技深度融合,为全球文化产业带来了一场思想碰撞与合作交流的盛宴。其中,时空壶X1AI同声传译器凭借其卓越的性能,成为了展会中跨语言交流的关键助力,为来自不同国
    的头像 发表于 05-29 11:34 720次阅读
    亮相深圳文博会,时空壶的“<b class='flag-5'>AI</b>同传”实力震惊在场老外

    华为AI Calling同声传译如何改变游客体验

    近期,作为泰国领先的数字服务提供商,AIS(Advanced Info Service)在华为MATE XT发布会期间推出全球首个AI Calling英泰同声传译业务,为全球游客带来跨语言通话
    的头像 发表于 05-28 14:53 1231次阅读

    2025开启AI智能体规模应用

    2025AI 领域的热议话题已经从大语言模型(LLMs)转向了 AI 智能体(AI Agent)。根据 Gartner 最新预测,企业
    的头像 发表于 05-09 11:09 975次阅读

    华为AI Calling同声传译亮相MWC 2025

    在MWC25期间,全球首个AI Calling同声传译在巴塞罗那成功亮相,该业务实现了通话时双向的实时语音翻译,为用户带来了一场通话体验的变革,其“人人都能用”,“跟谁都能打”,“在哪
    的头像 发表于 03-17 17:11 1344次阅读

    AI赋能边缘网关:开启智能时代的新蓝海

    ,可完成电力负荷精准预测、故障快速定位。据市场研究机构预测,2025AI边缘网关市场规模将突破千亿美元,
    发表于 02-15 11:41

    Auracast广播音频创新实时语言翻译解决方案

    世界朝着互联化方向发展,但语言障碍仍然为全球沟通和文化交流带来挑战。作为蓝牙技术联盟的长期推广公司,东芝(Toshiba)研发出将AI同声传译与Auracast广播音频技术相结合的创新解决方案,为打破公共场所和教育环境中的语言
    的头像 发表于 01-13 14:39 1367次阅读

    NVIDIA展望2025AI的应用前景

    AI 重塑着各行各业,从医疗健康电信,从媒体娱乐到零售,其身影无处不在。NVIDIA 的多位专家从不同行业出发,对 2025
    的头像 发表于 01-03 11:43 1445次阅读

    AI加速采用推动存储器市场2025显著增长

    近日,据市调机构TechInsights发布的最新报告,存储器市场,特别是DRAM和NAND两大领域,预计在2025实现显著增长。这一增长趋势主要得益于人工智能(AI)及相关技术的
    的头像 发表于 12-26 14:43 1007次阅读