0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为了到2025年实现采用AI的实时同声传译,日本正推进研究

ss 来源:日经中文网 作者:日经中文网 2021-01-20 14:47 次阅读

为了到2025年实现采用人工智能AI)的实时同声传译,日本正推进研究。目前已完全可以实现语音识别,以后的目标是提高翻译准确率和速度。世界上有很多和日语具有相同特征的语言,如果能实现日语的同声传译,就有望推进国际性普及。

演讲者用英语做大约1分钟的演讲,背后的屏幕上显示出基于AI的日语同声传译。这是日本情报通信研究机构(NICT,注:日语的“情报”有“信息”之意)2020年11月举行的发布会上的一幕。从演讲者发言到出现译文大约需要10秒,但几乎没有翻译错误。

同声传译一般是对说话内容进行语音识别,然后由使用AI的翻译软件将其转换成其他语言。现有的服务大多是从说完话才开始翻译。因此,语速快的对话很难翻译,表达相同的内容时,同声传译所用时间是母语会话时间的2倍。按这样的水平很难用于商务用途,亟需可以克服这一缺点的技术。

现在同声传译的翻译准确率提高,但存在延时

日本情报通信研究机构通过2019年度之前的日本国家研究项目,已在语音识别方面实现了充分的性能。该机构的目标是从2020年度开始兼顾翻译准确率和速度。发布会上有10秒的延时,但今后有望缩小到跟同声传译人员相当的2、3秒。

日本情报通信研究机构开发的是在发言过程中就可以开始翻译的AI。断句的预处理技术是其中的关键。

翻译软件由断句的预处理和对句子进行翻译的翻译引擎构成。现有技术要想顺畅翻译,只能以句子单位进行断句,因此会有延时。如果在说完话之前就开始翻译,则可以缩短时差。

日本情报通信研究机构在预处理中采用按“语块”(chunk,或称:语义块)断句的方法,比以句子为单位断句翻译得更精准。专业的同声传译人员也使用这种方法。这样可以保证翻译准确度,并减少延时。

日本情报通信研究机构在开发中将使用大量的数据。该机构在2021年度末之前,将从同声传译人员等手中收集划分语义的位置及其译文的数据。2022年度将开发按照语义断句并翻译的AI。

与英译日相比,日译英的同声传译难度更高。因为断句的预处理比较难。

在日语中,动词及表示否定等的重要词语出现在句尾,因此需要预读,然后进行翻译。而动词等关键词语在句子前半部分出现的英语等更好翻译。在日语中,句子省略主语的情况也很多,AI要补充完整句子以后再翻译,因此容易出错。

为了防止误译,需要进行修正的技术。比如提前给AI提供演讲内容相关数据,让它进行学习,它就能够读懂后面要说的话,从而更准确地完成同声传译。

日本情报通信研究机构还将改进翻译引擎。通过日英、英日及所有语言翻译都使用的技术来控制翻译准确度。如果这项性能不高,即使预处理速度再快、修正功能出色,也起不到作用。

日本情报通信研究机构的翻译引擎除了市售的便携式翻译机以外,还被松下、NTT docomo及NEC等的语音翻译服务采用。该机构的研究员隅田英一郎自信地说“英日翻译准确率换算成托业考试(TOEIC)分数的话,相当于900分左右”。

在提高翻译准确率方面值得期待的是,得到美国特斯拉首席执行官(CEO)马斯克等人资助的研究企业OpenAI在2020年6月公布了语言AI“GPT-3”。这款AI可以写出跟人水平接近的比较自然的文章。

GPT-3利用巨大的“大脑”学习大量文件,获得了很强的能力。开发中使用的数据相当于数千亿词汇量。如果能在翻译引擎中应用GPT-3的系统,就有可能大幅提高性能。

围绕同声传译,全球的大型IT企业都在竞争,不过日本情报通信研究机构仍有胜算。隅田研究员指出“美国微软、中国百度及美国谷歌都是以句子为单位进行断句,以语块断句的方法尚未取得成果。都在同一水平上”。各公司都在下力气开发的中英语同声传译也跟日本情报通信研究机构开发一样,存在10秒左右的延时。

如果能实现日语翻成其他主要语言的同声传译,在国际上就会占据优势。

英语、中文及法语等使用人数较多的语言都是动词跟在名词后面的类型。占到全球语言的约4成。其实,世界上有一半语言和日语一样,把动词放在句尾。同类型的语言之间更容易实现同声传译。如果在不同类型语言之间的同声传译方面,能开发出优异的技术,则有可能应用于9成的语言。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26405

    浏览量

    264006
  • 人工智能
    +关注

    关注

    1776

    文章

    43782

    浏览量

    230562
  • 翻译
    +关注

    关注

    0

    文章

    47

    浏览量

    10526
收藏 人收藏

    评论

    相关推荐

    苹果自研AI服务器芯片,预计2025年台积电3nm工艺

    4 月 24 日,知名数码博主@手机晶片达人发布动态,爆料苹果正研发自家 AI 服务器芯片,预计 2025 年下半年量产,采用台积电 3nm 制程。
    的头像 发表于 04-24 11:00 158次阅读

    美日联手研究生成式AI,将建立合作框架

    近期,美国和日本政府宣布将联手研究生成式人工智能(AI),并计划建立一个合作框架以共同推进该领域的技术进步。
    的头像 发表于 04-18 15:15 324次阅读

    NVIDIA生成式AI研究实现在1秒内生成3D形状

    NVIDIA 研究人员使 LATTE3D (一款最新文本转 3D 生成式 AI 模型)实现双倍加速。
    的头像 发表于 03-27 10:28 153次阅读
    NVIDIA生成式<b class='flag-5'>AI</b><b class='flag-5'>研究</b><b class='flag-5'>实现</b>在1秒内生成3D形状

    是德科技与NVIDIA携手推进6G研究云平台发展

    是德科技近日宣布与现已开启与全新NVIDIA 6G研究云平台的合作,加速推进6G技术研究。该平台集成了NVIDIA Aerial Omniverse数字孪生技术,这一开放且灵活的网络仿真资源互联框架,为
    的头像 发表于 03-27 09:26 312次阅读

    NanoEdge AI的技术原理、应用场景及优势

    等领域。以下是一些具体的应用场景: 1 . 智能家居:通过将 NanoEdge AI 集成智能家居设备中,可以实现对家庭环境的实时监控和智能控制,如温度调节、照明控制、安防监控等。
    发表于 03-12 08:09

    RISC-V内核突破百亿颗 RVV1.0如何解锁端侧AI市场应用潜能

    内核的增长曲线也愈发陡峭。 根据RISC-V基金会的数据和预测,2022采用RISC-V芯片架构的处理器核已出货100亿颗,2025R
    发表于 12-01 13:17

    台积电将宣布日本第二座晶圆厂!

    日本正积极与台积电等公司合作,帮助其振兴本土半导体产业。目前台积电在熊本建厂计划,与索尼、日本电装合资,原计划一厂将采用22/28nm制程,随后推进到12/16nm,预计2024年底开
    的头像 发表于 11-22 17:52 751次阅读

    北京君X2600处理器亮相ELEXCON 2023,打造多核异构跨界新价值

    处理器,并于2023ELEXCON深圳国际电子展上正式推向市场。 北京君X2600系列处理器结构图 据介绍,X2600系列处理器采用了北京君自研的CPU内核、图像/视频处理、2
    发表于 11-03 18:17

    日本首相将公布生成式AI监管规则

    岸田文雄最近就生成式AI表示:“正在由日本主导制定国际规则。”他强调说,在推进技术革新的同时,将认真应对对社会产生的负面影响和伦理问题。
    的头像 发表于 10-08 14:24 421次阅读

    台积电日本厂预计2024年底量产 或在2025年盈利

    台积电在熊本设立工厂的理由,消息人士称,苹果公司对主力供应商索尼希望实现全面支援,二是tsmc与日本保持了长期的相互利益,提高材料领域的研究开发能力,确保稳定的生产能力供应前景。三是符合日本
    的头像 发表于 09-15 11:22 592次阅读

    同声传译会议系统成功应用于成都某国际会议中心!

    近日,讯维同声传译会议系统成功应用于成都某国际会议中心厅建设项目。此次项目采用了讯维最新一代同声传译会议系统,包含数字红外发射主机、数字翻译台、数字红外辐射器、红外单元充电箱等设备。整个国际会议
    的头像 发表于 08-09 10:31 334次阅读

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练,AI部署需要更多。 预计2020代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理。英特尔Xeon可扩展处理器约占运行AI推理的处理器
    发表于 08-04 07:25

    机器翻译研究进展

    机器翻译使用计算机将一种语言翻译成另一种语言,具有低成本、高效率和高翻译质量等优势,在语音翻译、同声传译自动化等许多领域得到广泛应用。 随着双语语料库的不断建设和完善,基于语料库的机器翻译逐渐
    的头像 发表于 07-06 11:19 411次阅读
    机器翻译<b class='flag-5'>研究</b>进展

    北京君案例:数传网关的集大成者—积木式边缘网关

    多种云服务功能,支持阿里云,AWS和有人云的快速接入。 文章来源:有人物联网 关于北京君 北京君集成电路股份有限公司成立于2005,基于创始团队创新的CPU设计技术,迅速在消费电子市场
    发表于 06-09 15:10

    运动自主研发实时软核MotionRT7与Labview单轴点动例程开发

    MotionRT7是运动推出的跨平台运动控制实时内核,也是国内首家完全自主自研,自主可控的Windows运动控制实时软核。 1.MotionRT7具备以下特点(1)独立软件安装,适合各种
    发表于 05-12 09:59