0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出端到端语音翻译技术,让优质高效的机器翻译不再遥遥无期

电子工程师 来源:YXQ 2019-05-17 16:01 次阅读

40年前,英国科幻作家Douglas Adams在他的《银河系漫游指南》中这样描述巴别鱼(bable fish):迷你黄色生物,水蛭状,以声音中的语言概念为食,消化后排出跟寄主同频的脑波。只要塞到耳朵里去,就可以听懂各种语言。

而在这个充满嬉皮风格的科幻作品中,来自地球的Arthur Dent也因为这条丑陋的鱼,能够完美地理解并与他遇到的各种外星种族交流。

自小说诞生,巴别鱼便成为了即时语音翻译的代名词。但在当时,人类的翻译技术距离这一目标仍遥不可及。

直到2014年,加拿大蒙特利尔大学的Kyunghyun Cho、Yoshua Bengio等人发布了一篇在机器翻译领域应用神经网络的论文——Neural Machine Translation by Jointly Learning to Align and Translate。

神经网络的出现,让优质高效的机器翻译不再遥遥无期。

每次技术的突破都让我们离巴别鱼更近一步,直到今天,谷歌的发布了一项新研究Translatotron,这是一种可以实现端到端的语音转语音的翻译技术。该工具放弃了将语音翻译成文本在返回语音的步骤,可以直接从一种语言转换称另外一种语言,并同时保持说话着的语调和节奏。

告别Siri,我们先来感受一下翻译的调调:

通过结合扬声器编码器网络,使得Translatotron能够在翻译的语音中保留原始扬声器的声音特征,这使得翻译的语音听起来更自然,更少刺耳。

更多声音样本可以在Translatotron的Google Research的Github页面上找到。

此功能利用了谷歌之前specker verification 和 speaker adaptation for TTS 的研究。扬声器编码器在specker verification任务上预先训练,学习从简短的示例话语对扬声器特性进行编码。即使内容是不同的语言,该编码上调节频谱图解码器也可使得合成具有类似扬声器特性的语音。

Translatotron模型

其实语音翻译的端到端模型的早在2016年就开始出现了,当时研究人员证明了使用单个序列到序列模型进行语音到文本翻译的可行性。

2017年,谷歌研究员们证明了这种端到端模型可以胜过cascade模型。之后又进一步改进许多端到端语音到文本翻译模型的方法。

最终在2019年,谷歌的研究员们在arXiv发表Translatotron模型,通过证明单个序列到序列模型可以直接将语言从一种语言翻译成另一种语言的语音,而不依赖于任何一种语言的中间文本表示。

Translatotron基于序列到序列网络将源光谱图作为输入并生成目标语言中的翻译内容的光谱图输出。它还使用了另外两个经过单独训练的组件:神经声码器将输出频谱图转换为时域波形,使用扬声器编码器来保持合成的翻译语音中源说话者的语音的特征。

在训练期间,序列到序列模型使用多任务目标来在生成目标谱图的同时预测源和目标转录物。

Translatotron的模型结构

该团队称,翻译的准确性并不如传统翻译系统那么好,传统系统有更多时间来磨练其准确性。但Translatotron是第一个能够将语言从一种语言直接翻译成另一种语言的语音的端到端模型。他们希望这项工作可以作为未来端到端语音转语音翻译系统研究的起点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5855

    浏览量

    103250
  • 语音识别
    +关注

    关注

    37

    文章

    1635

    浏览量

    111831

原文标题:巴别鱼雏形,谷歌推出端到端语音翻译技术,还能模仿你说话

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于机器翻译增加的跨语言机器阅读理解算法

    近日,阿里云人工智能平台 PAI 与华南理工大学朱金辉教授团队、达摩院自然语言处理团队合作在自然语言处理顶级会议 EMNLP2023 上发表基于机器翻译增加的跨语言机器阅读理解算法 X-STA。通过
    的头像 发表于 12-12 10:28 355次阅读
    基于<b class='flag-5'>机器翻译</b>增加的跨语言<b class='flag-5'>机器</b>阅读理解算法

    教你Python自制屏幕翻译工具

    会有一些解析对话框,没法拷贝文本内容,上面的方式都就变得束手无策。 今天教大家利用 10 行 Python 代码制作一个翻屏软件,随处翻译高效办公。 2. 实现步骤 首先,我们使用 PIL 依赖库剪切板读取图片,然后下载到本地。 # 安装PIL依赖 # 从剪切板
    的头像 发表于 11-02 16:02 345次阅读
    教你Python自制屏幕<b class='flag-5'>翻译</b>工具

    仿真人类的微软AI翻译系统

    从历史上看,曾经主流的机器学习技术在行业中应用是统计机器翻译 (SMT)。SMT 使用先进的统计分析,从一句话中上下文的几个词中来估计最佳可能的翻译。SMT自20 世纪中期以来的为所有
    的头像 发表于 10-11 15:27 555次阅读

    Transformers是什么意思?人工智能transformer怎么翻译

    转换成目标语言并实现各种自然语言处理任务,例如文本分类、文本生成、机器翻译和命名实体识别等。该技术最近在各种自然语言处理任务中表现出色,比传统的技术方法实现更高的准确性和更高的处理速度。 在电气工程中,transformer通常
    的头像 发表于 08-22 15:59 2219次阅读

    ToB,智能可穿戴的下一个蓝海

    智能手机廉颇老矣,元宇宙遥遥无期,下一个硬件消费蓝海,也该轮到智能穿戴了.
    的头像 发表于 08-17 07:38 1535次阅读
    ToB,智能可穿戴的下一个蓝海

    人工智能会取代翻译

    在某些场景下,如翻译普通商务文档、新闻报道以及其他非技术性的文章等,机器翻译的正确率已经非常接近人类翻译了。然而,在涉及到一些重要的领域,例如法律、药学甚至是文学等相关领域,
    的头像 发表于 08-14 14:29 762次阅读

    机器翻译研究进展

    机器翻译使用计算机将一种语言翻译成另一种语言,具有低成本、高效率和高翻译质量等优势,在语音翻译
    的头像 发表于 07-06 11:19 414次阅读
    <b class='flag-5'>机器翻译</b>研究进展

    060. 任务60:机器翻译 #硬声创作季

    机器翻译深度学习
    充八万
    发布于 :2023年06月21日 18:04:57

    人工智能计算范式和理论总结趋势

    传统的语音到文本的翻译是通过语音识别和文本机器翻译的串联实现。这个方法的缺点是推理过程中的错误会累加。ConST 可以直接将英语的语音
    发表于 06-07 11:35 434次阅读
    人工智能计算范式和理论总结趋势

    PyTorch教程10.7之用于机器翻译的编码器-解码器Seq2Seq

    电子发烧友网站提供《PyTorch教程10.7之用于机器翻译的编码器-解码器Seq2Seq.pdf》资料免费下载
    发表于 06-05 18:14 0次下载
    PyTorch教程10.7之用于<b class='flag-5'>机器翻译</b>的编码器-解码器Seq2Seq

    PyTorch教程-10.7. 用于机器翻译的编码器-解码器 Seq2Seq

    10.7. 用于机器翻译的编码器-解码器 Seq2Seq¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab
    的头像 发表于 06-05 15:44 567次阅读
    PyTorch教程-10.7. 用于<b class='flag-5'>机器翻译</b>的编码器-解码器 Seq2Seq

    PyTorch教程-10.5。机器翻译和数据集

    10.5。机器翻译和数据集¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab Colab [jax
    的头像 发表于 06-05 15:44 474次阅读
    PyTorch教程-10.5。<b class='flag-5'>机器翻译</b>和数据集

    PyTorch教程10.5之机器翻译和数据集

    电子发烧友网站提供《PyTorch教程10.5之机器翻译和数据集.pdf》资料免费下载
    发表于 06-05 15:14 0次下载
    PyTorch教程10.5之<b class='flag-5'>机器翻译</b>和数据集

    LLM时代NLP研究何去何从?

    在当前低资源的语言基准上(如FLORES-200)改进机器翻译性能。针对资源极低的语言,可以利用圣经(世界上翻译最多的文档)等现有文本作为开发机器翻译系统的起点。
    的头像 发表于 06-02 15:52 735次阅读

    大语言模型的多语言机器翻译能力分析

    以ChatGPT为代表的大语言模型(Large Language Models, LLM)在机器翻译(Machine Translation, MT)任务上展现出了惊人的潜力。
    的头像 发表于 05-17 09:56 1002次阅读
    大语言模型的多语言<b class='flag-5'>机器翻译</b>能力分析