0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

换个角度来聊机器翻译

电子工程师 来源:lq 2019-04-24 13:55 次阅读

公元652年,玄奘在慈恩寺西院建造了大雁塔,用于收藏他从天竺带回来的657部佛经经卷,之后的12年里玄奘一直在此翻译佛经。

当巴别塔出现的时候,人类开始有了不同的语言,而大雁塔出现的时候,人类已经在不同的语言中开始翻译。

这周的课程,我们来讲一个同学们都比较熟悉的知识点——机器翻译。

之前咱们AI大学刘俊华导师从“三大核心翻译技术”的角度,给大家普及了基于规则的翻译方法(RMT)、基于统计的翻译方法(SMT)、基于神经网络的翻译方法(NMT)的三种翻译技术的相应原理。

今天我们换个角度来聊机器翻译,从历史角度来看看这个比人工智能概念诞生还早的自然语言处理任务。

机器翻译发展历史图谱

一、从传说开始的故事

《圣经》中记载了这样一个故事:

人类曾经联合起来兴建能通往天堂的高塔——巴别塔,为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。

实现不同语种之间的无障碍沟通,一直都是人类终极梦想之一。

在认识到不眠不休穷尽人类一生的力量,也只能掌握几十种语言时,很多科学家开始思考,是不是可以用机器来帮助人们去解决沟通问题?

这一问题在1933年首次得到了答案,苏联科学家Peter Troyanskii向苏联科学院介绍了能将一种语言翻译成另一种语言的机器。

这个法明很简单,在当时并未受到苏联政府的重视,他们觉得这台拥有各种语言卡片的机器没有实际作用。

Troyanskii用20多年的时间将这台翻译机器发明出来,后死于心绞痛。

我们今天能如此清晰的复述这段故事,是因为在1956年苏联2位科学家发现了Troyanskii所创造的翻译机器,并将它公之于世。

如果不是这样,或许我们到现在都不会知道,早在1933年就有人想过将语言卡片、打字机、老式胶片组合在一起,发明一台翻译机器。

Troyanskii发明的翻译机器简化图

二、萌芽于冷战中的军备竞赛

正像计算机是被战争催生出一样,机器翻译技术的萌芽也与军事有关。

1947年杜鲁门主义出台,美苏冷战正式开始,对于俄文情报资料的翻译,需求量很大。

1954年,美国乔治敦大学在IBM公司协同下用IBM-701计算机首次完成了英俄机器翻译试验,拉开了机器翻译研究的序幕。

当时的系统,仅能容纳250个单词,遵循6条语法规则,翻译49个句子。

但这一切已足以点燃科学家们的激情,机器翻译成功引起了苏联、日本和欧洲国家的研究兴趣。一时间,各国政府纷纷拨款,全球机器翻译热潮兴起。

然而,技术的发展都是曲折艰难的,和这种狂热的关注相比机器翻译的研究进展着实缓慢,美国科学院成立了语言自动处理咨询委员会(ALPAC)于1966年公布了一份名为《语言与机器》的报告,该研究否认机器翻译可行性,机器翻译研究进入萧条期。

虽然这一阶段的机器翻译发展并不顺利,但还是为现代自然语言处理技术打下了坚实的基础。

三、20世纪末的又一次兴起

20世纪70年代IBM沃森实验室的贾里尼克,他提出了基于统计的语音识别框架,这个框架对语音和语言处理都有着深远影响,它从根本上使得语音识别有实用的可能。从此,自然语言处理开始走上统计方法之路。

1993年,IBM的Brown等提出基于词对齐的统计翻译模型,基于语料库的方法开始盛行,标志着第二代机器翻译技术——「基于统计的机器翻译」开始兴起,其核心在于设计概率模型对翻译过程建模。

统计机器翻译避开了语言规则,使用大量的双语文本,建立两种语言的平行语料库,虽然避开了繁杂的语法规则,但需要大规模的语料库,这在当时非常难以实现。

2014年谷歌和蒙特利尔大学提出的第三代机器翻译技术,也就是基于端到端的神经机器翻译,标志着第三代机器翻译技术的到来。

2016年月28日,谷歌发布新的神经机器翻译系统GNMT,同时支持PC端和移动端,这项服务背后的核心算法是基于短语的机器翻译。

同时期国内科技企业在机器翻译上的进展也非常迅速,以语音和语义理解见长的科大讯飞在2014年国际口语翻译大赛IWSLT上获得中英和英中两个翻译方向的全球第一名,在2015年又在由美国国家标准技术研究院组织的机器翻译大赛中取得全球第一的成绩。

自此,神经机器翻译开始大规模走向应用。

四、重建巴别塔之路

从1993年到2019年,机器翻译技术发展了80多年,巴别塔的传说已经成了过去,我们今天重温机器翻译的发展历史,并不是为了再去修建一座真的「通天塔」,而是想让同学们更加深刻地了解机器翻译这门学科。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1775

    文章

    43617

    浏览量

    230414
  • 机器翻译
    +关注

    关注

    0

    文章

    138

    浏览量

    14793
  • 自然语言处理

    关注

    1

    文章

    507

    浏览量

    13096

原文标题:A.I.公开课预告 | 机器翻译的光荣与梦想

文章出处:【微信号:iFLYTEK1999,微信公众号:科大讯飞】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    工字电感换个比原来大的行吗

    电子发烧友网站提供《工字电感换个比原来大的行吗.docx》资料免费下载
    发表于 01-23 10:07 0次下载

    基于机器翻译增加的跨语言机器阅读理解算法

    近日,阿里云人工智能平台 PAI 与华南理工大学朱金辉教授团队、达摩院自然语言处理团队合作在自然语言处理顶级会议 EMNLP2023 上发表基于机器翻译增加的跨语言机器阅读理解算法 X-STA。通过
    的头像 发表于 12-12 10:28 347次阅读
    基于<b class='flag-5'>机器翻译</b>增加的跨语言<b class='flag-5'>机器</b>阅读理解算法

    焊接机器人焊枪角度怎么调

    焊接机器人在现代制造业中扮演着重要的角色,它们能够高效地完成焊接任务,提高生产效率,减少劳动力成本,同时确保焊接质量的一致性。其中,焊枪角度的调整对焊接质量至关重要。创想焊缝跟踪将探讨如何正确地调整
    的头像 发表于 11-07 14:38 350次阅读
    焊接<b class='flag-5'>机器</b>人焊枪<b class='flag-5'>角度</b>怎么调

    仿真人类的微软AI翻译系统

    从历史上看,曾经主流的机器学习技术在行业中应用是统计机器翻译 (SMT)。SMT 使用先进的统计分析,从一句话中上下文的几个词中来估计最佳可能的翻译。SMT自20 世纪中期以来的为所有主要翻译
    的头像 发表于 10-11 15:27 538次阅读

    Transformers是什么意思?人工智能transformer怎么翻译

    转换成目标语言并实现各种自然语言处理任务,例如文本分类、文本生成、机器翻译和命名实体识别等。该技术最近在各种自然语言处理任务中表现出色,比传统的技术方法实现更高的准确性和更高的处理速度。 在电气工程中,transformer通常指的是一种用于改变交流电压的电气设备,它由许多线圈和铁
    的头像 发表于 08-22 15:59 2176次阅读

    人工智能会取代翻译

    在某些场景下,如翻译普通商务文档、新闻报道以及其他非技术性的文章等,机器翻译的正确率已经非常接近人类翻译了。然而,在涉及到一些重要的领域,例如法律、药学甚至是文学等相关领域,机器翻译
    的头像 发表于 08-14 14:29 729次阅读

    模拟电路和数字电路接地层不能分割的原因

    看到一篇关于PCB接地测量的好文章,机器翻译,怎么看都不爽,自己尝试修改下,与大家共享。
    的头像 发表于 07-21 11:18 408次阅读
    模拟电路和数字电路接地层不能分割的原因

    机器翻译研究进展

    机器翻译使用计算机将一种语言翻译成另一种语言,具有低成本、高效率和高翻译质量等优势,在语音翻译、同声传译自动化等许多领域得到广泛应用。 随着双语语料库的不断建设和完善,基于语料库的
    的头像 发表于 07-06 11:19 403次阅读
    <b class='flag-5'>机器翻译</b>研究进展

    060. 任务60:机器翻译 #硬声创作季

    机器翻译深度学习
    充八万
    发布于 :2023年06月21日 18:04:57

    PyTorch教程10.7之用于机器翻译的编码器-解码器Seq2Seq

    电子发烧友网站提供《PyTorch教程10.7之用于机器翻译的编码器-解码器Seq2Seq.pdf》资料免费下载
    发表于 06-05 18:14 0次下载
    PyTorch教程10.7之用于<b class='flag-5'>机器翻译</b>的编码器-解码器Seq2Seq

    PyTorch教程-10.7. 用于机器翻译的编码器-解码器 Seq2Seq

    10.7. 用于机器翻译的编码器-解码器 Seq2Seq¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab
    的头像 发表于 06-05 15:44 555次阅读
    PyTorch教程-10.7. 用于<b class='flag-5'>机器翻译</b>的编码器-解码器 Seq2Seq

    PyTorch教程-10.5。机器翻译和数据集

    10.5。机器翻译和数据集¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab Colab [jax
    的头像 发表于 06-05 15:44 462次阅读
    PyTorch教程-10.5。<b class='flag-5'>机器翻译</b>和数据集

    PyTorch教程10.5之机器翻译和数据集

    电子发烧友网站提供《PyTorch教程10.5之机器翻译和数据集.pdf》资料免费下载
    发表于 06-05 15:14 0次下载
    PyTorch教程10.5之<b class='flag-5'>机器翻译</b>和数据集

    LLM时代NLP研究何去何从?

    在当前低资源的语言基准上(如FLORES-200)改进机器翻译性能。针对资源极低的语言,可以利用圣经(世界上翻译最多的文档)等现有文本作为开发机器翻译系统的起点。
    的头像 发表于 06-02 15:52 727次阅读

    大语言模型的多语言机器翻译能力分析

    以ChatGPT为代表的大语言模型(Large Language Models, LLM)在机器翻译(Machine Translation, MT)任务上展现出了惊人的潜力。
    的头像 发表于 05-17 09:56 961次阅读
    大语言模型的多语言<b class='flag-5'>机器翻译</b>能力分析