0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

换个角度来聊机器翻译

电子工程师 来源:lq 2019-04-24 13:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

公元652年,玄奘在慈恩寺西院建造了大雁塔,用于收藏他从天竺带回来的657部佛经经卷,之后的12年里玄奘一直在此翻译佛经。

当巴别塔出现的时候,人类开始有了不同的语言,而大雁塔出现的时候,人类已经在不同的语言中开始翻译。

这周的课程,我们来讲一个同学们都比较熟悉的知识点——机器翻译。

之前咱们AI大学刘俊华导师从“三大核心翻译技术”的角度,给大家普及了基于规则的翻译方法(RMT)、基于统计的翻译方法(SMT)、基于神经网络的翻译方法(NMT)的三种翻译技术的相应原理。

今天我们换个角度来聊机器翻译,从历史角度来看看这个比人工智能概念诞生还早的自然语言处理任务。

机器翻译发展历史图谱

一、从传说开始的故事

《圣经》中记载了这样一个故事:

人类曾经联合起来兴建能通往天堂的高塔——巴别塔,为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。

实现不同语种之间的无障碍沟通,一直都是人类终极梦想之一。

在认识到不眠不休穷尽人类一生的力量,也只能掌握几十种语言时,很多科学家开始思考,是不是可以用机器来帮助人们去解决沟通问题?

这一问题在1933年首次得到了答案,苏联科学家Peter Troyanskii向苏联科学院介绍了能将一种语言翻译成另一种语言的机器。

这个法明很简单,在当时并未受到苏联政府的重视,他们觉得这台拥有各种语言卡片的机器没有实际作用。

Troyanskii用20多年的时间将这台翻译机器发明出来,后死于心绞痛。

我们今天能如此清晰的复述这段故事,是因为在1956年苏联2位科学家发现了Troyanskii所创造的翻译机器,并将它公之于世。

如果不是这样,或许我们到现在都不会知道,早在1933年就有人想过将语言卡片、打字机、老式胶片组合在一起,发明一台翻译机器。

Troyanskii发明的翻译机器简化图

二、萌芽于冷战中的军备竞赛

正像计算机是被战争催生出一样,机器翻译技术的萌芽也与军事有关。

1947年杜鲁门主义出台,美苏冷战正式开始,对于俄文情报资料的翻译,需求量很大。

1954年,美国乔治敦大学在IBM公司协同下用IBM-701计算机首次完成了英俄机器翻译试验,拉开了机器翻译研究的序幕。

当时的系统,仅能容纳250个单词,遵循6条语法规则,翻译49个句子。

但这一切已足以点燃科学家们的激情,机器翻译成功引起了苏联、日本和欧洲国家的研究兴趣。一时间,各国政府纷纷拨款,全球机器翻译热潮兴起。

然而,技术的发展都是曲折艰难的,和这种狂热的关注相比机器翻译的研究进展着实缓慢,美国科学院成立了语言自动处理咨询委员会(ALPAC)于1966年公布了一份名为《语言与机器》的报告,该研究否认机器翻译可行性,机器翻译研究进入萧条期。

虽然这一阶段的机器翻译发展并不顺利,但还是为现代自然语言处理技术打下了坚实的基础。

三、20世纪末的又一次兴起

20世纪70年代IBM沃森实验室的贾里尼克,他提出了基于统计的语音识别框架,这个框架对语音和语言处理都有着深远影响,它从根本上使得语音识别有实用的可能。从此,自然语言处理开始走上统计方法之路。

1993年,IBM的Brown等提出基于词对齐的统计翻译模型,基于语料库的方法开始盛行,标志着第二代机器翻译技术——「基于统计的机器翻译」开始兴起,其核心在于设计概率模型对翻译过程建模。

统计机器翻译避开了语言规则,使用大量的双语文本,建立两种语言的平行语料库,虽然避开了繁杂的语法规则,但需要大规模的语料库,这在当时非常难以实现。

2014年谷歌和蒙特利尔大学提出的第三代机器翻译技术,也就是基于端到端的神经机器翻译,标志着第三代机器翻译技术的到来。

2016年月28日,谷歌发布新的神经机器翻译系统GNMT,同时支持PC端和移动端,这项服务背后的核心算法是基于短语的机器翻译。

同时期国内科技企业在机器翻译上的进展也非常迅速,以语音和语义理解见长的科大讯飞在2014年国际口语翻译大赛IWSLT上获得中英和英中两个翻译方向的全球第一名,在2015年又在由美国国家标准技术研究院组织的机器翻译大赛中取得全球第一的成绩。

自此,神经机器翻译开始大规模走向应用。

四、重建巴别塔之路

从1993年到2019年,机器翻译技术发展了80多年,巴别塔的传说已经成了过去,我们今天重温机器翻译的发展历史,并不是为了再去修建一座真的「通天塔」,而是想让同学们更加深刻地了解机器翻译这门学科。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50325

    浏览量

    266963
  • 机器翻译
    +关注

    关注

    0

    文章

    141

    浏览量

    15555
  • 自然语言处理

    关注

    1

    文章

    630

    浏览量

    14723

原文标题:A.I.公开课预告 | 机器翻译的光荣与梦想

文章出处:【微信号:iFLYTEK1999,微信公众号:科大讯飞】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    具身机器人与GNSS高精度定位

    4月19日,北京亦庄人形机器人半程马拉松赛事在万众瞩目中落下帷幕。北斗星通高精度定位模块、高精度定位天线、以及代理的激光雷达产品等方案组合默默助力了数个领先团队取得佳绩,见证了中国人形机器人技术的全
    的头像 发表于 04-24 10:20 332次阅读
    <b class='flag-5'>聊</b>一<b class='flag-5'>聊</b>具身<b class='flag-5'>机器</b>人与GNSS高精度定位

    为何你的机器人手臂“知觉”存在偏差?探秘力传感器的奥秘

    就像你闭着眼伸手,总觉得有人在轻轻推你——对机器人来说,这种“错觉”可是个大麻烦。 这个“错觉”的源头,正是我们今天要的六维力传感器标定与重力补偿。简单说,六维力传感器就像机械臂的“神经末梢”,能同时
    发表于 04-13 15:25

    电源电压对晶振频率的影响

    在现代电子设备中,晶振是保证系统时钟稳定性的核心元件。无论是通信设备、工业控制系统,还是消费类电子产品,晶振都承担着提供时间基准的重要作用。今天凯擎小妹就来电源电压对晶振频率的影响。
    的头像 发表于 04-02 11:47 478次阅读

    今天,我们 AI WAN

    前言3月3日,工业和信息化部正式发布了《关于组织做好2026年度城域“毫秒用算”专项行动的通知》。通知明确,2026年度拟在50个地区开展城域“毫秒用算”专项行动,提升算力高效运载能力,推动算网融合发展。要实现城域范围内的“毫秒用算”,传统“尽力而为”的IP广域网已无法匹配智算场景的极致要求,必须对通信网络进行全面升级。AIWAN正是这场升级的核心载体,它是
    的头像 发表于 03-27 09:37 1442次阅读
    今天,我们<b class='flag-5'>来</b><b class='flag-5'>聊</b>一<b class='flag-5'>聊</b> AI WAN

    谷歌推出TranslateGemma全新开放翻译模型系列

    我们已正式推出 TranslateGemma,这一全新的开放翻译模型系列基于 Gemma 3 构建,并提供 4B、12B 和 27B 三种参数规模。TranslateGemma 的问世标志着开放翻译领域迈出了重要一步,它可帮助人们跨越 55 种语言进行交流,无论身在何处或
    的头像 发表于 02-26 10:22 733次阅读

    爬壁机器人磁铁的一些常见问题

    爬壁机器人近几年比较火,它是一类能够在垂直墙面、天花板、倾斜表面上移动和作业的特种机器人,今天我们不其它,只下关于磁吸附应用中的磁铁,以下是小编整理的关于爬壁
    的头像 发表于 01-09 10:06 432次阅读
    爬壁<b class='flag-5'>机器</b>人磁铁的一些常见问题

    疆鸿智能PROFINET转DEVICENET:炼油设备的“翻译官”,无缝尬省百万

    疆鸿智能PROFINET转DEVICENET:炼油设备的“翻译官”,无缝尬省百万 一、案例背景 在某大型炼油厂催化裂化装置改造项目中,控制系统升级面临核心挑战:主控系统采用新型西门子S7-1500
    的头像 发表于 01-07 14:01 225次阅读
    疆鸿智能PROFINET转DEVICENET:炼油设备的“<b class='flag-5'>翻译</b>官”,无缝尬<b class='flag-5'>聊</b>省百万

    视美泰发布AI即时翻译机解决方案,硬核配置+多语种覆盖破解跨语言沟通难题

    机器翻译、语音合成和大模型四项能力构建高效同声传译链路,实现70+种语言全覆盖的强大能力,为跨境商贸、文化交流、户外出行等场景提供高效精准的翻译解决方案,推动AI翻
    的头像 发表于 12-03 10:50 1271次阅读
    视美泰发布AI即时<b class='flag-5'>翻译</b>机解决方案,硬核配置+多语种覆盖破解跨语言沟通难题

    角度传感器原理、技术与实用指南

    在众多的工业控制、机器人技术和航空航天等领域,角度传感器扮演着不可或缺的角色,为精确测量角度变化提供了关键的技术支持。 工 作 原 理  电位器式角度传感器 原理: 通过旋转轴带动滑动
    的头像 发表于 11-04 15:14 598次阅读
    <b class='flag-5'>角度</b>传感器原理、技术与实用指南

    传音斩获WMT 2025国际机器翻译大赛四项冠军

    近日,在由国际计算语言学协会(ACL)主办的WMT 2025国际机器翻译大赛中,传音在低资源印度语言翻译任务(Low-Resource Indic Language Translation)中斩获
    的头像 发表于 08-06 18:21 1341次阅读

    外置磁编芯片获得的角度数据如何传给电机电角度

    我想用FU6861做定位控制,外置磁编芯片,想通过FU6861的SPI获取磁编芯片的角度数据,传给电机的电角度,不只是是哪个寄存器,图片所示的FOC_THETA 寄存器是不是啊,
    发表于 08-05 13:36

    从不同的角度探讨一次消谐装置存在的价值!

    绕组处接入特定的阻尼电阻,改变谐振的条件,从而抑制谐振的发生。从原理上来说,它是一种基于阻尼原理的保护装置,通过消耗谐振能量达到消谐的目的。 二、从功能角度看 保护设备:一次消谐装置能够有效防止电压互感器因铁磁
    的头像 发表于 07-24 09:40 719次阅读

    MT6701 磁性角度编码器 IC:引领机器人控制技术创新

    之一,其性能的优劣直接影响着机器人的控制精度和运行稳定性。MT6701 磁性角度编码器 IC 凭借其卓越的性能,正引领着机器人控制技术的创新潮流。
    的头像 发表于 07-18 17:02 966次阅读

    MT6701高速磁性角度编码器芯片引领机器人行业创新与突破

    在科技飞速发展的今天,机器人已经逐渐走进我们的生活,从工业生产线上的机械臂到家庭服务型机器人,它们的身影无处不在。而在机器人的众多核心组件中,编码器芯片起着至关重要的作用。今天,我们就来聊聊一款具有开创性意义的产品——MT670
    的头像 发表于 07-16 16:36 877次阅读
    MT6701高速磁性<b class='flag-5'>角度</b>编码器芯片引领<b class='flag-5'>机器</b>人行业创新与突破

    工厂里的 “超级翻译官”—— 工业网关有多牛?​

    的 “多面手”,堪称工业界的 “万能翻译 + 数据快递员 + 安全卫士”,今天就来揭秘它的超能力。 会说 N 种 “方言” 的翻译大师 工业设备们就像来自不同国家的工人,各说各的 “方言”:PLC 爱用 Modbus 协议,机器
    的头像 发表于 07-11 17:58 710次阅读