0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器翻译的真实水平如何,梦想与现实的距离到底有多远?

mK5P_AItists 来源:lp 2019-03-22 14:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摘要:近年来,机器翻译等语言智能技术迅猛发展,语言智能技术落地、机器翻译替代人工、外语教育存废、外语教学改革等,成为社会热议话题。外语教育如何将语言智能的挑战作为转型的契机更好发展?怎样理性认识语言智能技术的发展未来?聚焦"语言智能与外语教育协同发展",自动化所宗成庆研究员这样说......

如何突破语言障碍,让机器完成不同语言之间的自动翻译,最终实现任意时间、任意地点、任意语言之间的无障碍自由通信,是人类长期以来的梦想。

近年来,随着计算机性能的提高,云计算、大数据和机器学习等相关技术迅速发展,人工智能再度崛起,机器翻译重新成为人们关注的焦点。一时间,机器翻译系统如雨后春笋般涌现,各种报道随之呈井喷式爆发,"机器翻译将取代人类"的说法也时有耳闻。然而,机器翻译的真实水平如何,梦想与现实的距离到底有多远?

从低迷到兴盛

机器翻译概念于1947年被提出,随后成为人工智能研究的核心问题。在70多年的发展历程中,机器翻译研究经历了几个不同的历史阶段:

从概念提出到1954年美国乔治敦大学(GeorgetownUniversity)在IBM公司的帮助下实现第一个机器翻译演示系统,可以认为是机器翻译的初创时期。

1966年,美国国家科学院语言自动处理咨询委员会(AutomaticLanguageProcessingAdvisoryCommittee,ALPAC)发布题为《语言与机器》的报告,宣称"目前给机器翻译研究以大力支持没有太多的理由","机器翻译遇到了难以克服的语义障碍",从而导致机器翻译研究在世界范围内走向低迷。

20世纪70年代中后期至80年代前期,部分机器翻译系统在特定领域得到初步应用(如加拿大蒙特利尔大学研制的天气预报翻译系统TAUM-METEO)。欧洲共同体实施的欧洲翻译体系(EuropeanTranslationSystem,EUROTRA)计划和日本对第五代计算机的研究都对机器翻译研究给予了支持,机器翻译研究开始复苏。

20世纪80年代末期,IBM公司实现了基于噪声信道模型的统计机器翻译系统,并在美国国防部高级研究计划署(ARPA)组织的评测中取得了较好成绩,推动了机器翻译技术的快速发展。尤其进入2000年之后,GIZA++、Pharaoh、Moses等一批开源工具相继发布,2006年谷歌翻译正式上线运行,2011年百度翻译上线,各大公司陆续推出了自己的翻译系统,整个机器翻译领域呈现出蓬勃发展、遍地开花的大好局面。

2013年基于神经网络模型的机器翻译(简称"神经机器翻译")方法被提出,机器译文的质量得到大幅提升,并且很多开源工具被相继公布,机器翻译技术研究和系统推广应用均出现前所未有的盛况。统计机器翻译和神经机器翻译的基本原理都是基于已有的大规模句子级双语对照语料进行模型训练,建立最优的翻译模型,最终实现从一种语言到另一种语言的翻译。通常情况下,用于训练模型的语料规模越大,模型性能表现就越好。

被夸大的技术

机器翻译技术的进步和系统性能的提升在为人们日常生活和工作带来更多便利的同时,也为该技术的产业化发展带来了更多商机。这种空前局面不仅让人们看到了梦想成真的希望,也点燃了部分人心中按捺不住的欲望。从传统媒体到新媒体,对机器翻译技术夸大宣传的声音不绝于耳,但一个不可否认的事实却是,目前的机器翻译技术尚不成熟,无论是文本翻译,还是口语翻译,机器翻译的质量远没有达到令人满意的水平。

当前所有的商用文本机器翻译系统普遍存在的问题:

一是错翻、漏翻和重复翻译比比皆是,尤其对成语、缩略语、专业术语和人名、地名、组织机构名称等的翻译更是招数无几。

二是难以实现篇章范围内的指代消解,常常张冠李戴,例如,前面说的是美国与伊朗之间的事情,后面翻译"美伊两国"时却译成了美国与伊拉克。

三是缺乏足够的在线优化能力,无法从译员修改译文的过程中自动学习和更新翻译知识,即使译员对系统给出的某个错误译文反复修改,系统依然照错不误。

四是对口语而言,说话人的语气、重音、语调,甚至肢体语言无法得到充分利用,尤其当说话人的口音较重、用词过于生僻、话语主题超出先验知识范围时,译文的质量无法保障。

高端翻译不可取代

我们并不否认机器翻译技术的进步,正如前文所述,机器译文的质量已有显著改善。在日常口语对话中,对于资源较为充分的语言(如英汉、日汉等),在说话场景不是非常复杂、口音基本标准、语速基本正常、使用词汇和句型不是非常生僻的情况下,口语翻译的性能基本可满足正常交流的需要。专业领域的文本机器翻译在训练语料较为充分时,译文准确率可达到80%以上。而对于资源匮乏的语言之间的翻译(如波斯语或达利语等与汉语之间的翻译),译文质量还十分有限。

毋庸置疑,机器翻译可能替代那些任务重复性较大、翻译难度较低的低端翻译人员,如天气预报查询、旅馆预订服务、交通信息咨询等翻译,但不可能取代高端翻译(如重要文献、伟人著作、文学名著等翻译)人员,更不可能消除翻译职业。"信、达、雅"是翻译的终极目标,我们可以预期,未来的机器翻译系统能够辅助高端翻译人员提高翻译效率,但要实现无须人工干预的高质量全自动翻译恐怕还是一个愿望。

不得不说的是,任何负责任的科学家和企业界都有责任和义务把技术或产品的真实水平和性能告知公众,而不是一味地宣扬,甚至为了利益而故弄玄虚。实事求是是一种态度,也是一种品格。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动化
    +关注

    关注

    31

    文章

    5984

    浏览量

    90664
  • 机器学习
    +关注

    关注

    67

    文章

    8565

    浏览量

    137226
  • 机器翻译
    +关注

    关注

    0

    文章

    141

    浏览量

    15555

原文标题:机器翻译技术现状评述与展望 | 行业观察

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    户外广告机夏天死机?智能温控风冷散热到底有用吗?

    户外广告机夏天死机?智能温控风冷散热到底有用吗?入夏之后,气温一天比一天高。不少做户外广告的老板都遇到过同一个糟心问题:好好的户外数字标牌,一到中午高温就死机,重启好几次才能好,有时候干脆直接罢工
    的头像 发表于 04-02 16:06 130次阅读
    户外广告机夏天死机?智能温控风冷散热<b class='flag-5'>到底有</b>用吗?

    到底有多小?

    想知道硅到底有多小;CPU 并不比 Wii 上的百老汇芯片大,但功能却无限强大,哈哈。
    发表于 03-25 06:51

    5G SA和NSA到底有啥不一样

    平时刷手机,只要稍微留意过 5G 设备或者运营商的信息,SA 和 NSA 这两个词应该不陌生。大家也知道它们跟 5G 有关,但真要问起它俩到底有什么区别,好像一下子也说不太明白。
    的头像 发表于 03-14 14:10 2514次阅读

    PCB加工中的“流胶”到底是怎么影响阻抗的?

    是好事,高速先生支持每一个梦想的人。但是光有梦想肯定控不好阻抗,高速先生一定会把你们摇醒,让你们好好思考下到底有什么因素会影响加工的阻抗误差哈! 影响阻抗的因素有很多,高速先生之前
    发表于 12-23 10:14

    1Mbps的CAN协议传输距离突破至66m,中间只需加一个CSM330A

    想知道1Mbps的CAN协议能传多远?今天用CSM330A实测告诉你,还能教你用中继模组轻松翻倍传输距离!实验背景在工业和汽车电子领域,CAN协议因其高可靠性和灵活性被广泛应用。然而,随着传输距离
    的头像 发表于 12-17 11:39 1197次阅读
    1Mbps的CAN协议传输<b class='flag-5'>距离</b>突破至66m,中间只需加一个CSM330A

    自动驾驶中毫米波雷达到底有何作用?

    毫米波雷达、超声波雷达等感知硬件,更像是一个配角,成为自动驾驶技术实现的辅助硬件。那在自动驾驶中毫米波雷达到底有何作用?
    的头像 发表于 12-10 17:07 2063次阅读
    自动驾驶中毫米波雷达<b class='flag-5'>到底有</b>何作用?

    电能质量在线监测装置测温功能的远程查看功能的通信距离多远

    电能质量在线监测装置测温功能的远程查看通信距离, 取决于所采用的通信方式 ,从 数十米到全球覆盖 不等。以下是各类主流通信方式的具体距离范围及影响因素: 一、主流通信方式与距离范围 通信类型 具体
    的头像 发表于 12-10 11:33 585次阅读
    电能质量在线监测装置测温功能的远程查看功能的通信<b class='flag-5'>距离</b><b class='flag-5'>有</b><b class='flag-5'>多远</b>?

    请问CW32R031一般距离能设计到多远

    CW32R031一般距离能设计到多远?这种支持1连多么?
    发表于 12-09 08:08

    视美泰发布AI即时翻译机解决方案,硬核配置+多语种覆盖破解跨语言沟通难题

    机器翻译、语音合成和大模型四项能力构建高效同声传译链路,实现70+种语言全覆盖的强大能力,为跨境商贸、文化交流、户外出行等场景提供高效精准的翻译解决方案,推动AI翻
    的头像 发表于 12-03 10:50 1272次阅读
    视美泰发布AI即时<b class='flag-5'>翻译</b>机解决方案,硬核配置+多语种覆盖破解跨语言沟通难题

    汉威科技薄膜铂电阻温度传感器到底有多强

    测量温度简单吗?简单却也不简单,为了测得准,人类已经努力了上千年!薄膜铂电阻温度传感器到底有多强?为何是高端温度传感器的代表?
    的头像 发表于 11-28 11:51 1005次阅读

    TFT显示模组什么功能

    是细问它到底有哪些功能特点,不少人可能就说不上来了,那接下来咱们就一起聊聊 TFT 显示模组到底有哪些关键功能。
    的头像 发表于 08-27 10:59 874次阅读
    TFT显示模组<b class='flag-5'>有</b>什么功能

    电磁干扰“江湖三兄弟”:EMC、EMI、EMS 到底有啥区别?

    电磁干扰“江湖三兄弟”:EMC、EMI、EMS 到底有啥区别?
    的头像 发表于 08-20 15:16 3075次阅读
    电磁干扰“江湖三兄弟”:EMC、EMI、EMS <b class='flag-5'>到底有</b>啥区别?

    传音斩获WMT 2025国际机器翻译大赛四项冠军

    近日,在由国际计算语言学协会(ACL)主办的WMT 2025国际机器翻译大赛中,传音在低资源印度语言翻译任务(Low-Resource Indic Language Translation)中斩获
    的头像 发表于 08-06 18:21 1341次阅读

    漫画科普 | 功率放大器到底有哪些应用?带你解锁功放经典应用场景!(一)

    漫画科普 | 功率放大器到底有哪些应用?带你解锁功放经典应用场景!(一)
    的头像 发表于 06-20 20:00 1119次阅读
    漫画科普 | 功率放大器<b class='flag-5'>到底有</b>哪些应用?带你解锁功放经典应用场景!(一)

    实测 PTR54LS05低功耗到底有多低

    实测 PTR54LS05低功耗到底有多低?
    发表于 04-27 10:57