0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook采用无监督机器学习翻译其平台上内容

EdXK_AI_News 来源:未知 作者:工程师曾玲 2018-10-02 17:36 次阅读

【概要】脸书公司开始使用无监督机器学习来为其用户提供翻译服务。

由于缺少从一种语言到另一种语言的很多翻译示例——例如从英语到乌尔都语(Urdu),Facebook(脸书)公司已经开始使用无监督的机器学习来翻译其平台上的内容。

Facebook人工智能研究院(FacebookAI Research,FAIR)巴黎实验室的主任Antoine Bordes表示:该方法由FAIR设计,并由FAIR和Facebook的应用机器学习部门合作用于其平台。在实验中,该方法的表现与经过10万次翻译训练的有监督模型相当,并且在翻译示例很少的情况下,其表现优于Facebook的语言匹配系统。Bordes说:“当你处理像英语到乌尔都语这样的案例很少的翻译任务时,我们系统的表现超过了有监督的系统。因此,在没有足够数据的时候,训练无监督系统比有监督系统更好。”

由Facebook人工智能研究人员Guillaume Lample和Marc'Aurelio Ranzato领导的这项工作的成果将于今年秋季在EMNLP 2018上公布。作为FAIR的一名老员工,Bordes表示这项研究是他见过的最好的翻译系统。Bordes说:“我们现在可以去一个使用未知语言的星球—或者说,跟外星人交谈—你可以尝试对他们所说的内容进行合理的翻译。你也可以从一本古老的手稿上找到尚未破译的语言,你可以真正了解它的含义,因此这项工作真的在这些方面取得了突破,而这就是我如此兴奋的原因。”

与FAIR的其他项目一样,该AI系统将是开源的,可以在GitHub上下载。今年早些时候,Facebook将Translate做了开源,这是目前Facebook用来辅助翻译的人工智能系统。Translate等系统需要大量的标记数据。例如,完成从法语到英语的翻译需要数百万个样本句子来创建一个能够理解这两种语言的系统。因此,在缺少翻译示例时,翻译工作是非常困难的。

当前用于处理这种案例的人工智能系统结合了三个要素:逐字翻译、语言模型和反向翻译。逐字翻译的训练原理为:根据一个句子中某个字的前面五个单词和后面五个单词来推测其上下文含义,然后对该单词进行预测。这个嵌入词语的方法是在2017年秋天Lample和Ranzato共同撰写的一篇论文中提出的。然后,使用大量数据(如书籍或其他书面文本)训练的语言模型被用于按照英语或乌尔都语使用者能够理解的结构来安排句子。最后,使用反向翻译来改进通过逐字翻译和语言模型获得的翻译结果。这些方法并不新鲜,但三者的结合的确是有效的。

Bordes称:“使用这两个系统,并在两种语言之间进行双向翻译,我可以将它们进行同时训练以获得相互促进,所以真正核心思想是使用这些词语(翻译模型),利用该语言模型做第一次翻译,然后用反向翻译的方法尝试进行改进。”

Facebook将在未来探索将这种人工智能系统用于其他形式的翻译,但需要更多的数据,并需要与专业翻译人员合作来验证结果。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Facebook
    +关注

    关注

    3

    文章

    1427

    浏览量

    54027
  • 机器学习
    +关注

    关注

    66

    文章

    8112

    浏览量

    130544

原文标题:脸书采用无监督机器学习提供翻译服务

文章出处:【微信号:AI_News,微信公众号:人工智能快报】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    能在Meteor Lake平台上使用SDK 3.5吗?

    SDK 是 3.6 版,不支持 CYPD6127 部件。 那么,我能在 Meteor Lake 平台上使用 SDK 3.5 吗? SDK 3.5 - 平台选择有"MTL" 关键字 :
    发表于 03-04 06:32

    深度学习的由来 深度学习的经典算法有哪些

    深度学习作为机器学习的一个分支,其学习方法可以分为监督学习和无监督学习。两种方法都具有其独特的
    发表于 10-09 10:23 354次阅读
    深度<b class='flag-5'>学习</b>的由来 深度<b class='flag-5'>学习</b>的经典算法有哪些

    Sentry ND网络防御:实时无监督机器学习解决方案

    电子发烧友网站提供《Sentry ND网络防御:实时无监督机器学习解决方案.pdf》资料免费下载
    发表于 09-13 10:19 0次下载
    Sentry ND网络防御:实时无<b class='flag-5'>监督</b><b class='flag-5'>机器</b><b class='flag-5'>学习</b>解决方案

    机器学习模型评估指标

    机器学习模型指标在机器学习建模过程中,针对不同的问题,需采用不同的模型评估指标。
    发表于 09-06 12:51 445次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>模型评估指标

    机器学习模型类型分类

     机器学习按照模型类型分为监督学习模型、无监督学习模型两大类。 1. 有监督学习监督学习通常
    的头像 发表于 09-05 11:45 1334次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>模型类型分类

    如何使用机器学习在M480上执行关键字识别

    一个完整的深层学习语音识别系统需要两个平台。 一个是PC平台。 用户可以用Tensorplow 和 Python 来编程深层学习代码并培训模型。 由于对培训模式的
    发表于 08-29 06:46

    使用机器学习在M480上执行关键字识别

    一个完整的深层学习语音识别系统需要两个平台。 一个是PC平台。 用户可以用Tensorplow 和 Python 来编程深层学习代码并培训模型。 由于对培训模式的
    发表于 08-22 08:02

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?

    有许多不同的类型和应用。根据机器学习的任务类型,可以将其分为几种不同的算法类型。本文将介绍机器学习的算法类型以及分类算法和预测算法。 机器
    的头像 发表于 08-17 16:30 1388次阅读

    机器学习算法总结 机器学习算法是什么 机器学习算法优缺点

    对数据的学习和分析,机器学习能够自动发现数据中的规律和模式,进而预测未来的趋势。 机器学习算法优缺点
    的头像 发表于 08-17 16:11 1063次阅读

    机器学习和深度学习的区别

    的区别。 1. 机器学习 机器学习是指通过数据使机器能够自动地学习和改进性能的算法。
    的头像 发表于 08-17 16:11 3370次阅读

    机器翻译研究进展

    成为主流,如神经网络机器翻译。神经网络机器翻译机器从大量数据中自动学习翻译知识,而不依靠人类专家撰写规则,可以显著提升
    的头像 发表于 07-06 11:19 411次阅读
    <b class='flag-5'>机器翻译</b>研究进展

    如何部署ML模型到Google云平台

    实践中的机器学习:在 Google 云平台上部署 ML 模型
    的头像 发表于 07-05 16:30 420次阅读
    如何部署ML模型到Google云<b class='flag-5'>平台</b>

    060. 任务60:机器翻译 #硬声创作季

    机器翻译深度学习
    充八万
    发布于 :2023年06月21日 18:04:57

    如何在Layerscape平台上启用5G模块?

    想在 Layerscape 平台上使用 5G 模组?随附的应用说明将帮助您做到这一点。 该 AN 将帮助您: 1.在Layerscape平台上设置5G环境 2. 将 5G 模块连接
    发表于 05-17 06:24

    机器学习步骤详解,一文了解全过程

    机器学习是指在没有明确指令的情况下能够学习和加以改进的系统。这些系统从数据中学习,用于执行特定的任务或功能。在某些情况下,学习,或者更具体地
    的头像 发表于 05-16 09:55 4133次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>步骤详解,一文了解全过程