0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook采用无监督机器学习翻译其平台上内容

EdXK_AI_News 来源:未知 作者:工程师曾玲 2018-10-02 17:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

【概要】脸书公司开始使用无监督机器学习来为其用户提供翻译服务。

由于缺少从一种语言到另一种语言的很多翻译示例——例如从英语到乌尔都语(Urdu),Facebook(脸书)公司已经开始使用无监督的机器学习来翻译其平台上的内容。

Facebook人工智能研究院(FacebookAI Research,FAIR)巴黎实验室的主任Antoine Bordes表示:该方法由FAIR设计,并由FAIR和Facebook的应用机器学习部门合作用于其平台。在实验中,该方法的表现与经过10万次翻译训练的有监督模型相当,并且在翻译示例很少的情况下,其表现优于Facebook的语言匹配系统。Bordes说:“当你处理像英语到乌尔都语这样的案例很少的翻译任务时,我们系统的表现超过了有监督的系统。因此,在没有足够数据的时候,训练无监督系统比有监督系统更好。”

由Facebook人工智能研究人员Guillaume Lample和Marc'Aurelio Ranzato领导的这项工作的成果将于今年秋季在EMNLP 2018上公布。作为FAIR的一名老员工,Bordes表示这项研究是他见过的最好的翻译系统。Bordes说:“我们现在可以去一个使用未知语言的星球—或者说,跟外星人交谈—你可以尝试对他们所说的内容进行合理的翻译。你也可以从一本古老的手稿上找到尚未破译的语言,你可以真正了解它的含义,因此这项工作真的在这些方面取得了突破,而这就是我如此兴奋的原因。”

与FAIR的其他项目一样,该AI系统将是开源的,可以在GitHub上下载。今年早些时候,Facebook将Translate做了开源,这是目前Facebook用来辅助翻译的人工智能系统。Translate等系统需要大量的标记数据。例如,完成从法语到英语的翻译需要数百万个样本句子来创建一个能够理解这两种语言的系统。因此,在缺少翻译示例时,翻译工作是非常困难的。

当前用于处理这种案例的人工智能系统结合了三个要素:逐字翻译、语言模型和反向翻译。逐字翻译的训练原理为:根据一个句子中某个字的前面五个单词和后面五个单词来推测其上下文含义,然后对该单词进行预测。这个嵌入词语的方法是在2017年秋天Lample和Ranzato共同撰写的一篇论文中提出的。然后,使用大量数据(如书籍或其他书面文本)训练的语言模型被用于按照英语或乌尔都语使用者能够理解的结构来安排句子。最后,使用反向翻译来改进通过逐字翻译和语言模型获得的翻译结果。这些方法并不新鲜,但三者的结合的确是有效的。

Bordes称:“使用这两个系统,并在两种语言之间进行双向翻译,我可以将它们进行同时训练以获得相互促进,所以真正核心思想是使用这些词语(翻译模型),利用该语言模型做第一次翻译,然后用反向翻译的方法尝试进行改进。”

Facebook将在未来探索将这种人工智能系统用于其他形式的翻译,但需要更多的数据,并需要与专业翻译人员合作来验证结果。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    59344
  • 机器学习
    +关注

    关注

    67

    文章

    8562

    浏览量

    137208

原文标题:脸书采用无监督机器学习提供翻译服务

文章出处:【微信号:AI_News,微信公众号:人工智能快报】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    强化学习会让自动驾驶模型学习更快吗?

    是一种让机器通过“试错”学会决策的办法。与监督学习不同,监督学习是有人提供示范答案,让模型去模仿;而强化学习不会把每一步的“正确答案”都告诉你,而是把环境、动作和结果连起来,让
    的头像 发表于 01-31 09:34 821次阅读
    强化<b class='flag-5'>学习</b>会让自动驾驶模型<b class='flag-5'>学习</b>更快吗?

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    、GPU加速训练(可选) 双轨教学:传统视觉算法+深度学习方案全覆盖 轻量化部署:8.6M超轻OCR模型,适合嵌入式设备集成 监督学习:无需缺陷样本即可训练高精度检测模型 持续更新:课程内容
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课程(11大系列课程,共5000+分钟)

    、GPU加速训练(可选) 双轨教学:传统视觉算法+深度学习方案全覆盖 轻量化部署:8.6M超轻OCR模型,适合嵌入式设备集成 监督学习:无需缺陷样本即可训练高精度检测模型 持续更新:课程内容
    发表于 12-03 13:50

    在NVIDIA DGX Spark平台上对NVIDIA ConnectX-7 200G网卡配置教程

    在 NVIDIA DGX Spark 平台上对 NVIDIA ConnectX-7 200G 网卡进行配置时,会遇到“4 个逻辑端口”现象。理解背后的真相是后续所有配置的基础。本文将从此现象入手,逐步解析原理,并提供从基础配置到深度性能验证的完整流程。
    的头像 发表于 11-21 09:19 6011次阅读
    在NVIDIA DGX Spark<b class='flag-5'>平台上</b>对NVIDIA ConnectX-7 200G网卡配置教程

    如何把蜂鸟E203的核移植在N4DDR平台上

    请问一下我想把蜂鸟E203的核移植在N4DDR平台上,但是他们的约束文件及硬件电路区别很大,具体我该怎么修改呢?比如蜂鸟的核中只有4个拨码开关而N4DDR上有16个拨码开关。
    发表于 11-10 06:46

    传音斩获WMT 2025国际机器翻译大赛四项冠军

    近日,在由国际计算语言学协会(ACL)主办的WMT 2025国际机器翻译大赛中,传音在低资源印度语言翻译任务(Low-Resource Indic Language Translation)中斩获
    的头像 发表于 08-06 18:21 1329次阅读

    电感法辨识刷直流电机转子初始位置研究

    摘 要:针对应用在不能反转场合采用位置控制技术的刷直流电机,分析了绕组等效电感和转子初始位置的关系。设计了一套通过注入检测电压矢量,比较对应母线电流大小关系来确定转子初始位置的方
    发表于 07-24 11:53

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3086次阅读

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    。 持续进修与专业培训 参加线上课程平台学习,如Coursera、edX等。这些平台上有许多知名大学和机构提供的AI相关课程,例如斯坦福大学的机器
    发表于 07-08 17:44

    刷直流电机单神经元自适应智能控制系统

    摘要:针对刷直流电机(BLDCM)设计了一种可在线学习的单神经元自适应比例-积分-微分(PID)智能控制器,通过有监督的 Hebb学习规则调整权值,每次采样根据反馈误差对神经元权值进
    发表于 06-26 13:36

    机器学习异常检测实战:用Isolation Forest快速构建标签异常检测系统

    本文转自:DeepHubIMBA监督异常检测作为机器学习领域的重要分支,专门用于在缺乏标记数据的环境中识别异常事件。本文深入探讨异常检测技术的理论基础与实践应用,通过Isolatio
    的头像 发表于 06-24 11:40 1596次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>异常检测实战:用Isolation Forest快速构建<b class='flag-5'>无</b>标签异常检测系统

    能在Meteor Lake平台上使用SDK 3.5吗?

    SDK 是 3.6 版,不支持 CYPD6127 部件。 那么,我能在 Meteor Lake 平台上使用 SDK 3.5 吗?
    发表于 05-26 08:01

    使用MATLAB进行监督学习

    监督学习是一种根据未标注数据进行推断的机器学习方法。监督学习旨在识别数据中隐藏的模式和关系,
    的头像 发表于 05-16 14:48 1593次阅读
    使用MATLAB进行<b class='flag-5'>无</b><b class='flag-5'>监督学习</b>

    盘点#机器人开发平台

    Athena机器人****开发平台思岚推出Athena机器人开发平台,有望主导机器人开发平台未来
    发表于 05-13 15:02

    在任何平台上使用PetaLinux的先决条件

    本篇文章介绍了在任何平台上使用 PetaLinux 的先决条件。PetaLinux 是一种嵌入式 Linux 软件开发套件 (SDK),主要用于基于 FPGA 的系统级芯片 (SoC) 设计或 FPGA 设计。
    的头像 发表于 04-24 10:40 1724次阅读
    在任何<b class='flag-5'>平台上</b>使用PetaLinux的先决条件