0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook采用无监督机器学习翻译其平台上内容

EdXK_AI_News 来源:未知 作者:工程师曾玲 2018-10-02 17:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

【概要】脸书公司开始使用无监督机器学习来为其用户提供翻译服务。

由于缺少从一种语言到另一种语言的很多翻译示例——例如从英语到乌尔都语(Urdu),Facebook(脸书)公司已经开始使用无监督的机器学习来翻译其平台上的内容。

Facebook人工智能研究院(FacebookAI Research,FAIR)巴黎实验室的主任Antoine Bordes表示:该方法由FAIR设计,并由FAIR和Facebook的应用机器学习部门合作用于其平台。在实验中,该方法的表现与经过10万次翻译训练的有监督模型相当,并且在翻译示例很少的情况下,其表现优于Facebook的语言匹配系统。Bordes说:“当你处理像英语到乌尔都语这样的案例很少的翻译任务时,我们系统的表现超过了有监督的系统。因此,在没有足够数据的时候,训练无监督系统比有监督系统更好。”

由Facebook人工智能研究人员Guillaume Lample和Marc'Aurelio Ranzato领导的这项工作的成果将于今年秋季在EMNLP 2018上公布。作为FAIR的一名老员工,Bordes表示这项研究是他见过的最好的翻译系统。Bordes说:“我们现在可以去一个使用未知语言的星球—或者说,跟外星人交谈—你可以尝试对他们所说的内容进行合理的翻译。你也可以从一本古老的手稿上找到尚未破译的语言,你可以真正了解它的含义,因此这项工作真的在这些方面取得了突破,而这就是我如此兴奋的原因。”

与FAIR的其他项目一样,该AI系统将是开源的,可以在GitHub上下载。今年早些时候,Facebook将Translate做了开源,这是目前Facebook用来辅助翻译的人工智能系统。Translate等系统需要大量的标记数据。例如,完成从法语到英语的翻译需要数百万个样本句子来创建一个能够理解这两种语言的系统。因此,在缺少翻译示例时,翻译工作是非常困难的。

当前用于处理这种案例的人工智能系统结合了三个要素:逐字翻译、语言模型和反向翻译。逐字翻译的训练原理为:根据一个句子中某个字的前面五个单词和后面五个单词来推测其上下文含义,然后对该单词进行预测。这个嵌入词语的方法是在2017年秋天Lample和Ranzato共同撰写的一篇论文中提出的。然后,使用大量数据(如书籍或其他书面文本)训练的语言模型被用于按照英语或乌尔都语使用者能够理解的结构来安排句子。最后,使用反向翻译来改进通过逐字翻译和语言模型获得的翻译结果。这些方法并不新鲜,但三者的结合的确是有效的。

Bordes称:“使用这两个系统,并在两种语言之间进行双向翻译,我可以将它们进行同时训练以获得相互促进,所以真正核心思想是使用这些词语(翻译模型),利用该语言模型做第一次翻译,然后用反向翻译的方法尝试进行改进。”

Facebook将在未来探索将这种人工智能系统用于其他形式的翻译,但需要更多的数据,并需要与专业翻译人员合作来验证结果。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    58356
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236

原文标题:脸书采用无监督机器学习提供翻译服务

文章出处:【微信号:AI_News,微信公众号:人工智能快报】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    、GPU加速训练(可选) 双轨教学:传统视觉算法+深度学习方案全覆盖 轻量化部署:8.6M超轻OCR模型,适合嵌入式设备集成 监督学习:无需缺陷样本即可训练高精度检测模型 持续更新:课程内容
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战可(11大系列课程,共5000+分钟)

    23.5%。本次团购旨在帮助工程师把握三大技术趋势: 监督学习普及 当前工业场景中80%的缺陷检测项目面临\"OK样本充足而NG样本稀缺\"的困境,传统监督学习方案难以落地。课程
    发表于 12-03 13:50

    传音斩获WMT 2025国际机器翻译大赛四项冠军

    近日,在由国际计算语言学协会(ACL)主办的WMT 2025国际机器翻译大赛中,传音在低资源印度语言翻译任务(Low-Resource Indic Language Translation)中斩获
    的头像 发表于 08-06 18:21 1056次阅读

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    。 持续进修与专业培训 参加线上课程平台学习,如Coursera、edX等。这些平台上有许多知名大学和机构提供的AI相关课程,例如斯坦福大学的机器
    发表于 07-08 17:44

    刷直流电机单神经元自适应智能控制系统

    摘要:针对刷直流电机(BLDCM)设计了一种可在线学习的单神经元自适应比例-积分-微分(PID)智能控制器,通过有监督的 Hebb学习规则调整权值,每次采样根据反馈误差对神经元权值进
    发表于 06-26 13:36

    机器学习异常检测实战:用Isolation Forest快速构建标签异常检测系统

    本文转自:DeepHubIMBA监督异常检测作为机器学习领域的重要分支,专门用于在缺乏标记数据的环境中识别异常事件。本文深入探讨异常检测技术的理论基础与实践应用,通过Isolatio
    的头像 发表于 06-24 11:40 1202次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>异常检测实战:用Isolation Forest快速构建<b class='flag-5'>无</b>标签异常检测系统

    能在Meteor Lake平台上使用SDK 3.5吗?

    SDK 是 3.6 版,不支持 CYPD6127 部件。 那么,我能在 Meteor Lake 平台上使用 SDK 3.5 吗?
    发表于 05-26 08:01

    使用MATLAB进行监督学习

    监督学习是一种根据未标注数据进行推断的机器学习方法。监督学习旨在识别数据中隐藏的模式和关系,
    的头像 发表于 05-16 14:48 1179次阅读
    使用MATLAB进行<b class='flag-5'>无</b><b class='flag-5'>监督学习</b>

    盘点#机器人开发平台

    Athena机器人****开发平台思岚推出Athena机器人开发平台,有望主导机器人开发平台未来
    发表于 05-13 15:02

    在任何平台上使用PetaLinux的先决条件

    本篇文章介绍了在任何平台上使用 PetaLinux 的先决条件。PetaLinux 是一种嵌入式 Linux 软件开发套件 (SDK),主要用于基于 FPGA 的系统级芯片 (SoC) 设计或 FPGA 设计。
    的头像 发表于 04-24 10:40 1209次阅读
    在任何<b class='flag-5'>平台上</b>使用PetaLinux的先决条件

    面向AI与机器学习应用的开发平台 AMD/Xilinx Versal™ AI Edge VEK280

    AMD/Xilinx Versal™ AI Edge VEK280评估套件是一款面向AI与机器学习应用的开发平台,专为边缘计算场景优化设计。以下从核心配置、技术特性、应用场景及开发支持等方面进行详细
    的头像 发表于 04-11 18:33 2036次阅读
    面向AI与<b class='flag-5'>机器</b><b class='flag-5'>学习</b>应用的开发<b class='flag-5'>平台</b> AMD/Xilinx Versal™ AI Edge VEK280

    如何排除深度学习工作台上量化OpenVINO™的特定层?

    无法确定如何排除要在深度学习工作台上量化OpenVINO™特定层
    发表于 03-06 07:31

    名单公布!【书籍评测活动NO.58】ROS 2智能机器人开发实践

    万开发者走上 ROS 机器人开发之路,其中不乏现今机器人行业的众多中流砥柱。 如今,为了帮助大家更好地学习ROS,全面系统地了解下一个可能的计算平台,为迎接智能
    发表于 03-03 14:18

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生
    的头像 发表于 12-25 11:54 700次阅读

    构建云原生机器学习平台流程

    构建云原生机器学习平台是一个复杂而系统的过程,涉及数据收集、处理、特征提取、模型训练、评估、部署和监控等多个环节。
    的头像 发表于 12-14 10:34 676次阅读