0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook 2018 AI研究全回顾

nlfO_thejiangme 来源:lq 2019-01-11 09:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在过去的一年,Facebook经历了很多波折和困难,但是在研究方面依旧涌现出了很多高质量的工作。近日,Facebook发文总结了去年在长期研究项目、高性能工具开发和平台开发以及AI的实际应用等各个方面的工作。

随着研究和工程实践的深入,实现了更强大的智能系统、更优秀的开源工具、更稳定高效的开源平台,诸多的研究论文和模型代码为深度学习研究做出了众多贡献。同时,还将AI应用到了医学和社会生活等领域,让技术真正造福人类。那么,就让我们一起看下这些工作都有哪些吧!

基于半监督和无监督学习的先进AI技术

实现人类水平的人工智能是每个从业者和研究人员最终的目标。在过去的一年,Facebook的研究人员利用更少的数据实现了更复杂的功能,让人工智能的目标又近了一步。目前大多数机器学习都基于大量标记数据通过监督学习的方式来实现特定的任务,但耗时的数据标记工作极大地限制了技术的发展。所以如何充分释放半监督和无监督学习的潜力,减少智能系统对于数据量的需求至关重要。在多语言理解和翻译系统中,研究人员提出一种新的方法,基于无监督数据实现自然机器翻译模型自动训练迁移,并达到了与监督数据相比拟的效果。通过减少对于大规模标记数据的依赖,这一系统打开了向更多语言迁移的技术大门,甚至可以用于像乌尔都语一样标记数据十分有限的语言。

多种语言的二维词向量嵌入空间可以通过简单的变换实现匹配。

此外,对于数据集资源有限的语言来说,需要用多种技术手段来实现。使用多语言模型融合同一语系多种方言间的相似性。通过多种技术的综合,研究人员在自动翻译系统中成功的新增了24种语言。同时在与纽约大学的合作中,在MutilNLI数据集中新增了14中语言,将有效助力自然语言理解的研究进程。同时,还发布了跨语言推理数据集XNLI,其中包括了乌尔都语和斯瓦希里语两种小语种。利用半监督和非监督的方式有效减少了对于监督训练数据的需求。研究人员还探索了数据监督的方式,结合监督和非监督数据,通过数据蒸馏的方法实现半监督学习。另外值得一提的是,研究人员探索了基于图像标签的图像识别系统,创造性的利用现存的、非传统标注的数据生成了大规模的自标记训练数据集,其中包括了35亿张来自Instagram的图像。用户为照片标记的标签可以为图像提供更为丰富的信息,将现存的图像转变为弱监督数据样本。结果表明,这些手段不仅有效地提升了基于图像的任务表现,更将图像识别模型的准确率推高了1%。

图像标签可帮助计算机学习到比通常分类更为细的子分类信息,并补充图中元素的信息。

加速AI研究产品化进程

AI作为一种基础能力已经在产品的方方面面得到体现。2018年Facebook最主要的工作也集中在如何将AI方面的研究成果尽可能的产品化并部署到系统中,主要体现在PyTroch平台和一系列工具的开发上。PyTroch自2018年发布以来已经跃居为GitHub上增长第二的开源项目。其灵活的接口对于研究AI研究的快速迭代十分友好,同时开源的框架设计有助平台包容并蓄快速迭代和发展。随着代码体系的不断完善,今年发布的PyTorch1.0实现了产品级别的框架,涵盖了从原型研究到服务部署的全套流程。

包括Google、微软和英伟达在内的大厂以及Fast.ai、Udacity等教育机构都在使用PyTorch来实现研究、产品开发和教育过程。近日,发布完整版的PyTorch1.0涵盖了混合前端的新特性,可以在图模式和eager模式下无缝切换,同时改进了分布式训练流程,为高性能研究用户提供了纯cpp的编程接口。

研究人员也基于PyTorch开发了包括 QNNPACK 、FBGEMM等工具库,使得移动端和服务器更容易地运行最新的AI模型。

同时开发了PyText,加速了自然语言处理的研究发展。

在强化学习方面,Facebook开发了Horizon框架,利用强化学习在大规模生成系统中进行优化。它吸收了研究领域大量使用的基于决策的方式,并应用于十亿级别的数据集上。在部署了这套框架后,使得优化视频流和信息流更为高效。这套工具的开源搭建了强化学习研究和产品化之间的桥梁。

Horizon的流程图解。首先对系统中的数据进行预处理,随后离线训练模型测量、最后对策略进行部署和测试,并循环改进整个流程。

为了加速机器学习的运算过程,另一个称为Glow的开源项目衔接了不同的编译器、硬件平台和深度学习框架,通过与厂家合作开发,在IntelCadence, Esperanto, Marvell,Qualcomm 等平台上实现了高效的加速。

作为Open Computer Project的一部分,Facebook还推出了面向工业界机器学习用户的Big Basin v2。

VR/AR方面,研究人员结合深度学习进行了更深入的研究,在DeepFocus项目中发布了数据和模型。利用深度学习算法渲染出VR中的真实场景,包括了变焦多焦距和光场效果的智能渲染等。

用AI造福人类

将技术广泛应用于改善人类生活的方方面面是每个技术从业者的追求。Facebook在过去一年——利用音频视觉描述技术帮助视觉障碍的人,同时基于跨语言的自然语言处理和文本分析预测用户的自杀倾向,及时拯救更多的人。

同时,研究人员还利用AI迅速精确地计量自然灾害地区的受损状况。为灾难救援、受损评估和灾后重建提供了高效准确定量的手段。

此外通过机器学习技术,研究人员还开发出了Rosetta系统,用于检测图像和视频中的文本信息,并能在多种语言间进行语义的合规性检查,大大减少了人工成本以及不良言论的出现和传播。

Rosetta文本检测的两步架构

最后在医学影像方面,fastMRI项目加速了核磁共振影像的检测速度,加速了深度学习技术向医学领域的迁移和发展。项目不仅发布了充足的数据集,同时也开源了基本模型供来自世界各地的研究人员学习改进。

核磁共振的原始数据和重建后膝盖图像

过去的一年里,研究人员还改进了Getafix, predictive test selection, SapFix, Sapienz, and Spiral等等一系列系统,提高了SLAM和AI in Marketplace等技术在产品中的应用,并发表了一系列研究成果,包括了著名的wav2letter++, 结合多词的表示, 以及multilingual embeddings, 和audio processing等工作。

在新的一年里,更加扎实的工作和研究将在基础设施研究、高精尖应用和AI造福社会等方面展开。希望2019,Facebook能带来更多优秀的研究成果和高效的开源工具,推动AI技术更好发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像识别
    +关注

    关注

    9

    文章

    529

    浏览量

    39847
  • 人工智能
    +关注

    关注

    1813

    文章

    49757

    浏览量

    261687
  • ai技术
    +关注

    关注

    1

    文章

    1313

    浏览量

    25606

原文标题:别人家的盘点 | Facebook 2018 AI研究全回顾

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技持续引领中国原生AI云厂商阵营

    近日,权威研究机构弗若斯特沙利文(Frost & Sullivan)联合头豹研究院发布《2025年H1中国AI云服务市场报告》。报告显示,商汤科技凭整体市场份额位列中国
    的头像 发表于 11-21 10:59 260次阅读

    AI眼镜中国行调研团走进志科技

    近日,潮电智库携手二十余家AI眼镜产业链企业代表莅临志科技珠海总部,深入探讨志在AI眼镜领域的最新成果,并就产业链的协同发展与未来规划进行了深度交流。
    的头像 发表于 09-29 10:31 737次阅读

    2025华为联接大会演讲要点回顾

    华为联接大会2025在上海隆重举行,以“共建AI Campus,跃升行业智能化”为主题的智慧园区创新峰会成功举办,期间华为公司副总裁王雷发表主题演讲,如下是演讲全文要点。
    的头像 发表于 09-25 10:02 838次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    和关联性 AI驱动科学:研究和模拟人类思维和认识过程。 本章节作者为我们讲解了第五范式,介绍了科学发现的一般方法和流程等。一、科学发现的5个范式 第一范式:产生于公元1000年左右的阿拉伯世界和欧洲
    发表于 09-17 11:45

    精彩回顾 | 《电磁兼容工程问题解答(二)》直播圆满结束!

    赛盛技术于9月10日17:00举办了《电磁兼容工程问题解答(二)》专题直播。感谢每一位观众的热情参与与支持,让我们的直播活动得以圆满落幕。在此,小编将带大家一起回顾本次直播中的精彩亮点。让我们一同
    的头像 发表于 09-11 14:08 552次阅读
    精彩<b class='flag-5'>回顾</b> | 《电磁兼容工程问题<b class='flag-5'>全</b>解答(二)》直播圆满结束!

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    生物化学计算机,它通过离子、分子间的相互作用来进行复杂的并行计算。因而未来可期的前景是AI硬件将走向AI湿件。 根据研究,估算出大脑的功率是20W,在进行智力活动时,其功率会增大到25~50W。在大脑进化
    发表于 09-06 19:12

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    章 具身智能芯片 第9章 从AI芯片到AGI芯片 图2 各章重点及逻辑框架 该书可供AI和芯片领域的各层次人群阅读,无论是学习者还是研究人员。 对于本人来说,读这本书不但是为了丰富这方面的知识,更主要的是为孩子读研选择一个有前
    发表于 09-05 15:10

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    》,讲述了AI芯片的基础知识,包括原理、种类、厂商、产业等概况,展望新技术与研究应用。 《AI芯片:前沿技术与创新未来》出版后获得了“忆阻器之父”蔡少棠教授的力荐,当时他认为“这是一本关于深度学习和神经形态
    发表于 07-28 13:54

    AI应用创新与栈技术融合分论坛即将召开

    2025开放原子开源生态大会即将启幕,其中 “AI应用创新与栈技术融合分论坛”将于 7月24日重磅亮相。论坛聚焦人工智能技术与开源生态的深度融合,邀请各领域用户、技术专家、开发者分享AI应用创新实践,旨在探索
    的头像 发表于 07-23 09:54 723次阅读

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力,融合了自然语言处理(NLP)、深度
    发表于 07-16 15:29

    NVIDIA栈加速代理式AI应用落地

    在近期举办的 AWS 中国峰会上,NVIDIA 聚焦于“NVIDIA 栈加速代理式 AI 应用落地”,深入探讨了代理式 AI (Agentic AI) 技术的前沿发展以及在企业级应用
    的头像 发表于 07-14 11:41 1069次阅读

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    生态系统的系统性革新,更需要高效、强力的开发者解决方案。为此,联发科带来了一站式可视化智能开发工具——天玑开发工具集,包含AI应用流程开发工具Neuron Studio,并带来全新升级的天玑AI开发
    发表于 04-13 19:52

    直播回顾 技术解答 | 思瑞浦AI服务器应用方案

    聚焦模拟和数模混合近期,思瑞浦为大家带来了一场关于思瑞浦模拟与数模混合产品与技术在AI服务器的应用及解决方案的在线研讨会。为了方便大家更好地回顾和了解,我们整理了本次研讨会的完整视频和文字内容。同时
    的头像 发表于 04-03 11:03 947次阅读
    直播<b class='flag-5'>回顾</b>  技术解答 | 思瑞浦<b class='flag-5'>AI</b>服务器应用方案

    志AIOT系列芯片助力AI玩具百花齐放

    近日,由阿里云主办的“AI火花会——通情达义智玩共生:玩具行业的“智”变方程式”在深圳举行,志科技受邀参会。会上,志科技 模拟互联产品中心总经理 黄露 深入分享了志科技在
    的头像 发表于 04-01 09:16 1187次阅读

    中软国际携手华为推出政务AI栈解决方案

    近日,在华为中国合作伙伴大会2025的“数智赋能城市全域数字化转型“主题论坛上,中软国际副总裁、AIGC研究院院长万如意博士以《昇腾算力x政务智囊团—政务AI栈解决方案,赋能城市服务新范式》为题
    的头像 发表于 03-24 17:30 1239次阅读