0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook 2018 AI研究全回顾

nlfO_thejiangme 来源:lq 2019-01-11 09:37 次阅读

在过去的一年,Facebook经历了很多波折和困难,但是在研究方面依旧涌现出了很多高质量的工作。近日,Facebook发文总结了去年在长期研究项目、高性能工具开发和平台开发以及AI的实际应用等各个方面的工作。

随着研究和工程实践的深入,实现了更强大的智能系统、更优秀的开源工具、更稳定高效的开源平台,诸多的研究论文和模型代码为深度学习研究做出了众多贡献。同时,还将AI应用到了医学和社会生活等领域,让技术真正造福人类。那么,就让我们一起看下这些工作都有哪些吧!

基于半监督和无监督学习的先进AI技术

实现人类水平的人工智能是每个从业者和研究人员最终的目标。在过去的一年,Facebook的研究人员利用更少的数据实现了更复杂的功能,让人工智能的目标又近了一步。目前大多数机器学习都基于大量标记数据通过监督学习的方式来实现特定的任务,但耗时的数据标记工作极大地限制了技术的发展。所以如何充分释放半监督和无监督学习的潜力,减少智能系统对于数据量的需求至关重要。在多语言理解和翻译系统中,研究人员提出一种新的方法,基于无监督数据实现自然机器翻译模型自动训练迁移,并达到了与监督数据相比拟的效果。通过减少对于大规模标记数据的依赖,这一系统打开了向更多语言迁移的技术大门,甚至可以用于像乌尔都语一样标记数据十分有限的语言。

多种语言的二维词向量嵌入空间可以通过简单的变换实现匹配。

此外,对于数据集资源有限的语言来说,需要用多种技术手段来实现。使用多语言模型融合同一语系多种方言间的相似性。通过多种技术的综合,研究人员在自动翻译系统中成功的新增了24种语言。同时在与纽约大学的合作中,在MutilNLI数据集中新增了14中语言,将有效助力自然语言理解的研究进程。同时,还发布了跨语言推理数据集XNLI,其中包括了乌尔都语和斯瓦希里语两种小语种。利用半监督和非监督的方式有效减少了对于监督训练数据的需求。研究人员还探索了数据监督的方式,结合监督和非监督数据,通过数据蒸馏的方法实现半监督学习。另外值得一提的是,研究人员探索了基于图像标签的图像识别系统,创造性的利用现存的、非传统标注的数据生成了大规模的自标记训练数据集,其中包括了35亿张来自Instagram的图像。用户为照片标记的标签可以为图像提供更为丰富的信息,将现存的图像转变为弱监督数据样本。结果表明,这些手段不仅有效地提升了基于图像的任务表现,更将图像识别模型的准确率推高了1%。

图像标签可帮助计算机学习到比通常分类更为细的子分类信息,并补充图中元素的信息。

加速AI研究产品化进程

AI作为一种基础能力已经在产品的方方面面得到体现。2018年Facebook最主要的工作也集中在如何将AI方面的研究成果尽可能的产品化并部署到系统中,主要体现在PyTroch平台和一系列工具的开发上。PyTroch自2018年发布以来已经跃居为GitHub上增长第二的开源项目。其灵活的接口对于研究AI研究的快速迭代十分友好,同时开源的框架设计有助平台包容并蓄快速迭代和发展。随着代码体系的不断完善,今年发布的PyTorch1.0实现了产品级别的框架,涵盖了从原型研究到服务部署的全套流程。

包括Google、微软和英伟达在内的大厂以及Fast.ai、Udacity等教育机构都在使用PyTorch来实现研究、产品开发和教育过程。近日,发布完整版的PyTorch1.0涵盖了混合前端的新特性,可以在图模式和eager模式下无缝切换,同时改进了分布式训练流程,为高性能研究用户提供了纯cpp的编程接口。

研究人员也基于PyTorch开发了包括 QNNPACK 、FBGEMM等工具库,使得移动端和服务器更容易地运行最新的AI模型。

同时开发了PyText,加速了自然语言处理的研究发展。

在强化学习方面,Facebook开发了Horizon框架,利用强化学习在大规模生成系统中进行优化。它吸收了研究领域大量使用的基于决策的方式,并应用于十亿级别的数据集上。在部署了这套框架后,使得优化视频流和信息流更为高效。这套工具的开源搭建了强化学习研究和产品化之间的桥梁。

Horizon的流程图解。首先对系统中的数据进行预处理,随后离线训练模型测量、最后对策略进行部署和测试,并循环改进整个流程。

为了加速机器学习的运算过程,另一个称为Glow的开源项目衔接了不同的编译器、硬件平台和深度学习框架,通过与厂家合作开发,在IntelCadence, Esperanto, Marvell,Qualcomm 等平台上实现了高效的加速。

作为Open Computer Project的一部分,Facebook还推出了面向工业界机器学习用户的Big Basin v2。

VR/AR方面,研究人员结合深度学习进行了更深入的研究,在DeepFocus项目中发布了数据和模型。利用深度学习算法渲染出VR中的真实场景,包括了变焦多焦距和光场效果的智能渲染等。

用AI造福人类

将技术广泛应用于改善人类生活的方方面面是每个技术从业者的追求。Facebook在过去一年——利用音频视觉描述技术帮助视觉障碍的人,同时基于跨语言的自然语言处理和文本分析预测用户的自杀倾向,及时拯救更多的人。

同时,研究人员还利用AI迅速精确地计量自然灾害地区的受损状况。为灾难救援、受损评估和灾后重建提供了高效准确定量的手段。

此外通过机器学习技术,研究人员还开发出了Rosetta系统,用于检测图像和视频中的文本信息,并能在多种语言间进行语义的合规性检查,大大减少了人工成本以及不良言论的出现和传播。

Rosetta文本检测的两步架构

最后在医学影像方面,fastMRI项目加速了核磁共振影像的检测速度,加速了深度学习技术向医学领域的迁移和发展。项目不仅发布了充足的数据集,同时也开源了基本模型供来自世界各地的研究人员学习改进。

核磁共振的原始数据和重建后膝盖图像

过去的一年里,研究人员还改进了Getafix, predictive test selection, SapFix, Sapienz, and Spiral等等一系列系统,提高了SLAM和AI in Marketplace等技术在产品中的应用,并发表了一系列研究成果,包括了著名的wav2letter++, 结合多词的表示, 以及multilingual embeddings, 和audio processing等工作。

在新的一年里,更加扎实的工作和研究将在基础设施研究、高精尖应用和AI造福社会等方面展开。希望2019,Facebook能带来更多优秀的研究成果和高效的开源工具,推动AI技术更好发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像识别
    +关注

    关注

    8

    文章

    447

    浏览量

    37907
  • 人工智能
    +关注

    关注

    1776

    文章

    43824

    浏览量

    230580
  • ai技术
    +关注

    关注

    1

    文章

    1132

    浏览量

    23703

原文标题:别人家的盘点 | Facebook 2018 AI研究全回顾

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    台积电AI芯片市场份额大增,占比九成以上

    自从Open AI推动了生成式AI技术后,英伟达的AI加速器芯片的需求逐渐升高。同时,这项技术也吸引了包括谷歌、英特尔、微软、AMD及Facebook在内的其他大型企业纷纷涉足
    的头像 发表于 03-27 09:59 148次阅读

    第二届大会回顾第10期 | 低时延分布式共享设备研究与探索

    演讲嘉宾 | 杜   东 回顾整理 | 廖   涛 排版校对 | 李萍萍   嘉宾介绍  OS内核及视窗分论坛  杜东 ,上海交通大学助理研究员,OpenHarmony项目群技术指导委员会并发与协同
    的头像 发表于 02-25 17:52 347次阅读
    第二届大会<b class='flag-5'>回顾</b>第10期 | 低时延分布式共享设备<b class='flag-5'>研究</b>与探索

    1月志芯片开源项目分享合辑

    接口、连wifi、接入SD卡、调整屏幕亮度、按键控制、外接其他设备、1转4USB HUB......4、TinyVision V851seTinyVision是一款异构视觉AI开发套件,主控芯片使用
    发表于 01-29 10:20

    AI如何助力我们构建更智能的空间?利用AI构建智能空间的5种方式

    当下业界都聚焦于生成式 AI 如何推动未来变革,但我们也不妨回顾一下过去的一年,AI 如何助力我们构建更智能的空间。
    的头像 发表于 01-24 18:19 765次阅读

    一图回顾:拓普联科2023大事记

    一图回顾:拓普联科2023大事记
    的头像 发表于 01-12 00:00 3011次阅读
    一图<b class='flag-5'>回顾</b>:拓普联科2023大事记

    Facebook开源StyleX如何在JavaScript中写CSS呢?

    Meta(原 Facebook)开源了全新的 CSS-in-JS 库 StyleX。
    的头像 发表于 12-14 10:03 261次阅读

    英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

    英特尔研究院将在NeurIPS 2023大会上展示一系列富有价值、业界领先的AI创新成果。面向广大开发者、研究人员和学界人士,这一AI和计算机视觉领域的全球顶会将于12月10日至16日
    的头像 发表于 12-08 19:15 350次阅读

    英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

    英特尔研究院将重点展示31项研究成果,它们将推进面向未来的AI创新。        英特尔研究院将在NeurIPS 2023大会上展示一系列富有价值、业界领先的
    的头像 发表于 12-08 09:17 401次阅读

    罗姆(ROHM)第4代:技术回顾

    罗姆(ROHM)第4代:技术回顾
    的头像 发表于 11-28 17:02 450次阅读
    罗姆(ROHM)第4代:技术<b class='flag-5'>回顾</b>

    2023慕尼黑展会回顾

    2023慕尼黑 展会回顾
    的头像 发表于 11-01 15:35 193次阅读
    2023慕尼黑展会<b class='flag-5'>回顾</b>

    阿里平头哥发布首个 RISC-V AI 软硬栈平台

    面向多媒体 AI 增强场景的 RISC-V 栈软硬件平台。 该平台将 RISC-V 扩展性的新型 Vector、Matrix 及第三方硬件进行算力抽象,并接入 OpenCV 与 CSI-NN 等弹性
    发表于 08-26 14:14

    Ai 部署的临界考虑电子指南

    %数据中心的工作量。平方GPU对培训工作量有效,但在人工智能的所有不同阶段都不需要GPU。在2021年的一项研究中,56%的研究受访者将成本列为他们面临的最重大挑战实施AI/ML解决方案。
    发表于 08-04 07:25

    峰会回顾第19期 | 多内核操作系统研究

    演讲嘉宾 | 蒋金虎 回顾整理 | 廖   涛 排版校对 | 李萍萍 嘉宾简介 蒋金虎,复旦大学大数据研究院高级工程师,曾任江南计算技术研究所操作系统室主任。研究方向为高性能计算、操作
    的头像 发表于 07-27 16:22 796次阅读
    峰会<b class='flag-5'>回顾</b>第19期 | 多内核操作系统<b class='flag-5'>研究</b>

    展示存算一体商用赋能 知存科技参展2023WAIC亮点回顾

    ,存算一体助听器样机首次展示 知存讲座 | AI大模型带来算力基础的改变 知存喜报 | 获评2023中国AI算力层创新企业                 原文标题:展示存算一体商用赋能 知存科技参展2023WAIC亮点回顾
    的头像 发表于 07-08 18:20 371次阅读
    展示存算一体商用赋能 知存科技参展2023WAIC亮点<b class='flag-5'>回顾</b>

    塑造嵌入式AI的四个新趋势

    Facebook AI Research研究科学家兼德克萨斯大学奥斯汀分校计算机科学系教授Kristen Grauman分享了“感知AI的前沿:第一人称视频和多模态感知”发表演讲。她讨
    的头像 发表于 07-05 10:26 508次阅读