阿里全新AI推理方法入选ICML 2020，可减少AI对计算和内存资源的消耗-电子发烧友网

近日，人工智能国际顶会ICML 2020公布了论文收录结果，阿里巴巴7篇论文入选，是入选论文数量最多的中国科技公司。ICML是机器学习领域全球最具影响力的学术会议之一，今年接受率仅为21.8%。

根据ICML官方显示，阿里7篇论文涵盖在图像识别、自然语言处理、搜索推荐等领域的研究成果，其中一篇《Boosting Deep Neural Network Efficiency with Dual-Module Inference》，提出了一种全新的AI推理方法，可大幅减少AI对计算和内存资源的消耗，能将推理速度提升3倍。

近年来AI模型变得越来越复杂化，尤其是类似语言AI这类复杂模型，给计算、内存资源带来了新的挑战。目前，业界通用的解决方法是采用更先进的计算性能来运行AI任务，例如采用GPU、FPGA或者NPU等异构计算，但该方法并没有从根源上解决问题。

阿里巴巴达摩院设计出了一种“AI双脑思考”的方法，能让大型神经网络像人类一样学会“快思考”与“慢思考”，从而进行高效且准确的推理过程。

该方法被称为“双模推理”，即将一个复杂任务拆分成两个任务，例如在复杂AI推理任务过程中，可以先以很小的资源运行“小网络”，同时分析哪些网络的区域较为敏感，然后只对敏感区域在“大网络”中运行计算。

达摩院的科学家从理论上证明了双模推理的可行性，且在CPU上实现了该方法。实际效果显示，该方法能在保证模型精度的基础上，在语言模型上减小40%的访存，达到1.54倍-1.75倍的性能提升，同时可以在仅损耗0.5%精度基础上，提升3倍的推理速度。

近年来，阿里在AI领域迎来了基础研究与产业应用成果双爆发的阶段。三年前，阿里巴巴成立了内部研究机构达摩院，深入AI研究前沿。据了解，阿里AI已在国际顶级技术赛事上获得了近60项世界第一，500多篇论文入选国际顶会。同时，阿里AI落地了多项重大研究成果，全面赋能各行各业。达摩院医疗AI团队疫情期间研发的AI诊断技术，已在全球近600家医院落地，完成50余万例临床诊断。

责任编辑：gt

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
90

文章
38225

浏览量
297075
阿里巴巴

阿里巴巴

+关注

关注
7

文章
1645

浏览量
48944

搜索历史

阿里全新AI推理方法入选ICML 2020，可减少AI对计算和内存资源的消耗

评论