0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里全新AI推理方法入选ICML 2020,可减少AI对计算和内存资源的消耗

牵手一起梦 来源:C114通信网 作者:佚名 2020-06-19 15:52 次阅读

近日,人工智能国际顶会ICML 2020公布了论文收录结果,阿里巴巴7篇论文入选,是入选论文数量最多的中国科技公司。ICML是机器学习领域全球最具影响力的学术会议之一,今年接受率仅为21.8%。

根据ICML官方显示,阿里7篇论文涵盖在图像识别、自然语言处理、搜索推荐等领域的研究成果,其中一篇《Boosting Deep Neural Network Efficiency with Dual-Module Inference》,提出了一种全新的AI推理方法,可大幅减少AI对计算和内存资源的消耗,能将推理速度提升3倍。

近年来AI模型变得越来越复杂化,尤其是类似语言AI这类复杂模型,给计算、内存资源带来了新的挑战。目前,业界通用的解决方法是采用更先进的计算性能来运行AI任务,例如采用GPUFPGA或者NPU等异构计算,但该方法并没有从根源上解决问题。

阿里巴巴达摩院设计出了一种“AI双脑思考”的方法,能让大型神经网络像人类一样学会“快思考”与“慢思考”,从而进行高效且准确的推理过程。

该方法被称为“双模推理”, 即将一个复杂任务拆分成两个任务,例如在复杂AI推理任务过程中,可以先以很小的资源运行“小网络”,同时分析哪些网络的区域较为敏感,然后只对敏感区域在“大网络”中运行计算。

达摩院的科学家从理论上证明了双模推理的可行性,且在CPU上实现了该方法。实际效果显示,该方法能在保证模型精度的基础上,在语言模型上减小40%的访存,达到1.54倍-1.75倍的性能提升,同时可以在仅损耗0.5%精度基础上,提升3倍的推理速度。

近年来,阿里在AI领域迎来了基础研究与产业应用成果双爆发的阶段。三年前,阿里巴巴成立了内部研究机构达摩院,深入AI研究前沿。据了解,阿里AI已在国际顶级技术赛事上获得了近60项世界第一,500多篇论文入选国际顶会。同时,阿里AI落地了多项重大研究成果,全面赋能各行各业。达摩院医疗AI团队疫情期间研发的AI诊断技术,已在全球近600家医院落地,完成50余万例临床诊断。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26363

    浏览量

    263948
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1571

    浏览量

    46422
收藏 人收藏

    评论

    相关推荐

    开发者手机 AI - 目标识别 demo

    Network Runtime 神经网络运行时,作为中间桥梁连通上层AI推理框架和底层加速芯片,实现AI模型的跨芯片推理计算。提供统一
    发表于 04-11 16:14

    NanoEdge AI的技术原理、应用场景及优势

    ,可以减少数据在传输过程中被窃取或篡改的风险,提高数据安全性。 - 低能耗:通过优化神经网络模型和硬件设计,NanoEdge AI 可以在有限的资源下实现高效的计算,降低设备的能耗。
    发表于 03-12 08:09

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 202次阅读

    高通推出全新AI Hub,使AI推理速度最高提升4倍

    在今年的世界移动通信大会(MWC)上,高通公司展示了其最新的技术成果——全新的高通AI Hub。这一创新平台为开发者提供了全面优化的AI模型库,涵盖传统AI和生成式
    的头像 发表于 02-28 10:28 237次阅读

    AMD CES 2024:AI计算引领未来

    AMD最新推出的Versal AI Edge XA自适应SoC搭载AI引擎,为AI计算、视觉和信号处理提供强大支持,自适应SoC适用于边缘传感器,如LiDAR、雷达和摄像头,可执行大量
    的头像 发表于 01-12 16:37 712次阅读
    AMD CES 2024:<b class='flag-5'>AI</b><b class='flag-5'>计算</b>引领未来

    边缘AI它到底是什么?能做什么?

    边缘,减少了数据的传输延迟和依赖云端的通信需求。边缘AI能够在接近数据源的设备上进行实时决策和推理,这为许多应用领域带来了革命性的改变。 边缘AI能够解决许多传统
    的头像 发表于 01-11 14:44 607次阅读

    HarmonyOS:使用MindSpore Lite引擎进行模型推理

    场景介绍 MindSpore Lite 是一款 AI 引擎,它提供了面向不同硬件设备 AI 模型推理的功能,目前已经在图像分类、目标识别、人脸识别、文字识别等应用中广泛使用。 本文介绍
    发表于 12-14 11:41

    什么是混合AI?混合AI优势在哪?

    生成式 AI 模型对计算基础设施需求极高,模型的推理随着用户数量和使用频率的增加而不断上升,云端推理成本剧增,这导致规模化扩展难以持续。混合AI
    发表于 11-20 16:26 414次阅读
    什么是混合<b class='flag-5'>AI</b>?混合<b class='flag-5'>AI</b>优势在哪?

    全新NVIDIA Spectrum-X网络平台构筑阿里生成式AI云底座

    全新 NVIDIA Spectrum-X 网络平台构筑阿里生成式 AI 云底座。
    的头像 发表于 11-02 09:07 337次阅读
    <b class='flag-5'>全新</b>NVIDIA Spectrum-X网络平台构筑<b class='flag-5'>阿里</b>生成式<b class='flag-5'>AI</b>云底座

    AI智能呼叫中心

    的呼叫中心通常需要雇佣大量的客服人员,不仅成本高昂,而且受到人为因素的限制,相比之下,AI智能呼叫中心运营成本低,而且工作效率更高,为用户提供快速、准确的解决方案,大大减少了人力资源的需求,还可以根据
    发表于 09-20 17:53

    OpenHarmony AI框架开发指导

    实现客户端和服务端之间的跨进程通信管理及AI服务与插件之间的数据传输。后续,会逐步定义统一的AI能力接口,便于AI能力的分布式调用。同时,框架提供适配不同推理框架层级的统一
    发表于 09-19 18:54

    什么叫AI计算AI计算力是什么?

    是指通过计算机系统的处理能力,将大量的信息进行分析、处理和模拟,在不断的学习和优化中,让计算机系统变得更加智能化和精准化的一种技术。AI计算的核心
    的头像 发表于 08-24 15:49 3685次阅读

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练,AI部署需要更多。 预计到2020年代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理。英特尔Xeon扩展处理器约占运行
    发表于 08-04 07:25

    OrionX AI芯片计算资源池化技术

    AI 应用与物理 GPU 服务器分离部署,允许通过高性能网络远程调用 GPU资源。这样可以实现 AI 应用与物理 GPU 资源剥离,AI
    的头像 发表于 07-10 14:48 2180次阅读
    OrionX <b class='flag-5'>AI</b>芯片<b class='flag-5'>计算</b><b class='flag-5'>资源</b>池化技术

    英特尔® AMX 加速AI推理性能,助阿里电商推荐系统成功应对峰值负载压力

    达沃斯论坛|英特尔王锐:AI驱动工业元宇宙,释放数实融合无穷潜力 英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图 英特尔内部代工模式的最新进展 原文标题:英特尔® AMX 加速
    的头像 发表于 07-08 14:15 321次阅读
    英特尔® AMX 加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能,助<b class='flag-5'>阿里</b>电商推荐系统成功应对峰值负载压力