0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能对计算机系统及体系结构的挑战

我快闭嘴 来源:人工智能实验室 作者:人工智能实验室 2020-06-29 19:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

百度称得上是国内应用深度学习的先锋,早在2012年初,百度就在语音识别上开始规模应用深度学习算法并取得了非常好的效果。当年年底,百度CEO李彦宏宣布成立公司的第一个研究院:百度深度学习研究院。当时,世界上只有谷歌、微软等少数几个公司公开宣布在深度学习、人工智能领域进行战略性的资金投入。

经过四年的发展,百度深度学习技术已经渗透到百度的各个产品中,如网页搜索、广告点击率预估模型、百度杀毒等。深度学习技术极大地提高了百度产品的用户体验。例如百度的语音识别,经过四年的磨练,其识别准确率从当初的80%提高到今天的96%。

除了率先在各个产品线引入前沿的深度学习算法外,百度在人工智能应用方面还有更长远的布局:

1. 建立百度研究院,下设硅谷人工智能实验室、北京深度学习实验室、北京大数据实验室等三大前沿实验室。

2. 2014年,人工智能领域最负盛名的权威学者吴恩达加入百度。

3. 同年,在百度技术开放日发布了大数据引擎,对外开放大数据及人工智能能力。

4. 在百度技术节上,百度高级副总裁王劲描绘了“万物智能”的愿景,展示了百度为迎接万物智能时代所做的技术布局。

5. 2015年在百度世界大会上推出了“度秘”。度秘是万物皆智能的一个集中体现,可成为人们生活中的智能秘书,通过语音对话或者图像可以自然地和人进行交流,甚至都不需要事先的交互,仅凭借历史信息、传感器信息、周围环境变化就能判断一个人的需求。如果你饿了,它可以帮你订餐;你生病了,可以告诉你吃什么药;如果明天下雨,会提醒你带上伞;若你需要出行,会帮你订好酒店、机票等等。不过,这些看似平常的“秘书”服务,如果要真正达到好用的状态,还需要有非常先进的人工智能技术做支撑。

人工智能对计算机系统及体系结构的挑战:

人工智能的应用包括云(数据中心)和端(智能设备)两部分。云端除了训练(离线训练),还有在线服务。训练是指利用训练数据,选择合适的训练方法,训练出一个模型。在线服务是指利用训练出来的模型在线响应用户的请求。端部分也是人工智能的一个强需求,按照“万物智能”的愿望,很多终端设备,如智能辅助驾驶、无人车、智能摄像头、工业物联网(Internet of Things,IoT)等等,都能运行人工智能的算法,智能地响应外部请求。

深度学习的离线训练是工业界和学术界研究最多、关注最多的领域。自深度学习热潮席卷而来,无论是学术界还是工业界,涌现了很多新的、面向深度学习算法和应用设计的系统,如谷歌提出的参数服务器(parameter server),其他人通过借鉴这一思想,根据不同的应用场景,设计了各种不同的系统。

在体系结构方面,深度学习训练大多是基于图形处理单元(GPU)及无限带宽(infiniband)的高速互联网络。使用图形处理单元来做大规模的矩阵计算,再用无线带宽高速网络进行分布式参数更新。这种架构在工业界应用非常普遍,很多专有的服务器里通常带有8个图形处理单元,服务器之间则通过无线带宽互联。很多论文都在研究如何利用服务器内8个图形处理单元的局部性、无限带宽的远程直接数据存取(Remote Direct Memory Acces,RDMA)以及图形处理单元的计算能力来完成完整的分布式深度学习训练任务。图形处理单元加无限带宽的硬件架构目前比较适用于深度学习的训练以及工业界的规模应用。这是因为这两种硬件的性能都不错,而供应商众多,容易获得产品及技术支持。

在线服务方面,无论是工业界还是学术界,公开的信息都比较少。能有机会进行大规模部署人工智能服务的,只有像百度这样技术驱动的大型互联网公司,而这些公司一般出于保密考虑,会延后发布自己的核心技术。至于人工智能的终端设备,虽然媒体一直在勾画这个领域的宏伟蓝图,但实际上能成功进行规模应用的并不多,所以工业界和学术界对这部分内容公开得也比较少。

其实,无论是离线训练、在线服务还是智能设备,内部运行的都是一些常用的深度学习算法,如深层神经网络(Deep Neural Networks,DNN)、递归神经网络(Recurrent Neural Network,RNN)/长短时神经网络(Long Short Term Memory,LSTM)、卷积神经网络(Convolutional Neural Network,CNN)。这些算法存在一些共性,比如(1)都是计算和访存密集型;(2)主要的计算算子是矩阵操作、卷积、激活函数等;(3)对于离线训练,考虑到分布式实现,对节点间的通信带宽和延时要求很高。

从大规模部署应用的角度看,无论是哪种类型的应用,衡量体系结构好坏的最终标准是效率,包括能耗效率和成本效率。只有这两个效率足够高,体系结构才有生命力。例如对于嵌入式终端,往往需要考虑极致的能耗效率和成本效率,有时候甚至需要对算法做些剪枝和模型规模限制。对于数据中心而言,成本和功耗也是规模部署要考虑的第一要素。

如今,人们一提到深度学习的硬件架构,首先就会想到图形处理单元。这主要是因为,在便于采购的硬件里,图形处理单元确实能提供较好的数学计算能力和访存带宽。但对于能耗和成本效率,即使应用在数据中心,图形处理单元离我们的目标也还有很大的改进空间。所以我们需要重新思考,如何面向人工智能的典型应用和算法,设计一种新的、通用的体系结构。这种体系结构既能实现极致的能耗和成本效率,也能灵活延伸扩展,易于支持离线训练、在线服务和智能终端三种场景。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7763

    浏览量

    92670
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261425
  • 工业物联网
    +关注

    关注

    25

    文章

    2491

    浏览量

    67140
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Neousys宸曜发布适用于狭小空间的经济型边缘人工智能计算机

    强固型嵌入式计算机厂商Neousys宸曜科技发布了NRU-160-FT系列,一款紧凑型无风扇人工智能边缘计算机,搭载NVIDIA®JetsonOrin™NX/Nano系统模块。NRU-
    的头像 发表于 12-01 16:21 655次阅读
    Neousys宸曜发布适用于狭小空间的经济型边缘<b class='flag-5'>人工智能</b><b class='flag-5'>计算机</b>

    龙架构计算机系统能力核心课程教学研讨会圆满举行

    2025年11月8日,由教育部计算机类专业系统能力课程群虚拟教研室指导、北京航空航天大学计算机学院主办的龙架构计算机系统能力核心课程教学研讨会在京举行。
    的头像 发表于 11-14 13:52 371次阅读

    2025中国高校计算机大赛人工智能创意赛圆满落幕

    11月2日,2025中国高校计算机大赛-人工智能创意赛(C4-AI竞赛)在海南大学海甸校区正式落下帷幕。
    的头像 发表于 11-05 15:39 374次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:23

    DPU核心技术论文再次登陆体系结构领域旗舰期刊《IEEE Transactions on Computers》

    近期,鄢贵海团队研究成果在计算机体系结构领域国际顶级期刊《IEEE Transactions on Computers》中发表。该研究主要围绕KPU敏捷计算架构展开,KPU具有超强异构核集成和调度
    的头像 发表于 06-11 18:11 500次阅读
    DPU核心技术论文再次登陆<b class='flag-5'>体系结构</b>领域旗舰期刊《IEEE Transactions on Computers》

    睿创微纳AI芯片技术登上国际计算机体系结构领域顶级会议

    近日,国际计算机体系结构领域顶级会议HPCA 2025(International Symposium on High-Performance Computer Architecture)在美国召开。会议共收到534篇来自全球顶尖科研机构及高校的论文投稿,最终录用率仅为21%。
    的头像 发表于 05-19 15:57 752次阅读

    利用边缘计算和工业计算机实现智能视频分析

    IVA的好处、实际部署应用程序以及工业计算机如何实现这些解决方案。一、什么是智能视频分析(IVA)?智能视频分析(IVA)集成了复杂的计算机视觉,通常与卷积神经网
    的头像 发表于 05-16 14:37 629次阅读
    利用边缘<b class='flag-5'>计算</b>和工业<b class='flag-5'>计算机</b>实现<b class='flag-5'>智能</b>视频分析

    一文带你了解工业计算机尺寸

    工业计算机是现代自动化、人工智能(AI)和边缘计算的支柱。这些坚固耐用的系统旨在承受恶劣的环境,同时为关键应用提供可靠的性能。然而,由于有这么多可用的外形尺寸,为您的工业
    的头像 发表于 04-24 13:35 790次阅读
    一文带你了解工业<b class='flag-5'>计算机</b>尺寸

    计算机网络入门指南

    计算机网络是指将地理位置不同且具有独立功能的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统、网络管理软件及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统
    的头像 发表于 04-22 14:29 1857次阅读
    <b class='flag-5'>计算机</b>网络入门指南

    2025全国大学生计算机系统能力大赛启幕,RT-Thread助力高校人才培养

    全国大学生计算机系统能力大赛是由系统能力培养研究专家组发起,全国高等学校计算机教育研究会、系统能力培养研究专家组、系统能力培养研究项目发起高
    的头像 发表于 04-10 21:26 774次阅读
    2025全国大学生<b class='flag-5'>计算机系统</b>能力大赛启幕,RT-Thread助力高校人才培养

    人工智能对智慧园区的提升和帮助

    随着人工智能(AI)技术的快速发展,其在智慧园区中的应用正逐步改变传统园区的管理模式和服务方式。 智慧园区 通过整合物联网、大数据、云计算等技术,实现了资源的高效配置和管理的智能化。而人工智能
    的头像 发表于 03-13 14:39 733次阅读

    人工智能推理及神经处理的未来

    人工智能行业所围绕的是一个受技术进步、社会需求和监管政策影响的动态环境。机器学习、自然语言处理和计算机视觉方面的技术进步,加速了人工智能的发展和应用。包括医疗保健、金融和制造业在内的各个行业对自动化
    的头像 发表于 12-23 11:18 867次阅读
    <b class='flag-5'>人工智能</b>推理及神经处理的未来

    专业的第三类医疗器械经营企业计算机系统,确保合规无忧

    第三类医疗器械经营企业计算机系统因其简单明了的特性而受到了众多用户的欢迎。与其他第三类医疗器械经营企业计算机系统相比,盘谷医疗的快速上手为用户提供了极大的便利。该系统还支持远程操作,用户可以随时随地对医疗器械进行进销存管理。
    的头像 发表于 12-12 16:05 692次阅读
    专业的第三类医疗器械经营企业<b class='flag-5'>计算机系统</b>,确保合规无忧

    什么是嵌入式人工智能

    嵌入式人工智能是指将人工智能技术应用于嵌入式系统中的一种技术。嵌入式系统是嵌入到其他设备或系统中的计算机
    的头像 发表于 12-11 09:23 1517次阅读
    什么是嵌入式<b class='flag-5'>人工智能</b>