0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能对计算机系统及体系结构的挑战

我快闭嘴 来源:人工智能实验室 作者:人工智能实验室 2020-06-29 19:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

百度称得上是国内应用深度学习的先锋,早在2012年初,百度就在语音识别上开始规模应用深度学习算法并取得了非常好的效果。当年年底,百度CEO李彦宏宣布成立公司的第一个研究院:百度深度学习研究院。当时,世界上只有谷歌、微软等少数几个公司公开宣布在深度学习、人工智能领域进行战略性的资金投入。

经过四年的发展,百度深度学习技术已经渗透到百度的各个产品中,如网页搜索、广告点击率预估模型、百度杀毒等。深度学习技术极大地提高了百度产品的用户体验。例如百度的语音识别,经过四年的磨练,其识别准确率从当初的80%提高到今天的96%。

除了率先在各个产品线引入前沿的深度学习算法外,百度在人工智能应用方面还有更长远的布局:

1. 建立百度研究院,下设硅谷人工智能实验室、北京深度学习实验室、北京大数据实验室等三大前沿实验室。

2. 2014年,人工智能领域最负盛名的权威学者吴恩达加入百度。

3. 同年,在百度技术开放日发布了大数据引擎,对外开放大数据及人工智能能力。

4. 在百度技术节上,百度高级副总裁王劲描绘了“万物智能”的愿景,展示了百度为迎接万物智能时代所做的技术布局。

5. 2015年在百度世界大会上推出了“度秘”。度秘是万物皆智能的一个集中体现,可成为人们生活中的智能秘书,通过语音对话或者图像可以自然地和人进行交流,甚至都不需要事先的交互,仅凭借历史信息、传感器信息、周围环境变化就能判断一个人的需求。如果你饿了,它可以帮你订餐;你生病了,可以告诉你吃什么药;如果明天下雨,会提醒你带上伞;若你需要出行,会帮你订好酒店、机票等等。不过,这些看似平常的“秘书”服务,如果要真正达到好用的状态,还需要有非常先进的人工智能技术做支撑。

人工智能对计算机系统及体系结构的挑战:

人工智能的应用包括云(数据中心)和端(智能设备)两部分。云端除了训练(离线训练),还有在线服务。训练是指利用训练数据,选择合适的训练方法,训练出一个模型。在线服务是指利用训练出来的模型在线响应用户的请求。端部分也是人工智能的一个强需求,按照“万物智能”的愿望,很多终端设备,如智能辅助驾驶、无人车、智能摄像头、工业物联网(Internet of Things,IoT)等等,都能运行人工智能的算法,智能地响应外部请求。

深度学习的离线训练是工业界和学术界研究最多、关注最多的领域。自深度学习热潮席卷而来,无论是学术界还是工业界,涌现了很多新的、面向深度学习算法和应用设计的系统,如谷歌提出的参数服务器(parameter server),其他人通过借鉴这一思想,根据不同的应用场景,设计了各种不同的系统。

在体系结构方面,深度学习训练大多是基于图形处理单元(GPU)及无限带宽(infiniband)的高速互联网络。使用图形处理单元来做大规模的矩阵计算,再用无线带宽高速网络进行分布式参数更新。这种架构在工业界应用非常普遍,很多专有的服务器里通常带有8个图形处理单元,服务器之间则通过无线带宽互联。很多论文都在研究如何利用服务器内8个图形处理单元的局部性、无限带宽的远程直接数据存取(Remote Direct Memory Acces,RDMA)以及图形处理单元的计算能力来完成完整的分布式深度学习训练任务。图形处理单元加无限带宽的硬件架构目前比较适用于深度学习的训练以及工业界的规模应用。这是因为这两种硬件的性能都不错,而供应商众多,容易获得产品及技术支持。

在线服务方面,无论是工业界还是学术界,公开的信息都比较少。能有机会进行大规模部署人工智能服务的,只有像百度这样技术驱动的大型互联网公司,而这些公司一般出于保密考虑,会延后发布自己的核心技术。至于人工智能的终端设备,虽然媒体一直在勾画这个领域的宏伟蓝图,但实际上能成功进行规模应用的并不多,所以工业界和学术界对这部分内容公开得也比较少。

其实,无论是离线训练、在线服务还是智能设备,内部运行的都是一些常用的深度学习算法,如深层神经网络(Deep Neural Networks,DNN)、递归神经网络(Recurrent Neural Network,RNN)/长短时神经网络(Long Short Term Memory,LSTM)、卷积神经网络(Convolutional Neural Network,CNN)。这些算法存在一些共性,比如(1)都是计算和访存密集型;(2)主要的计算算子是矩阵操作、卷积、激活函数等;(3)对于离线训练,考虑到分布式实现,对节点间的通信带宽和延时要求很高。

从大规模部署应用的角度看,无论是哪种类型的应用,衡量体系结构好坏的最终标准是效率,包括能耗效率和成本效率。只有这两个效率足够高,体系结构才有生命力。例如对于嵌入式终端,往往需要考虑极致的能耗效率和成本效率,有时候甚至需要对算法做些剪枝和模型规模限制。对于数据中心而言,成本和功耗也是规模部署要考虑的第一要素。

如今,人们一提到深度学习的硬件架构,首先就会想到图形处理单元。这主要是因为,在便于采购的硬件里,图形处理单元确实能提供较好的数学计算能力和访存带宽。但对于能耗和成本效率,即使应用在数据中心,图形处理单元离我们的目标也还有很大的改进空间。所以我们需要重新思考,如何面向人工智能的典型应用和算法,设计一种新的、通用的体系结构。这种体系结构既能实现极致的能耗和成本效率,也能灵活延伸扩展,易于支持离线训练、在线服务和智能终端三种场景。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7841

    浏览量

    93462
  • 人工智能
    +关注

    关注

    1820

    文章

    50325

    浏览量

    266949
  • 工业物联网
    +关注

    关注

    25

    文章

    2542

    浏览量

    67714
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    HIP6521EVAL1:奔腾4计算机系统的外设电源控制解决方案

    HIP6521EVAL1:奔腾4计算机系统的外设电源控制解决方案 在当今的计算机系统中,稳定且高效的电源供应是确保系统性能的关键。对于奔腾4计算机系统而言,HIP6521EVAL1评估
    的头像 发表于 04-12 12:15 408次阅读

    计算机专业408考研科目

    it。top) 第一个月:构建认知的“数字孪生” 零基础跨考最大的障碍不是知识点的繁杂,而是缺乏计算机系统的整体图景。传统的复习往往陷入教材的细枝末节,而未来的入门路线要求你首先建立一个宏观的“数字孪生
    发表于 04-11 16:44

    奕行智能论文入选国际计算机体系结构顶级会议 ISCA 2026

    ISCA 2026(International Symposium on Computer Architecture,国际计算机体系结构年会)。 ISCA 创立于 1973 年,是计算机体系结构领域最权威
    的头像 发表于 04-01 15:24 352次阅读
    奕行<b class='flag-5'>智能</b>论文入选国际<b class='flag-5'>计算机体系结构</b>顶级会议 ISCA 2026

    由顺序主导的计算机体系

    由顺序主导的计算机体系 原创技术文档 · 已开源 项目开源地址(码云 Gitee) 本项目已完整开源,欢迎 Star、Fork、技术交流: 码云搜索:由顺序主导的计算机体系 联系邮箱
    发表于 02-28 22:53

    浅谈人工智能(2)

    。 强人工智能(Strong AI),又称通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以胜任人类所有工作的人工智能。 超
    的头像 发表于 02-22 08:24 346次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    十进制计算机硬件体系结构及“独值”量化逻辑运算革命(一)

    采用“独值”量化逻辑理论设计十进制数字计算机,十进制网络计算机,十进制模拟计算机,十进制模糊计算机,实现计算机类型多样化,
    的头像 发表于 01-29 09:13 1115次阅读
    十进制<b class='flag-5'>计算机</b>硬件<b class='flag-5'>体系结构</b>及“独值”量化逻辑运算革命(一)

    操作系统体系结构

    操作系统体系结构是一个开放的问题。正如上文所述,操作系统在核心态为应用程序提供公共的服务,那么操作系统在核心态应该提供什么服务、怎样提供服务?有关这个问题的回答形成了两种主要的
    发表于 01-15 08:19

    乐高®教育宣布推出专注于计算机科学与人工智能的动手实践式学习解决方案

      一项名为《构建未来:全球计算机科学与人工智能教育报告》的研究新近指出,虽然基础教育阶段的教师充分认可动手实践式的计算机科学与人工智能教育的优势,但普遍缺乏能有效提升学生参与度的合适
    的头像 发表于 01-12 19:52 457次阅读
    乐高®教育宣布推出专注于<b class='flag-5'>计算机</b>科学与<b class='flag-5'>人工智能</b>的动手实践式学习解决方案

    Neousys宸曜发布适用于狭小空间的经济型边缘人工智能计算机

    强固型嵌入式计算机厂商Neousys宸曜科技发布了NRU-160-FT系列,一款紧凑型无风扇人工智能边缘计算机,搭载NVIDIA®JetsonOrin™NX/Nano系统模块。NRU-
    的头像 发表于 12-01 16:21 1152次阅读
    Neousys宸曜发布适用于狭小空间的经济型边缘<b class='flag-5'>人工智能</b><b class='flag-5'>计算机</b>

    龙架构计算机系统能力核心课程教学研讨会圆满举行

    2025年11月8日,由教育部计算机类专业系统能力课程群虚拟教研室指导、北京航空航天大学计算机学院主办的龙架构计算机系统能力核心课程教学研讨会在京举行。
    的头像 发表于 11-14 13:52 780次阅读

    2025中国高校计算机大赛人工智能创意赛圆满落幕

    11月2日,2025中国高校计算机大赛-人工智能创意赛(C4-AI竞赛)在海南大学海甸校区正式落下帷幕。
    的头像 发表于 11-05 15:39 767次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:23

    睿创微纳AI芯片技术登上国际计算机体系结构领域顶级会议

    近日,国际计算机体系结构领域顶级会议HPCA 2025(International Symposium on High-Performance Computer Architecture)在美国召开。会议共收到534篇来自全球顶尖科研机构及高校的论文投稿,最终录用率仅为21%。
    的头像 发表于 05-19 15:57 1108次阅读

    利用边缘计算和工业计算机实现智能视频分析

    IVA的好处、实际部署应用程序以及工业计算机如何实现这些解决方案。一、什么是智能视频分析(IVA)?智能视频分析(IVA)集成了复杂的计算机视觉,通常与卷积神经网
    的头像 发表于 05-16 14:37 986次阅读
    利用边缘<b class='flag-5'>计算</b>和工业<b class='flag-5'>计算机</b>实现<b class='flag-5'>智能</b>视频分析