0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ARM牵手英伟达推出专用的IOT设备人工智能IP

h1654155971.7596 来源:未知 作者:李倩 2018-03-29 10:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

3月27日美国圣何塞报道,今天早上,英伟达GTC 2018年度大会的最重磅环节——创始人&CEO黄仁勋主题演讲——正式开始。

每年的GTC大会上,这位被粉丝们爱称为“老黄”的黑色皮衣爱好者CEO都会带来一场重磅主题演讲,通常来说不仅会发布新型GPU与超算电脑,还会宣布一些AI/VR/自动驾驶等领域重磅合作。

不过,今年的GTC 2018比较神奇,最为重磅的消息选择了在提前秘密发布,而不是在GTC Keynote现场——英伟达重磅宣布,将联合芯片巨头ARM打造IOT设备的AI芯片专用IP,这款机器学习IP集成到Arm的Project Trillium平台上,以实现机器学习,其技术源于英伟达Xavier芯片以及去年开源的DLA深度学习加速器项目。

ARM是全球智能设备第一大主流芯片架构提供商,全球超过90%的智能设备采用了ARM的芯片架构,包括手机、平板、手表、电视、无人机等等。本次ARM牵手英伟达推出专用的IOT设备人工智能IP,将会有助于人工智能在终端设备广泛铺开,使得上亿、甚至数十亿台IOT设备都能够用上低功耗、低成本的AI芯片,使物联网芯片公司能够轻松地将AI集成到它们的设计中,并帮助它们将智能且价格实惠的产品带给全球数十亿的消费者。

NVIDIA副总裁兼自主机器事业部总经理Deepu Talla表示:“推理将成为每个物联网设备的核心能力。我们将与ARM一同推进这一趋势的发展,帮助数百家芯片公司轻松采用深度学习技术。”

此外,在今天的GTC 2018上,黄仁勋还宣布了英伟达的以下进展:

1、推出光线追踪RTX技术(ray-tracing),能够提供电影级画质的实时渲染,渲染出逼真的反射、折射和阴影画面。这一技术由英伟达在前不久的GDC全球游戏开发者大会上展示过;

2、推出第一款采用Volta架构的Quadro GV100 GPU,由两个GV100连接而成;

3、推出了第一款专用于医疗图像处理的超级电脑Clara;

4、新版Tesla V100内存升为32G,可与旧版无缝换插,支持更多人工智能的工作负载;

5、推出DGX-2超级电脑,采用了最新的NVSwitch链接,最多可同时连接16块Tesla V100 GPU,其速度可以达到DGX-1的10倍,算下来可以每秒下载14000 部电影,售价39.9万美元;

6、推出新版机器学习应用平台TensorRT 4,支持INT8与FP16精度,并与谷歌合作,将其整合进AI开源框架谷歌TensorFlow 1.7中;

7、宣布打造下一代名为DRIVE Orin的自动驾驶芯片,但除了名字外没有透露更多信息;

8、正式推出3D仿真自动驾驶测试平台DRIVE Constellation,这一测试平台英伟达在CES上展示过,能够帮助自动驾驶系统提升“姿势水平”;

9、推出ISAAC机器人仿真训练平台SDK,将训练机器人的技术开放出去;

值得一提的是,智东西去年5月时也对GTC 2017进行了一线深入报道,在去年的CEO主题演讲开场前,英伟达的股价一路飙升至121美元,总市值达到了714亿美元。而在今年开场前一晚,英伟达的股价已经冲到了244美元,总市值超过1479亿美元。在这10个月内,英伟达的股价与市值再次翻倍。

光线追踪(ray-tracing)技术开场

今天一大早,智东西来到了GTC大会现场,准备参加每年GTC的最重磅环节——CEO黄仁勋主题演讲。此时是早上8点,离9点开场还有整整一小时前,但是入口处已经排起了巨长的队伍。

今天,老黄依旧是万年不变的一身黑皮衣+黑裤子开场。

他开场介绍的第一个项目就是英伟达在前不久GDC上发布的NVIDIA RTX光线追踪技术(ray-tracing),这项技术是英伟达耗时10年打造的,能够提供电影级画质的实时渲染,渲染出逼真的反射、折射和阴影画面,几乎与真实世界的照片或视频很难区分开来。现场展示的视频片段就是用光线追踪技术实时渲染的,而且并不需要一个超级强大的超算电脑,只需要一台DGX-Station。

在真实世界中,我们看到的3D物体被光源照亮,且光子可以在到达观看者的眼睛以前从一个物体反弹到另一个物体。光线追踪技术则是反过来,通过从我们的眼睛(观景式照相机)反向追踪光线捕捉这些效果,通过追踪2D视表面上每个像素的光线的路径,并应用到场景的3D模型中。

可想而知,这种技术的计算量非常大,一般渲染复杂的特殊效果可能需要花上几天甚至几周的时间,所以此前该项技术一直仅限于高成本的电影制作中。

不过,目前,随着GPU性能日益强悍,能够支持光线追踪的电脑也越来越多,通过Volta架构的GPU配合英伟达的RTX技术,产品设计师、游戏设计师、建筑师们能够在几秒内即可生成逼真的产品模型。

此外,英伟达还宣布GameWorks SDK 将添加一个光线追踪降噪模块。更新版 GameWorks SDK 即将推出,其中包含光线追踪区域阴影和光线追踪光泽反射。

新版Quadro GV100,首次采用Volta架构

与此同时,英伟达还在现场推出了Quadro GV100 GPU,同时也是同系列产品中第一个采用Volta架构的,因此能够搭载RTX技术的。

Quadro GV100由两个GV100连接而成,一共拥有10240个CUDA核,可达236 TFLOPS Tensor Cores。与此同时,老黄又玩起了“买GPU省钱”的梗——“你买的GPU越多,就越省钱(The more you buy, the more you save.)”,这一个梗再次贯穿了全场。

推出医疗专用超级电脑Clara,日常diss摩尔定律

接着,话锋一转,老黄开始谈起了计算力,我们也进入了GTC的必备环节——diss摩尔定律。

在将近10年的GTC上,每年老黄都会提到同一主题——摩尔定律。在过去30年里,我们受益于摩尔定律,芯片所提供的计算能力每年都高速增长。然而在最近的几年里,摩尔定律开始失灵,芯片发展的速度已经跟不上我们需要的计算力增长速度。

因此,我们需要新定律。

而随着数据量与计算量爆发式地增长,人工智能、GPU、CUDA正在以一种极快的速度崛起,以GPU驱动的人工智能计算已经随处可见,并且渗入到各行各业当中去,教育、娱乐、工业、制造……这也引出了我们下一个话题——医疗。

老黄在现场推出了第一款专用于医疗图像处理的超级电脑Clara,它能够支持CUDA、CUDNN、TensorRT、OGL、以及刚刚提到的RTX技术。

在现场,老黄展示了一个医疗图像实时处理的影像片段。这个段影像是用十几年的超声波老设备拍摄而成,本来只能看到2D的黑白图像。然而当数据传进Clara后,配合人工智能软件,可以在2D图像中分析出3D的腔膛形状(图中红色部分)。因此,医院可以在现有医疗设备上直接接入这台电脑。

目前,英伟达正在和众多医疗厂商合作,除了GE通用电气三星电子等大厂外,还有像图玛深维、推想科技等AI医疗创业公司。

新品升级:新版Tesla V100、DGX-2超级电脑、TensorRT 4

在去年的GTC 2017上,老黄发布了一款名为Tesla V100的新版GPU,使用Volta架构,采用的是台积电的12nm Finfet工艺,具有5120个CUDA处理内核,16GB内存,能够为训练、推理应用提供120 tensor TFLOPS算力。

今天,老黄宣布,新版Tesla V100将内存升级一倍,达到32GB。

由于这几年间,CNN、RNN、GANs、Deep Q-Learning等算法不断变得复杂,更是对深度学习计算硬件提出了新挑战。因此,新版Tesla V100拥有更大的内存,使得它能够运行更大、更复杂的神经网络,在某些HPC应用上能够提供高于之前16GB版本50%的性能。微软已经宣布采用了新版Tesla V100,能够更快速地训练更加强大的深度神经网络。

此外,英伟达本次还推出的NVSwitch高速互联技术。此前英伟达曾经推出NVLink,支持最多8块GPU高速互联;如今NVSwitch技术可将这个数字翻上一倍,支持最多16块GPU同时互联。每一个GPU都能和另一个GPU进行超低延迟的通讯。

在去年GTC上,英伟达推出了搭载8块Tesla V100的超级电脑DGX-1,今天在GTC 2018现场老黄宣布,推出能够搭载16块新版Tesla V100的超级电脑DGX-2,比DGX-1还要快10倍。

DGX-2能够进行2 PFLOPS的计算,算下来可以每秒下载14000部电影,拥有512GB HBM2,功耗为10kw,350lbs,能够支持更大数据集、更复杂神经网络的计算。售价399000美元,今年Q3上市。

它其中搭载着被老黄称为“世界上最大的GPU”,共有81920个CUDA核,可达2000 TFLOPS Tensor Cores,拥有512GB HBM2。

此外,去年的GTC上,英伟达推出了“英伟达GPU云(NVIDIA GPU Cloud)”,但它不是一个云计算“云”,而是一个能让人轻易地从零开始搭建一个深度学习的项目。今天老黄宣布,AWS、阿里云、DGX、GCP、Oracle Cloud上都开始支持英伟达GPU云了。

而且,从CNN到LSTM再到GANs,现在的深度学习神经网络框架正变得越来越复杂、越来越多样、而且在日新月异地变化着,训练环节变得复杂了,应用(Inference)环节自然也变得非常复杂。

因此,老黄还在现场推出了最新版本的TensorRT——TensorRT 4,这是一款可编程应用平台(Programmable Inference Platform),当你将一个神经网络训练好了之后,可以通过TensorRT可编程平台,简便快捷地将这个训练好了的神经网络部署(Deploy)到英伟达的GPU上。

新版TensorRT 4能够支持INT8和FP16精度运算,能够将数据中心的功耗降低70%。而且,英伟达还与谷歌进行了深度合作,将TensorRT整合进如今最广泛应用的AI开源框架谷歌TensorFlow 1.7中。而且现在还能够加速图像、视频、语言、NLP等AI应用。

同时,老黄还在现场宣布,KUBERNETES现在能够支持GPU了。KUBERNETES能够在主机集群之间提供一个能够自动化部署、可拓展、应用容器可运营的平台,通常结合docker容器工具工作,并且整合多个运行着docker容器的主机集群,不仅能够提供更大的计算力,还能够有更大的容错空间。

打造下一代DRIVE Orin自动驾驶芯片

老黄在现场还展示了英伟达感知基础(Perception Infrastructure)项目,这是一个大型的深度学习模型,能够收集并分析不同传感器(如摄像机、雷达等等)得出的距离、天气、雷达感知、高精地图等等不同数据。

在接下来2-3年间,英伟达还将技术研发这一技术,直到最后能够搭载在所有新车上。老黄说,这是我们至今遇到的最为复杂的问题之一。

在现场,老黄还展示了英伟达DRIVE的研发路径,它们都基于同一框架、满足ADSL-D的安全标准、并且性能/功耗比非常高:从DRIVE PX Parker、到DRIVE PX 2、再到DRIVE Xavier、再到DRIVE Pegasus……

老黄说,虽然DRIVE Pegasus已经非常强大了,但是,英伟达还会打造下一代名为DRIVE Orin的芯片,不过现场没有透露更多信息。

推出自动驾驶仿真测试平台DRIVE Constellation

在今年1月的CES上,老黄曾经展示了一个全新的3D自动驾驶仿真测试平台。而今天,老黄正式推出了这款名为DRIVE SIM and Constellation的3D自动驾驶仿真测试平台。

这款平台包括两个部分,先是在云端模拟照片级真实的图像,生成传感器数据(包括摄像头、雷达等)第二部分则包括将这些数据传到英伟达DRIVE Pegasus中,并运行全套自动驾驶软件,以帮助训练该自动驾驶系统提升“姿势水平”。

在实际演示中,英伟达的新仿真平台显得十分强大,不仅有传统一点的实时车导线规划、其他车辆识别,而且对环境的还原相当真实,复杂的光线条件也能够被模拟。测试人员还能够在平台内操纵、变化车辆传感器的探测范围。

另外,这个平台还支持开发人员在虚拟环境中“人为驾驶”一辆车作出各种危险动作来考验测试车,来考验测试车的算法。

会上,老黄还宣布,目前英伟达自动驾驶合作伙伴的数量已经达到了370家,其中包括整车厂、一级供应商、以及200+家创企。

与自动驾驶仿真测试平台相似的,英伟达还在去年推出了专用于机器人的仿真测试平台——ISAAC机器人训练模拟世界。你可以用这个虚拟世界来训练机器人前进、后退、转弯、躲避行人等。

今天,老黄宣布将ISAAC平台的技术开放出去,推出ISAAC SDK。

此外,英伟达此前还推出过一款VR多人交互平台Holodeck。在今天的GTC 2018上,英伟达还展示了一个非常有趣、也非常’黑科技“的DEMO:在Holodeck虚拟世界里远程控制现实世界里的汽车。(看过《黑豹》的同学大概可以理解一下)

上文提到,今年的GTC 2018比较神奇,最为重磅的消息选择了在提前秘密发布,而不是在GTC Keynote现场——英伟达重磅宣布,将联合芯片巨头ARM打造AI芯片专用IP,这款IP属于ARM几年2月公布的Trillium项目的一部分,其技术源于英伟达Xavier芯片以及去年开源的DLA深度学习加速器项目。

英伟达本次宣布同AEM合作,将在数十亿物联网设备上实现深度学习。NVIDIA深度学习加速器IP将集成到Arm的Project Trillium平台中,以便于构建深度学习IoT芯片。

去年,英伟达也正式免费开源了完整版DLA(Deep Learning Accelerator,深度学习加速器),让厂商可以免费下载使用,打造属于自己的低功耗AI芯片(比如IoT芯片)。

今年2月,芯片巨头ARM公布了其人工智能项目Trillium,同时推出两款专用IP,分别为物体检测OD处理器和机器学习ML处理器。

ARM是全球智能设备第一大主流芯片架构提供商,全球超过90%的智能设备采用了ARM的芯片架构,包括手机、平板、手表、电视、无人机等等。而英伟达,作为全球AI浪潮的引领者,能够为人工智能提供强大的计算力,二者一拍即合。

本次ARM牵手英伟达推出专用的IOT设备人工智能IP,将会有助于人工智能在终端设备广泛铺开,使得上亿、甚至数十亿台IOT设备都能够用上低功耗、低成本的AI芯片,使物联网芯片公司能够轻松地将AI集成到它们的设计中,并帮助它们将智能且价格实惠的产品带给全球数十亿的消费者。

NVIDIA副总裁兼自主机器事业部总经理Deepu Talla表示:“推理将成为每个物联网设备的核心能力。我们将与ARM一同推进这一趋势的发展,帮助数百家芯片公司轻松采用深度学习技术。”

结语:更多精彩敬请期待

今年,共有超过8000人来到了GTC 2018现场,150个展位。值得一提的是,英伟达也在推动女性在科技行业中的力量,今年女性占据了GTC 2018总开发者的8%,总参会者的10%,以及11%的演讲者。

每年的GTC上,除了英伟达的各类主业务负责人的交流沟通会议、来自大大小小各类开发者或技术大牛的主题演讲外、还有150家英伟达的合作企业布设展位,以供开发者与媒体参观交流。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9501

    浏览量

    388808
  • 人工智能
    +关注

    关注

    1813

    文章

    49750

    浏览量

    261615
  • 英伟达
    +关注

    关注

    23

    文章

    4041

    浏览量

    97693

原文标题:英伟达GTC 2018最全记录,十大亮点都在这里!

文章出处:【微信号:Anxin-360ic,微信公众号:芯师爷】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA新闻:英伟10亿美元入股诺基亚 英伟推出全新量子设备

    研发并推出相关产品。 英伟CEO黄仁勋出现在美国华盛顿的GTC DC大会上的演讲中表示;“今天我们宣布与诺基亚建立了合作关系,诺基亚是世界第二大电信制造商,这是一个价值3万亿美元的产业。”黄仁勋说,全世界有数百万个基站,双方合
    的头像 发表于 10-29 17:12 1309次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:23

    智能人工智能智能制造专业委员会委员

    近日,智能收到来自深圳上市公司协会颁发的证书,凭借在人工智能技术研发与应用领域的实践成果,当选深上协“人工智能智能制造专业委员会”委员
    的头像 发表于 07-29 16:36 673次阅读

    英伟拟再推中国特供GPU,今年6月量产!

    。                                                     最新消息显示,英伟拟新推出一款专门面向中国市场的人工智能芯片,且最早将于今
    发表于 05-27 00:03 4611次阅读

    英伟Q3将发布新一代人工智能系统

    5月19日消息,据外媒报道,在台北国际电脑展上;黄仁勋宣布英伟将于2025年第三季度推出下一代GB300人工智能系统。 据悉,GB300 虽然与上一代 GB200 拥有相同的物理占地
    的头像 发表于 05-19 18:02 528次阅读

    Arm发布人工智能就绪指数报告

    人工智能 (AI) 已经迅速从未来的概念蜕变为眼下的关键商业工具。然而,面对 AI 的无限可能,企业是否已经做好充分准备?为探索这一关键问题,Arm 调研并发布了《人工智能就绪指数报告》。
    的头像 发表于 04-09 09:19 688次阅读

    IBM携手英伟AI数据平台推动企业级AI创新

    , 帮助企业更有效地将数据用于构建、扩展和管理生成式人工智能(Gen AI)工作负载和 AI 智能体应用 。此外,IBM 将在混合云基础架构产品 IBM Fusion 中加入 内容感知存储 功能,并扩展
    发表于 03-24 19:20 415次阅读

    英伟与xAI签AI基建协议 加入全球人工智能基础设施投资合作伙伴联盟

    全球人工智能基础设施投资合作伙伴联盟“Global AI Infrastructure Investment”联盟是由贝莱德及其旗下的全球基础设施合伙公司(GIP)、微软与阿联酋投资机构MGX于去年
    的头像 发表于 03-20 13:58 991次阅读

    英伟携手Illumina与Mayo Clinic推动医疗健康创新

    近日,英伟宣布了一项重大合作计划,旨在与Illumina公司、Mayo Clinic以及其他医疗保健组织携手,共同推动医疗健康行业的创新发展。这一合作被视为英伟鼓励该行业积极采用
    的头像 发表于 01-16 10:40 914次阅读

    荷兰与英伟、AMD商讨共建人工智能设施

    荷兰政府正在积极寻求与全球领先的科技公司英伟和AMD的合作,共同推动荷兰人工智能设施的建设与发展。 据荷兰政府官方网站的消息,荷兰经济事务大臣迪尔克·贝尔亚尔茨于近日对美国硅谷进行了访问,期间
    的头像 发表于 01-10 13:36 1015次阅读

    美银分析师:英伟加大“物理AI”投入为明智之举

    近日,美国银行的分析师对英伟在“物理AI”领域的最新动向发表了评论。分析师指出,英伟决定加大对“物理AI”的投入,是其在人工智能领域发展
    的头像 发表于 01-08 10:51 742次阅读

    微软大手笔采购英伟AI芯片

    据全球知名市场调研机构Omdia的最新估计,微软在2024年的英伟Hopper架构芯片采购计划上展现出了惊人的手笔。这一举动旨在帮助微软在构建下一代人工智能(AI)系统的激烈竞争中抢占先机。 据悉
    的头像 发表于 12-20 15:50 955次阅读

    EQTY Lab携手英特尔、英伟发布可验证计算AI框架

    瑞士人工智能解决方案领域的佼佼者EQTY Lab,于近日宣布了一项重大合作成果。该公司携手全球领先的计算技术提供商英特尔和图形处理巨头英伟,共同推出了可验证计算
    的头像 发表于 12-20 10:46 1000次阅读

    Banana Pi 携手 ArmSoM 推出人工智能加速 RK3576 CM5 计算模块

    的机器学习和人工智能 (ML 和 AI) 工作负载,以及 Arm Mali G52-MC3 图形处理器和支持 H.264/H.265/MJPEG 编码和 H.265/H.265/VP9/AVI1/AVS2
    发表于 12-11 18:38