0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Nvidia与ARM共同合作打造AI芯片专用IP

mK5P_AItists 来源:未知 作者:邓佳佳 2018-04-02 10:13 次阅读

一年一度的GTC至今已经迎来了第十个年头,虽然它每年或多或少的给网友一些“失望”,但它也终究是代表着GPU行业的高水平技术大会。那么,今年的GTC大会,英伟达又给业界带来了哪些惊喜呢?

日前,英伟达公司创始人兼首席执行官黄仁勋宣布了该公司在芯片AI 平台、自动驾驶上的一系列新动作。

一、光线追踪(ray-tracing)

开场介绍的第一个项目就是英伟达在前不久GDC上发布的NVIDIA RTX光线追踪技术(ray-tracing),这项技术是英伟达耗时10年打造的,能够提供电影级画质的实时渲染,渲染出逼真的反射、折射和阴影画面,几乎与真实世界的照片或视频很难区分开来。现场展示的视频片段就是用光线追踪技术实时渲染的,而且并不需要一个超级强大的超算电脑,只需要一台DGX-Station。

在真实世界中,我们看到的3D物体被光源照亮,且光子可以在到达观看者的眼睛以前从一个物体反弹到另一个物体。光线追踪技术则是反过来,通过从我们的眼睛(观景式照相机)反向追踪光线捕捉这些效果,通过追踪2D视表面上每个像素的光线的路径,并应用到场景的3D模型中。

可想而知,这种技术的计算量非常大,一般渲染复杂的特殊效果可能需要花上几天甚至几周的时间,所以此前该项技术一直仅限于高成本的电影制作中。

不过,目前,随着GPU性能日益强悍,能够支持光线追踪的电脑也越来越多,通过Volta架构的GPU配合英伟达的RTX技术,产品设计师、游戏设计师、建筑师们能够在几秒内即可生成逼真的产品模型。
二、新版Quadro GV100,首次采用Volta架构

Quadro GV100 具有 32GB 内存,且可借助 NVIDIA NVLink 2 互联技术,通过并联两块 Quadro GPU 扩展至 64GB,在所有适用于此类应用的平台中其性能最高。

在性能方面,GV100 基于 NVIDIA Volta GPU 架构,可提供每秒 7.4 万亿次浮点运算的双精度性能、每秒 14.8 万亿次浮点运算的单精度性能、以及每秒 118.5 万亿次浮点运算的深度学习性能。NVIDIA RTX 内置的 NVIDIA OptiX AI-denoiser 可实现实时的 AI 去噪,英伟达表示且其性能相当于采用 CPU 时的 100 倍。


三、医疗图像处理超级电脑Clara

黄仁勋在现场推出了第一款专用于医疗图像处理的超级电脑Clara,它能够支持CUDA、CUDNN、TensorRT、OGL、RTX技术。

在现场,黄仁勋展示了一个医疗图像实时处理的影像片段。这个段影像是用十几年的超声波老设备拍摄而成,本来只能看到2D的黑白图像。然而当数据传进Clara后,配合人工智能软件,可以在2D图像中分析出3D的腔膛形状(图中红色部分)。因此,医院可以在现有医疗设备上直接接入这台电脑。

目前,英伟达正在和众多医疗厂商合作,除了GE通用电气三星电子等大厂外,还有像图玛深维、推想科技等AI医疗创业公司。

四、新版 TensorRT 推理软件 TensorRT 4,并将 TensorRT 集成至谷歌的 TensorFlow 框架。

这是一款可编程应用平台(Programmable Inference Platform),当你将一个神经网络训练好了之后,可以通过TensorRT可编程平台,简便快捷地将这个训练好了的神经网络部署(Deploy)到英伟达的GPU上。

新版TensorRT 4能够支持INT8和FP16精度运算,能够将数据中心的功耗降低70%。

而且,英伟达还与谷歌进行了深度合作,将TensorRT整合进如今最广泛应用的AI开源框架谷歌TensorFlow 1.7中。而且现在还能够加速图像、视频、语言、NLP等AI应用。

英伟达表示,TensorRT 4 可用于快速优化、验证及部署在超大规模数据中心、嵌入式与汽车 GPU 平台中经过 训练的神经网络。相比 CPU,针对计算机视觉、神经网络机器翻译、自动语音识别、语音合成 与推荐系统等常见应用,该软件最高可将深度学习推理的速度加快 190 倍。而且为了进一步精简开发,英伟达与谷歌的工程师已将 TensorRT 集成至 TensorFlow 1.7,使得在 GPU 上运行深度学习推理应用更加容易。

五、AI平台新进展

如同往届,黄仁勋对英伟达 AI 平台做了介绍,公布了其中的一系列重要进展,包括全新 Tesla V100 32GB GPU 的 2 倍内存、革命性的 NVSwitch 结构、以及全面的软件堆栈推动性能提升、深度学习工作站 DGX-2 成为首款性能高达每秒 2 千万亿次浮点运算的深度学习系统、发布深度学习引擎 TensorRT 4 等。英伟达表示,相较于六个月前发布的上一代产品 DGX-1,其深度学习工作负载性能实现了 10 倍提升。

在大会上,黄仁勋宣布,新版的 Tesla V100 内存扩容了一倍。「5 年前 AlexNet 在 ImageNet 上展示了突破性的能力,」黄仁勋说道,「它有 8 层,数百个参数。而今天我们能够看到数百层的神经网络,内含数十亿参数,深度学习模型经过五年的发展,体量扩大了 500 倍。」

而这样的计算需求可由「世界上最大的 GPU」DGX-2 进行处理,它是由 16 块 32GB 内存的 Tesla V100 计算卡通过 NVSwitch 进行连接(显卡间的通信速度是 PCI 的 20 倍,每秒 300Gbyte)所组成的,共拥有 2000TFPLOS 的 Tensor Core 算力,售价 39.9 万美元。NVSwitch 是今天黄仁勋宣布的全新的 GPU 互联结构。

DGX-2 是首款能够提供每秒两千万亿次浮点运算能力的单点服务器,具有 300 台服务器的深度学习处理能力,占用 15 个数据中心机架空间,而体积则缩小 60 倍,能效提升 18 倍。

而后,黄仁勋宣布了英伟达在 AI 推理上的一系列动作。黄仁勋表示,基于在数据中心、汽车应 用、以及包括机器人无人机等嵌入式设备领域中,诸如语音识别、自然语言处理、推荐系统、 以及图像识别等新功能的支持,面向深度学习推理的 GPU 加速正在获得越来越多的关注。

「我们需要超级计算机来帮助自己寻找更高效的能源存储方法,探索地球的内部,预测未来的自然灾害,以及模拟微观世界的变化。」黄仁勋说道。

六、下一代DRIVE Orin自动驾驶芯片

黄仁勋在现场还展示了英伟达感知基础(Perception Infrastructure)项目,这是一个大型的深度学习模型,能够收集并分析不同传感器(如摄像机、雷达等等)得出的距离、天气、雷达感知、高精地图等等不同数据。

在接下来2-3年间,英伟达还将技术研发这一技术,直到最后能够搭载在所有新车上。黄仁勋说,这是我们至今遇到的最为复杂的问题之一。

七、推出 DRIVE Constellation 仿真系统

自动驾驶一直是 GTC 大会的重要部分,今天,英伟达展示了一套用于使用照片级真实感模拟,基于云的自动驾驶汽车测试系统。

该系统被称为 NVIDIA DRIVE Constellation,是一种基于两种不同服务器的计算平台。第一台服务器运行 NVIDIA DRIVE Sim 软件,用以模拟自动驾驶汽车的传感器,如摄像头、激光雷达和雷达。第二台服务器搭载了 NVIDIA DRIVE Pegasus AI 汽车计算平台,可运行完整的自动驾驶汽车软件堆栈,并能够处理模拟数据,这些模拟数据如同来自路面行驶汽车上的传感器。

要实现自动驾驶汽车的量产部署,我们需要一种能够在数十亿英里的行驶中进行测试和验证的解决方案,以实现足够安全性和可靠性。黄仁勋介绍说,DRIVE Constellation 可以将视觉计算和数据中心方面的专业知识相结合以实现这一目标。借助虚拟现实技术,测试者可通过对数十亿英里的自定义场景和极端情况进行测试,从而提高算法的稳定性,而花费的时间和成本仅为实际道路测试的一小部分。

八、联合芯片巨头ARM打造AI芯片专用IP

英伟达重磅宣布,将联合芯片巨头ARM打造AI芯片专用IP,这款IP属于ARM几年2月公布的Trillium项目的一部分,其技术源于英伟达Xavier芯片以及去年开源的DLA深度学习加速器项目。

英伟达本次宣布同ARM合作,将在数十亿物联网设备上实现深度学习。NVIDIA深度学习加速器IP将集成到Arm的Project Trillium平台中,以便于构建深度学习IoT芯片。

去年,英伟达也正式免费开源了完整版DLA(Deep Learning Accelerator,深度学习加速器),让厂商可以免费下载使用,打造属于自己的低功耗AI芯片(比如IoT芯片)。

今年2月,芯片巨头ARM公布了其人工智能项目Trillium,同时推出两款专用IP,分别为物体检测OD处理器机器学习ML处理器。

ARM是全球智能设备第一大主流芯片架构提供商,全球超过90%的智能设备采用了ARM的芯片架构,包括手机、平板、手表、电视、无人机等等。而英伟达,作为全球AI浪潮的引领者,能够为人工智能提供强大的计算力,二者一拍即合。

本次ARM牵手英伟达推出专用的IOT设备人工智能IP,将会有助于人工智能在终端设备广泛铺开,使得上亿、甚至数十亿台IOT设备都能够用上低功耗、低成本的AI芯片,使物联网芯片公司能够轻松地将AI集成到它们的设计中,并帮助它们将智能且价格实惠的产品带给全球数十亿的消费者。

NVIDIA副总裁兼自主机器事业部总经理Deepu Talla表示:“推理将成为每个物联网设备的核心能力。我们将与ARM一同推进这一趋势的发展,帮助数百家芯片公司轻松采用深度学习技术。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    446

    文章

    47769

    浏览量

    409067
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8648

    浏览量

    361750
  • NVIDIA
    +关注

    关注

    14

    文章

    4588

    浏览量

    101694
  • AI
    AI
    +关注

    关注

    87

    文章

    26423

    浏览量

    264024

原文标题:GTC2018八大热点:发布多项黑科技,联合芯片巨头ARM打造AI芯片专用IP

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    黑芝麻智能与腾讯云合作共同打造高性价比的智能驾驶系统解决方案

    黑芝麻智能和腾讯云将通过软硬一体的合作模式,共同打造高性价比的智能驾驶系统解决方案,推动云端、车端结合的自动驾驶芯片生态合作打造行业示范性
    的头像 发表于 04-24 16:50 385次阅读
    黑芝麻智能与腾讯云<b class='flag-5'>合作</b><b class='flag-5'>共同打造</b>高性价比的智能驾驶系统解决方案

    智原科技宣布加入Arm®(安谋)车用生态系的合作伙伴

    ASIC设计服务暨IP研发销售厂商智原科技(Faraday Technology Corporation,TWSE:3035)宣布加入Arm®(安谋)车用生态系的合作伙伴。智原采用Arm
    的头像 发表于 04-18 17:37 216次阅读

    NVIDIA和谷歌云宣布开展一项新的合作,加速AI开发

    NVIDIA 和谷歌云宣布开展一项新的合作,以帮助全球初创企业加速创建生成式 AI 应用和服务。
    的头像 发表于 04-11 14:03 158次阅读

    NVIDIA专用AI平台如何推动下一代医疗健康行业的发展

    医疗科技创新企业在 GTC 上介绍了 NVIDIA专用 AI 平台如何推动下一代医疗健康行业的发展。
    的头像 发表于 04-09 10:10 541次阅读

    智原与Arm合作提供基于Arm Neoverse CSS的设计服务

    ASIC设计服务暨IP研发销售厂商智原科技(Faraday Technology Corporation,TWSE:3035)正式宣布成为Arm Total Design的设计服务合作伙伴,凸显
    的头像 发表于 01-10 16:29 366次阅读

    异构专用AI芯片的黄金时代

    异构专用AI芯片的黄金时代
    的头像 发表于 12-04 16:42 281次阅读
    异构<b class='flag-5'>专用</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>的黄金时代

    Arm 携手行业领先企业,共同打造面向未来的 AI 基础

    NVIDIA 和高通技术公司等领先的科技企业携手合作,通过多项计划,聚焦于先进 AI 能力的实现,由此带来更快响应、更加安全的用户体验。这些合作计划将在所有计算进行之处,助力 150
    发表于 11-06 17:36 102次阅读

    Arm员工与合作伙伴共同携手推动Arm 计算平台发展

    今天,在美国纽约以及 Arm 全球各地的办公室,我们正在庆祝 Arm 再次上市,迈入构建计算未来的新篇章。 在过去 33 年的公司历程,Arm 的员工、合作伙伴和整个生态系统
    的头像 发表于 09-15 09:21 460次阅读

    谷歌云与 NVIDIA 扩大合作共同推进 AI 计算、软件和服务的发展

    Next 的炉边谈话中,谷歌云首席执行官 Thomas Kurian 与 NVIDIA 创始人兼首席执行官黄仁勋讨论了双方合作如何为全球一些最大的 AI 客户提供端到端的机器学习
    的头像 发表于 08-31 13:05 447次阅读
    谷歌云与 <b class='flag-5'>NVIDIA</b> 扩大<b class='flag-5'>合作</b>,<b class='flag-5'>共同</b>推进 <b class='flag-5'>AI</b> 计算、软件和服务的发展

    ServiceNow、NVIDIA 和埃森哲携手合作,助力企业加快采用生成式 AI

    业界首创的 AI 灯塔计划助力合作伙伴与客户合作共同制定基于生成式 AI 的计划,转变业务运营方式 ServiceNow(NYSE: NO
    的头像 发表于 07-31 20:40 472次阅读
    ServiceNow、<b class='flag-5'>NVIDIA</b> 和埃森哲携手<b class='flag-5'>合作</b>,助力企业加快采用生成式 <b class='flag-5'>AI</b>

    COMPUTEX2023 | WPP 与 NVIDIA 共同打造用于数字广告的生成式 AI 内容引擎

    基于 NVIDIA AI 和 Omniverse 打造的开创性引擎通过连接领先软件制造商的 3D 和 AI 创作工具,重塑品牌内容和体验 COMPUTEX—2023 年 5 月 29
    的头像 发表于 05-30 01:45 781次阅读
    COMPUTEX2023 | WPP 与 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>共同打造</b>用于数字广告的生成式 <b class='flag-5'>AI</b> 内容引擎

    NVIDIA 与软银公司合作,利用 Grace Hopper 超级芯片建设面向生成式 AI 和 5G/6G 的软银下一代数据中心

    宣布,双方正在合作打造一个基于 NVIDIA GH200 Grace Hopper 超级芯片 、面向生成式 AI 和 5G/6G 应用的开创
    的头像 发表于 05-30 01:40 443次阅读
    <b class='flag-5'>NVIDIA</b> 与软银公司<b class='flag-5'>合作</b>,利用 Grace Hopper 超级<b class='flag-5'>芯片</b>建设面向生成式 <b class='flag-5'>AI</b> 和 5G/6G 的软银下一代数据中心

    NVIDIA仍不死心,再次加入ARM站场

    加强联发科芯片在游戏和AI方面的功能与性能,计划最早于2024年将含有英伟达图形技术的GPU集成到联发科的芯片上。 目前联发科已成为Chromebook系统芯片的领先供应商之一,不少廉
    发表于 05-28 08:51

    ServiceNow与NVIDIA宣布联合打造面向企业IT的生成式AI

    2023年5月17日 - ServiceNow和NVIDIA今日宣布达成合作伙伴关系,将共同开发强大的企业级生成式AI功能,通过实现更快、更智能的工作流自动化来转变业务流程。
    的头像 发表于 05-19 18:06 1782次阅读
    ServiceNow与<b class='flag-5'>NVIDIA</b>宣布联合<b class='flag-5'>打造</b>面向企业IT的生成式<b class='flag-5'>AI</b>

    ServiceNow 与 NVIDIA 宣布联合打造面向企业 IT 的生成式 AI

    基于 ServiceNow 平台并采用 NVIDIA AI 软件和 DGX 基础设施构建的自定义大型语言模型将为企业带来更智能的工作流自动化 ServiceNow 和 NVIDIA 宣布达成
    的头像 发表于 05-19 00:50 365次阅读
    ServiceNow 与 <b class='flag-5'>NVIDIA</b> 宣布联合<b class='flag-5'>打造</b>面向企业 IT 的生成式 <b class='flag-5'>AI</b>