0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能最后一公里,Google和英伟达谁能跑得赢?

DPVg_AI_era 来源:lq 2019-05-05 10:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。

边缘智能被称作是人工智能的最后一公里。

Google刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:

英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派嵌入式电脑设备,其搭载了四核Cortex-A57处理器GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。

目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。

Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。

首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。

对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。

对比结果

先来看最终的结果:

线性刻度,FPS

对数刻度,FPS

线性刻度,推理时间(250x)

Sam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。

对比分析

第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。

我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。

NVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。

然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。

NVIDIA Jetson Nano

尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:

它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。

来源:NVIDIA

Google Coral Edge TPU

Sam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。

Penny for scale,来源:谷歌

Edge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。

Google Coral Edge TPU USB加速器

下图显示了Edge TPU的基本原理。

来源:谷歌

像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:

卷积

这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。

我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。

总结

为什么GPU没有8位模型?

GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。

为何选择MobileNetV2?

主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。

Edge TPU还有哪些其他产品?

它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。

Raspberry Pi + Coral与其他人相比

为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口

i7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。

来源:NVIDIA

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53534

    浏览量

    459040
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261495
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97663

原文标题:最新千元边缘AI芯片比拼:谷歌Coral和英伟达Jetson谁更厉害?

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    物理人工智能面临的安全风险

    具备通用人工智能的人形机器人距离真正进入我们的日常生活还有数年时间,但特定应用领域的机器人早已问世。从亚马逊物流中心的机器人车队,到手术室的外科手术机器人、搜救机器狗、自主无人机和最后一公里配送
    的头像 发表于 11-17 10:54 638次阅读
    物理<b class='flag-5'>人工智能</b>面临的安全风险

    爱芯元智AI原生处理器释放智能生产力

    近年来,人工智能产业持续高速发展,大模型技术不断突破,为各行各业带来广阔的应用想象空间。与此同时,AI算力部署正从云端加速向边缘和终端延伸,边缘AI凭借其低延迟、高隐私和性价比等优势,成为推动AI普惠化的最后一公里基建。
    的头像 发表于 09-10 11:42 656次阅读
    爱芯元智AI原生处理器释放<b class='flag-5'>智能</b>生产力

    光缆一公里衰减多少db

    光缆每公里的衰减范围因光纤类型、工作波长、制造工艺及使用条件而异,典型值如下: 、按光纤类型和工作波长划分 单模光纤 1310nm波长:衰减系数通常为 0.3~0.4 dB/km,典型值为
    的头像 发表于 08-13 15:37 3322次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 、开箱即学,便捷拉满 这个实验箱真的
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 、开箱即学,便捷拉满 这个实验箱真的
    发表于 08-07 14:23

    云翎智能巡检终端:以“北斗+”破解森林巡检“最后一公里”难题

    在森林巡检领域,“最后一公里”难题长期困扰着传统管理模式——偏远林区信号覆盖差、人工巡检效率低、数据回传滞后、应急响应不及时等问题,导致火情监测、盗伐取证、生态保护等关键环节存在盲区。云翎智能
    的头像 发表于 05-27 10:21 476次阅读
    云翎<b class='flag-5'>智能</b>巡检终端:以“北斗+”破解森林巡检“<b class='flag-5'>最后</b><b class='flag-5'>一公里</b>”难题

    英伟拟再推中国特供GPU,今年6月量产!

    。                                                     最新消息显示,英伟拟新推出款专门面向中国市场的人工智能芯片,且最早将于今
    发表于 05-27 00:03 4599次阅读

    英伟Q3将发布新一代人工智能系统

    5月19日消息,据外媒报道,在台北国际电脑展上;黄仁勋宣布英伟将于2025年第三季度推出下代GB300人工智能系统。 据悉,GB300 虽然与上
    的头像 发表于 05-19 18:02 526次阅读

    北斗有源终端:打通应急通信‘最后一公里’的关键技术

    在自然灾害频发、通信设施易受破坏的紧急情况下,应急通信的“最后一公里”问题尤为突出。北斗有源终端作为依托中国自主研发的北斗卫星导航系统的重要设备,凭借其强大的定位功能和稳定的通信能力,成为打通应急
    的头像 发表于 04-02 10:11 653次阅读
    北斗有源终端:打通应急通信‘<b class='flag-5'>最后</b><b class='flag-5'>一公里</b>’的关键技术

    英伟与xAI签AI基建协议 加入全球人工智能基础设施投资合作伙伴联盟

    全球人工智能基础设施投资合作伙伴联盟“Global AI Infrastructure Investment”联盟是由贝莱德及其旗下的全球基础设施合伙公司(GIP)、微软与阿联酋投资机构MGX于去年
    的头像 发表于 03-20 13:58 983次阅读

    英伟携手Illumina与Mayo Clinic推动医疗健康创新

    近日,英伟宣布了项重大合作计划,旨在与Illumina公司、Mayo Clinic以及其他医疗保健组织携手,共同推动医疗健康行业的创新发展。这合作被视为
    的头像 发表于 01-16 10:40 907次阅读

    荷兰与英伟、AMD商讨共建人工智能设施

    荷兰政府正在积极寻求与全球领先的科技公司英伟和AMD的合作,共同推动荷兰人工智能设施的建设与发展。 据荷兰政府官方网站的消息,荷兰经济事务大臣迪尔克·贝尔亚尔茨于近日对美国硅谷进行了访问,期间
    的头像 发表于 01-10 13:36 1014次阅读

    美银分析师:英伟加大“物理AI”投入为明智之举

    近日,美国银行的分析师对英伟在“物理AI”领域的最新动向发表了评论。分析师指出,英伟决定加大对“物理AI”的投入,是其在人工智能领域发展
    的头像 发表于 01-08 10:51 742次阅读

    微软大手笔采购英伟AI芯片

    据全球知名市场调研机构Omdia的最新估计,微软在2024年的英伟Hopper架构芯片采购计划上展现出了惊人的手笔。这举动旨在帮助微软在构建下一代人工智能(AI)系统的激烈竞争中抢
    的头像 发表于 12-20 15:50 952次阅读

    EQTY Lab携手英特尔、英伟发布可验证计算AI框架

    瑞士人工智能解决方案领域的佼佼者EQTY Lab,于近日宣布了项重大合作成果。该公司携手全球领先的计算技术提供商英特尔和图形处理巨头英伟,共同推出了可验证计算
    的头像 发表于 12-20 10:46 994次阅读