0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度自研AI芯片昆仑解读 与国产处理器飞腾良好适配

工程师邓生 来源:雷锋网 作者:包永刚 2020-04-03 08:56 次阅读

4月2日下午,百度智能芯片总经理欧阳剑在一场公开课中首次对昆仑芯片进行了详细分享,并公开了昆仑K200与英特尔T4 GPU的多项对比数据,其中最有优势的一项数据是Gemm-Int8 的Benchmark是T4性能的3倍。欧阳剑还通过视频展示了昆仑芯片的杀手锏,与国产处理器飞腾的良好适配。

2018年的百度AI开发者大会上,百度创始人、董事长兼CEO李彦宏宣布推出自研AI芯片昆仑。百度研发AI芯片的积累得益于其用FPGA做AI加速的积累,也得益于其在软件定义加速器和XPU架构的多年积累。

百度最早在2010年开始用FPGA做AI架构的研发,2011年开展小规模部署上线,2017年部署超过了10000片FPGA,2018年发布自主研发AI芯片,2019年下半年流片成功,2020年开始量产。

昆仑芯片的定位是通用AI芯片,目标是提供高性能、低成本、高灵活性的AI芯片。欧阳剑在分享中说:“相比GPU,昆仑芯片的通用性和可编程性都做的不错,并且我们还在努力把编程性做的更好。”

昆仑发布之后,其相关消息陆续公布。架构方面,昆仑有2个计算单元,512GB/S的内存带宽,16MB SRAM/unit。欧阳剑介绍,16MB的SRAM对AI推理很有帮助,XPU架构上的XPU-SDNN是为Tensor等而设计,XPU-Cluster则能够满足通用处理的需求。

昆仑第一代芯片并没有采用NVLink,而是通过PCIE 4.0接口进行互联。在三星14nm的制造工艺和2.5D封装的支持下,昆仑芯片峰值性能可以达到260TOPS,功耗为150W。

在灵活性和易用性方面,昆仑面向开发者提供类似英伟达CUDA的软件栈,可以通过C/C++语言进行编程,降低开发者的开发难度。

目前,基于第一代昆仑芯片,百度推出了两款AI加速卡,K100和K200,前者算力和功耗都是后者的两倍。

在今天的分享中,欧阳剑给出了一系列K200对比英伟达T4的数据,其中在Gemm-Int8数据类型,4K X 4K的矩阵下,昆仑K200的Benchmark分出超过2000,是英伟达T4的3倍多。

在语音常用的Bert/Ernie测试模型下,昆仑也有明显性能优势。

在线上性能数据的表现上,昆仑的表现相比英伟达T4更加稳定,且延迟也有优势。

在图像分割YOLOV3算法中,昆仑虽然有优势,但优势已经不那么明显。不过欧阳剑表示百度仍然在通过持续的优化提高昆仑的性能。

他同时表示,昆仑已经在百度内部规模应用。至于对外提供AI算力,去年12月13日百度通过定向邀请的方式通过百度云提供昆仑的算力。在与欧阳剑的直播互动中,雷锋网(公众号:雷锋网)了解到通过百度云提供昆仑AI算力目前仍然是定向邀请的方式,且主要是私有部署的方式。百度会通过定向邀请的客户的反馈消息,再通过百度云大规模向外提供昆仑的算力,但他没有给出具体的时间线。

除了通过百度云提供昆仑的算力,欧阳剑也展示了昆仑加速卡在工业智能设备中的应用。欧阳剑演示的是用CPU和昆仑加速卡去进行产品缺陷检测,昆仑可以大幅提升速度,但并没有给出具体的对比数据。

另外一个展示则是昆仑的杀手锏,那就是和国产处理器平台飞腾的适配。在2019飞腾生态伙伴大会上,欧阳剑就透露昆仑AI芯片正在适配国产飞腾服务器,做性能调优工作。在今天的线上分享中,欧阳剑展示了采用昆仑加速卡带来的图像分割速度的显著加速。

飞腾CPU处理器采用的是Armv8指令级,主要用在数据中心云计算中心,作为国产芯的代表,昆仑选择与飞腾进行很好地适配显然是看中了国产自研芯片的大市场。

通过飞腾CPU+昆仑AI加速器的方式,双方可以更好的实现国产芯片在服务器市场的国产化,也可以视为昆仑AI芯片和加速卡未来增长的一个重要动力和杀手锏。

责任编辑:wv

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18275

    浏览量

    222164
  • 百度
    +关注

    关注

    9

    文章

    2171

    浏览量

    88921
  • AI芯片
    +关注

    关注

    17

    文章

    1652

    浏览量

    34383
收藏 人收藏

    评论

    相关推荐

    国产飞腾FT2000/4、D2000处理器的 Mini ITX 工控主板产品特点

    电子发烧友网站提供《国产飞腾FT2000/4、D2000处理器的 Mini ITX 工控主板产品特点.pdf》资料免费下载
    发表于 02-23 09:57 3次下载

    飞腾2000 4核处理器国产主板介绍# 飞腾主板# 国产主板# 飞腾处理器

    处理器服务
    jf_67464575
    发布于 :2024年02月03日 10:15:41

    飞腾派开发板评测获奖名单公布!!!

    研发的一款面向行业工程师、学生和爱好者的开源硬件。主板处理器采用飞腾嵌入式四核处理器,兼容ARM V8架构,包含2个FTC664核和2个FTC310核,其中FTC664核主频可达1.8GHz
    发表于 01-30 17:02

    飞腾派4G版免费试用】飞腾派4G版开发板套装测试及环境搭建

    先简单介绍一下这款飞腾派4G版开发板套装; 飞腾派是由中电港萤火工场研发的一款面向行业工程师、学生和爱好者的开源硬件。主板处理器采用飞腾嵌入式四核
    发表于 01-22 00:47

    飞腾派4G版免费试用】来更多的了解飞腾派4G版开发板!

    飞腾派4G版开发板是由中电港萤火工场与飞腾合作推出的飞腾派,搭载飞腾定制嵌入式芯片,采用飞腾自主
    发表于 01-22 00:34

    飞腾派4G版免费试用】测试用飞腾派安装OpenHarmony

    飞腾派开发板是萤火工场研发的一款面向行业工程师、学生和爱好者的开源硬件。主板处理器采用飞腾定制四核处理器,该处理器兼容 ARM V8 指令集
    发表于 01-13 22:02

    飞腾派4G版免费试用】飞腾派开发板运行Ubuntu系统

    工程师、学生和爱好者的开源硬件。主板处理器采用飞腾嵌入式四核处理器,兼容ARM V8架构,包含2个FTC664核和2个FTC310核,其中FTC664核主频可达1.8GHz,FTC310核主频可达
    发表于 01-08 22:40

    飞腾派4G版免费试用】大家来了解飞腾派4G版开发板

    、OpenHarmony、SylixOS、RT-Thread等国产操作系统。 飞腾派4G版开发板是由中电港萤火工场研发的一款面向行业工程师、学生和爱好者的开源硬件。主板处理器采用飞腾
    发表于 01-02 22:43

    飞腾派4G版免费试用】初步认识飞腾派4G版开发板

    小 内置陶瓷天线。 官方的介绍资料: 飞腾派是由中电港萤火工场研发的一款面向行业工程师、学生和爱好者的开源硬件。主板处理器采用飞腾嵌入式四核处理器,兼容ARM V8架构,包含2个FTC
    发表于 01-02 22:23

    飞腾派4G版免费试用】1.开箱与镜像烧录

    的高能效异构多核处理器技术,具有模块化、易上手、全开源、低成本的特点,大大降低了国产处理器的开发使用门槛,解决了国产处理器难以普及推广的问题
    发表于 12-08 12:47

    飞腾派开发板资料免费下载!!!

    飞腾派开发板是萤火工场研发的一款面向行业工程师、学生和爱好者的开源硬件。 主板处理器采用飞腾定制四核处理器,该处理器兼容 ARM V8 指令
    发表于 12-05 15:03

    飞腾派4G版免费试用】第一篇:开箱见面和资料下载

    ,^_^),看来你们合作的非常好。 5、 进入电子发烧友之后,在飞腾派社区有飞腾派最全资料包, 6、通过百度网盘可以选择性下载,要是像我一样买不起百度网盘会员那慢慢下载。
    发表于 12-05 14:10

    飞腾派4G版免费试用】快速开箱

    了吗,来自咱们同样是国产之光长江存储的闪存颗粒(矿老板认证的金刚不坏身)飞腾 长鑫 长江这下齐聚一堂了,望这三家早日将海外的市场份额也尽数收下 找到我们之前通过百度网盘下载的镜像路径,通过终端进入
    发表于 12-05 10:45

    昆仑太科发布支持国产飞腾腾锐D2000芯片的开源BIOS固件版本

    近日,中国首家开源固件社区OpenKunlun,发布了由昆仑太科(北京)技术股份有限公司(以下简称“昆仑太科”)贡献的,支持国产飞腾腾锐D2000
    的头像 发表于 09-21 09:17 1652次阅读

    生态合作再度升级!昆仑芯已入驻飞桨AI Studio硬件生态专区

    8月16日,昆仑芯在Wave Summit 2023深度学习开发者大会上正式宣布与百度联合发起飞桨+文心大模型硬件生态共创计划。双方将强强联合,进一步推进在昆仑芯硬件上与飞桨+文心大模型的适配
    的头像 发表于 08-18 10:12 1530次阅读