0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

鲲云发布超高效CAISA2.0架构 为AI提供更高算力支撑

渔翁先生 来源:鲲云科技 作者:鲲云科技 2019-04-10 10:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2019年4月9日,第二届全球人工智能应用创新峰会在深圳五洲宾馆举行,这场由深圳市科学技术协会、福田区科技创新局主办,鲲云科技、鲲云人工智能应用创新研究院和源创力创新中心承办的AI开年盛会上,鲲云科技发布全球第一款基于数据流技术打造的通用人工智能底层架构-定制数据流CAISA架构和端到端自动编译工具链RainBuilder,实现了国内完全自主产权的AI芯片架构,有效计算效率大幅领先国际水平,为人工智能算法的快速应用落地提供高性能算力支撑,推动我国人工智能芯片领域的技术革新和发展。深圳市人大常委会副主任、深圳市科协主席蒋宇扬,深圳市福田区委常委、副区长黄伟,深圳市源创力离岸创新中心总裁周路明,深圳市科协秘书长、办公室主任林肇武,深圳市福田区科技创新局、发展和改革局和工业和信息化局等单位负责同志出席峰会。

打破摩尔定律局限,鲲云发布全球首款通用底层AI架构-定制数据流CAISA架构

牛昕宇博士

作为本次峰会的重头戏,鲲云科技创始人&CEO牛昕宇博士在会上发布了定制数据流CAISA2.0架构。依托创始团队在数据流架构领域近三十年的积累,鲲云的CAISA架构抛弃了传统基于指令集的架构方式,是全球第一款基于数据流技术打造的通用人工智能底层架构,可发挥90%以上的芯片峰值计算性能,大幅领先国际主流AI芯片。同时,鲲云还在会上发布了针对数据流架构定制开发的RainBuilder编译工具链,CAISA2.0架构可支持Tensorflow,Caffe等开源框架下开发的主流深度学习算法的无缝迁移,无需用户进行面向CAISA架构的编程。基于Arria10 SX160、SX660、GX1150,Straix10 GX2800系列的FPGA加速卡已完成开发并应用于产品落地中。

(定制数据流CAISA2.0架构)

随着人工智能技术的深入发展,对人工智能芯片的算力提出了更高的要求,算力成为了决定算法落地的重中之重。尤其是在云计算自动驾驶、安防工业等领域,算力的提升更是能够直接带来更多的用户量、更多的前端设备智能升级和更安全的自动驾驶汽车。正如图灵奖得主John Hennessey和 David Patterson在图灵奖颁奖典礼所言,未来十年,随着摩尔定律逐步饱和,人工智能芯片的峰值算力将逐步趋近饱和,而架构效率将成为芯片性能的决定因素,未来十年将是计算架构的“黄金十年”。鲲云科技自主研发的CAISA2.0架构以及RainBuilder编译工具链,没有采用主流计算机架构下大规模并行指令集设计的思路,通过完全不同的数据流架构突破底层架构的效率瓶颈,最大化发挥底层硬件的效率,在同等峰值芯片性能情况下可以为人工智能应用提供更高的算力支撑。

打造最好用的AI芯片编译工具,CAISA架构的端到端自动编译工具链RainBuilder面世,让人工智能更简单

要实现更快的AI应用落地,满足不同算法开发的需求,需要一个可以兼容各类算法框架和方便快捷实现算法到硬件写入的编译工具。为了降低使用门槛,鲲云发布了端到端自动编译工具链RainBuilder,它是一款针对深度学习算法优化加速的开发工具链。依托于CAISA架构的高性能特性,RainBuilder提供从算法模型到芯片级算法部署的一整套开发套件。该套件主要由Compiler和Runtime两部分组成,其中Compiler包含了一系列命令行接口,支持主流AI开发框架模型的解析和优化,并将模型转化为适用于CAISA架构的中间表达和数据。Runtime以Compiler生成的中间表达和数据为输入,为用户提供了丰富易用的开发接口以完成对底层AI芯片硬件的高效应用。

(RainBuilder端到端自动编译工具链)

RainBuilder使用过程非常简单便捷,用户无需对于底层硬件有深入的了解,即可快速开发适用于AI专用芯片的算法方案。从训练好的模型文件,只需两步,即可实现整个神经网络的推演。首先,调用Compiler的命令行接口完成模型的离线准备,对于一个模型,该步骤只需进行一次。Compiler提供了一套端到端的优化流程,包括模型解析、冗余节点裁剪、节点融合、模型量化压缩等。之后用户只需编写针对特定算法的前后处理函数,Runtime会自动完成算法模型对于CAISA架构的高效调用。Runtime中包含了大量针对CAISA架构的深层优化,如硬件资源调配、运行时资源调度、软硬件并行、异常处理等。另外,RainBuilder通过支持用户自定义算子实现了对于不同算法的高拓展性。用户只需根据提供的接口即可完成自定义模块的实现,RainBuilder会自动将自定义算子整合进计算图中,并针对其特点完成相应的计算优化。

提供下一代人工智能计算平台,鲲云公布基于CAISA架构的系列AI产品,鲲云高性能AI芯片切入工业市场

会上,鲲云还公布了基于CAISA架构的一系列产品,包括针对前端和边缘计算的“雨人”AI芯片加速卡3代和应用于NVR和服务器的“星空”AI加速卡2代,目前已经在电力、安防、工业等领域实现了规模落地。同合作伙伴联合开发的搭载雨人加速卡的AI摄像头、智能无人机、智能ops系统盒子,搭载星空加速卡的两款AI服务器也同时披露。

(雨人加速卡3代)

“雨人”加速卡可嵌入前端IoTs设备,提供深度学习目标定位、去重一体化前端方案,支持1080p高清实时视频对于60x60像素特定目标全检测,具有50帧/秒的处理能力。

(星空加速卡2代)

“星空”加速卡嵌入小型主机和服务器设备,即插即用,可同时支持16路1080p视频中对最小60×60像素的特定目标全检测及视频结构化分析,实现1080P高清实时视频200-800帧/秒的检测性能,延时低至5毫秒,功耗为35w,实测性能达理论峰值的90%。充分体现了自主研发的定制数据流CAISA架构芯片高性能、低功耗、低延时的特性,最大化资源能效比。可为安防行业中交通、商场和住宅等场景数字安全监控及行人、车辆、路况等提供深度学习目标定位、去重、识别、属性分析一体化的边缘后端人工智能加速方案。

鲲云高校计划发布,联合高校开展人工智能教学科研合作

为满足高校日益增长的在人工智能领域教学培训、科研平台方面的需求,鲲云科技结合自身在人工智能芯片、开发平台和垂直领域解决方案等方向的研发和技术优势,以及与市场端广泛的互动关系,由鲲云人工智能应用创新研究院发起,鲲云正式发布鲲云高校计划CUP (Corerain University Program),与全球高校在人工智能课程、科研合作和国际交流等领域实现深度合作。

在课程方面,鲲云提供基于CAISA架构FPGA加速卡的人工智能课程及实验内容,支持高校相关课程升级;在科研方面,鲲云支持高校基于CAISA架构运行最新人工智能算法,以及围绕CAISA架构拓展硬件平台;在国际合作领域,鲲云提供人工智能峰会、人工智能硬件加速暑期峰会等国际交流平台,全方位支持与高校在AI领域的合作,加速最新AI技术的产学研合作。

2019年2月24日,鲲云高校计划启动,联手英特尔开展的基于Intel? FPGA的人工智能芯片应用设计培训的交流活动完美落幕,来自清华大学、武汉大学、华中科技大学、山东大学、天津大学、重庆大学、电子科技大学等近30所高校的40余位老师参加。除与Intel合作进行人工智能课程培训外,鲲云人工智能应用创新研究院已同帝国理工学院、哈尔滨工业大学、天津大学等成立联合实验室,在定制计算、AI芯片安全、工业智能等领域开展前沿研究合作。

高端会晤,国际AI领域权威分享人工智能前沿技术突破

作为年度重量级AI峰会,此次活动汇聚了政府领导、全球人工智能领域顶尖学术大师、世界顶级科技企业、互联网巨头,产业界、投资界行业领袖,共同探讨人工智能实战落地和产学研发展方向。整个峰会由政府致辞、主题演讲和产业论坛三个环节组成。会上,几位人工智能领域的国际权威,包括获得“IT诺贝尔奖”的Viktor K. Prasanna教授,IEEE终身会士Sun Yuan Kung(贡三元)教授,国际学术界公认的世界上极少数同时在数据库理论与系统两个领域做出突破性贡献的Wenfei Fan(樊文飞)院士,定制计算国际权威Wayne Luk 陆永青院士,清华大学魏少军教授,以及高性能计算领域的Cristina Silvano教授等院士嘉宾就计算加速技术在人工智能领域的落地应用、AI方法的研究演进、面向人工智能应用的定制计算加速技术以及高能效高性能并行集群计算,软件定义芯片等内容做主题报告。

除了诸位院士、会士嘉宾的专业分享以外,Intel PSG战略市场总监的Tony Kau、浪潮人工智能与产品总经理刘军,也分享了英特尔和浪潮在人工智能的落地应用以及创新技术等方面的技术革新和新进展,也分享了同鲲云在AI加速应用和高校推广等方面的深入合作。

此外,峰会还邀请到星瀚资本杨歌、雷锋网麦广炜、天津大学电子信息学院副院长刘强、JWIPC副总经理刘迪科、CCE-YOCSEF深圳主席卢昱明等专家学者与鲲云科技CTO蔡权雄博士就人工智能芯片产业与生态落地等话题进行了探讨。

2019年人工智能应用创新峰会顺利结束,干货满满,在未来计算架构的黄金十年,鲲云科技是否能够凭借自己多年积累的数据流架构厚积薄发,在AI芯片性能上实现突破?我们拭目以待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261515
  • AI芯片
    +关注

    关注

    17

    文章

    2063

    浏览量

    36567
  • 鲲云科技
    +关注

    关注

    0

    文章

    58

    浏览量

    4414
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的
    的头像 发表于 09-19 15:26 1148次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的
    的头像 发表于 09-19 15:25 429次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    中科曙光发布国内首个开放架构AI超集群系统

    设计,具备“超高性能、超高效率、超高可靠、全面开放”四大特点,可为万亿参数大模型训练推理、行业大模型微调、多模态大模型开发、AI4S等场景提供
    的头像 发表于 09-06 09:11 1165次阅读

    睿海光电800G光模块助力全球AI基建升级

    在全球数字化转型加速的背景下,超高速光模块作为数据中心与AI网络的核心部件,正经历从400G向800G、1.6T的迭代浪潮。在这一赛道中,深圳市睿海光电科技有限公司(以下简称“睿海
    发表于 08-13 19:05

    睿海光电领航AI光模块:超快交付与全场景兼容赋能智时代——以创新实力助力全球客户构建高效底座

    一、AI革命催生光模块新需求,睿海光电以技术优势抢占制高点 人工智能、超大规模数据中心和计算的高速发展,对光模块的传输效率、兼容性及交付周期提出
    发表于 08-13 19:03

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    全球分支机构提供7×24小时技术支持,确保客户网络长期稳定运行。 睿海光电与您共创AI未来 在AI需求爆发式增长的今天,睿海光电以技术领
    发表于 08-13 19:01

    6TOPSNPU加持!RK3588如何重塑8K显示的边缘计算新边界

    与复杂运算。明远智睿推出的RK3588芯片,以6TOPS的NPU核心,这一难题提供了突破性的解决方案。 从硬件
    发表于 04-18 15:32

    iTOP-RK3588S开发板/核心板瑞芯微RK3588S处理器6TOPS内置NPU

    性能强 iTOP-3588S开发板采用瑞芯微RK3588S处理器,是全新一代AloT高端应用芯片,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构主频高达2.4GHZ
    发表于 04-10 11:13

    科技提供智慧高速AI视频分析解决方案

    科技响应国家及地方的高速公路信息化、智能化政策,提供+算法+平台”一体化的智慧高速 AI
    的头像 发表于 03-27 14:53 777次阅读

    DeepSeek推动AI需求:800G光模块的关键作用

    数据传输速率,减少带宽瓶颈,成为数据中心和AI集群架构优化的重点。光模块速率的跃升不仅提升了传输效率,也大规模并行计算任务提供了必要的带宽保障。 800G光模块如何解决Dee
    发表于 03-25 12:00

    iTOP-RK3588S开发板/核心板6TOPS的NPU视频编解码8K编码+8K解码

    性能强 iTOP-3588S开发板采用瑞芯微RK3588S处理器,是全新一代AloT高端应用芯片,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构主频高达2.4GHZ
    发表于 02-20 14:24

    玄武智平台智能计算保驾护航

    玄武智平台是基于昇腾原生打造的智平台,它支持昇腾全系列硬件的纳管、调度和AI模型支持,可实现高效、精细的
    的头像 发表于 02-18 10:06 1405次阅读
    玄武智<b class='flag-5'>算</b><b class='flag-5'>云</b>平台<b class='flag-5'>为</b>智能计算保驾护航

    科技AI芯片CAISA 430成功适配DeepSeek R1模型

    科技全新一代的可重构数据流 AI 芯片 CAISA 430 成功适配 DeepSeek R1 蒸馏模型推理,这一创新举措大模型应用的
    的头像 发表于 02-07 09:57 2346次阅读
    <b class='flag-5'>鲲</b><b class='flag-5'>云</b>科技<b class='flag-5'>AI</b>芯片<b class='flag-5'>CAISA</b> 430成功适配DeepSeek R1模型

    瑞芯微RK3562开发板主频2.0内置NPU达1TOPS,核心板扩展更多功能

    A53+Mali G52架构,主频2GHZ,内置1TOPSNPU,RK809动态调频。支持OpenGLES1.1/2.0/3.2、0penCL2
    发表于 12-24 15:07

    企业AI租赁模式的好处

    构建和维护一个高效、可扩展的AI基础设施,不仅需要巨额的初期投资,还涉及复杂的运维管理和持续的技术升级。而AI
    的头像 发表于 12-24 10:49 1657次阅读