0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

鲲云科技:唯一实现数据流AI芯片规模量产的公司

我快闭嘴 来源:爱集微 作者:依然 2020-12-18 15:32 次阅读

2021中国IC风云榜“年度新锐公司”征集现已启动!入围标准要求为营收过亿元的未上市、未进入IPO辅导期的半导体行业优秀企业。评选将由中国半导体投资联盟129家会员单位及400多位半导体行业CEO共同担任评选评委。奖项的结果将在2021年1月份中国半导体投资联盟年会暨中国IC 风云榜颁奖典礼上揭晓。

本期候选企业:深圳鲲云信息科技有限公司(以下简称“鲲云科技”)

鲲云科技是一家人工智能芯片公司,创立于2016年,致力于提供高性能、低延时、高算力性价比的下一代人工智能计算平台,加速人工智能技术在智慧城市、智能制造、智能遥感、安监生产、自动驾驶等领域的落地。成立至今,鲲云科技已经完成了天使轮,A轮及A+轮融资,设有深圳、山东、伦敦研发中心

权威专家领衔 三十年技术积累

目前,国内外有多家芯片企业做数据流AI芯片研发,其中包括来自谷歌人工智能芯片核心团队的Groq、MIT教授创立的Sambanova、人工智能芯片独角兽Wave Computing以及鲲云科技。

由定制计算芯片领域的国际权威、英国皇家工程院Wayne Luk陆永青院士、牛昕宇博士和蔡权雄博士等联合创立的鲲云科技,是唯一一家实现数据流AI芯片规模量产的公司。

依托主创团队自1991年来近三十年的技术积累,鲲云科技拥有全套自主知识产权,基于自主研发的定制数据流(Custom AI Streaming Architecture,CAISA)架构和编译工具链RainBuilder两项核心技术,已申请专利139件。

AI芯片市场的应用场景较多,比如:智慧城市、智能制造、自动驾驶、轨道交通、安监生产等。而AI芯片为人工智能应用提供基础算力,算力性价比成为影响人工智能应用落地的重要因素。

CAISA定制数据流架构为鲲云自主研发的源头性底层芯片技术,是为深度学习神经网络定制的高性能AI计算架构。CAISA架构依托数据流流动次序控制计算次序,采用计算流和数据流重叠运行方式消除空闲计算单元,并采用动态配置方式保证对于人工智能算法的通用支持,突破指令集技术对于芯片算力的限制,可以实现同等峰值算力情况下更高的算力性价比。

自主研发CAISA架构 多款产品齐发力

目前AI应用端对算力提出了更高的要求,市场也更关注在实际应用中可以获得的有效算力,鲲云科技的产品可以更好的满足这一需求。

基于定制数据流CAISA架构,鲲云科技于今年6月推出了全球首款数据流AI芯片CAISA,以及面向边缘端、数据中心进行深度学习推断的AI专用计算加速的星空加速卡。

鲲云科技表示,目前,基于CAISA架构的星空加速卡在支持深度学习通用算法的同时发挥最高95.4%的芯片利用率,较同类产品在芯片利用率上提升了最高11.6倍, 在芯片实测算力上实现了技术突破。

星空加速卡具高性能、低延时、高算力性价比的特性。在性能方面,定位于高性能AI推断加速,兼容TensorFlow、PyTorch、Caffe、ONNX(MXNet)等主流框架,可简单快速实现AI算法模型到硬件上的无缝迁移。

据悉,星空加速卡已应用于航空航天、智能制造、智慧城市、能源电力、石油化工等领域。以CAISA作为主芯片的星空X3加速卡现已实现量产,相较于英伟达边缘端旗舰产品Xavier,鲲云的星空加速卡X3可实现1.48-4.12倍的实测性能提升。

整体来看,鲲云科技产品主要应用于推理端,在智慧城市,安监生产、智能制造、航天遥感等领域都有落地,产品主要是以PCIe板卡的形式出货,提供给方案商或集成商,由方案商或集成商配套服务器、算法和应用后提供给最终用户使用。

核心技术领先 加速生态布局

在AI芯片领域,鲲云科技的核心技术是基于定制数据流技术的芯片架构和编译工具链。

在架构方面,鲲云科技采用的定制数据流架构CAISA,与传统AI芯片公司采用的指令集架构在底层技术逻辑和实现上完全不同,指令集架构采用冯诺依曼计算方式,通过指令执行次序控制计算顺序,并通过分离数据搬运与数据计算提供计算通用性。最新发布的CAISA3.0架构继续保持数据流技术路线的全球领先地位, 通过控制数据流动来实现更高的芯片利用率,从而为客户提供更高的有效算力。

我们知道架构创新是人工智能芯片的必由之路,鲲云科技CAISA定制数据流架构在设计时,除了算力考量,架构设计还需要从架构通用性及软件易用性出发:在保证每个算法在CAISA上运行能够实现高芯片利用率的同时,CAISA架构通用支持所有主流CNN算法,实现“高架构通用性”;另一方面,通过专为CAISA架构定制的编译工具链RainBuilder实现深度学习算法端到端自动部署,用户无需底层数据流架构背景知识,简单两步即可实现算法迁移和部署,降低使用门槛,实现“高软件易用性”。

编译工具链 RainBuilder可以把TensorFlow、Caffe、Pytorch等主流开发框架开发的深度学习模型直接部署到鲲云的加速卡上,算法或者软件工程师不需要关心硬件的架构和具体操作,就可以高效率的实现算法在硬件上部署,以及在应用系统中的集成。

作为底层算力平台,AI芯片的算力性价比与软件生态决定AI方案的整体落地成本。目前,鲲云科技也已与多家行业巨头达成战略合作。公司已成为英特尔全球旗舰FPGA合作伙伴,在技术培训、营销推广以及应用部署等方面进行合作;与浪潮信息达成战略签约,加速数据流AI计算产业化落地;与戴尔科技集团签署战略合作备忘录,为边缘和数据中心提供更优质的人工智能计算平台解决方案;与飞腾达成合作,共建人工智能生态联合实验室;与山东产业技术研究院共同成立山东产研鲲云人工智能研究院,推动高性能AI计算加速产业的落地和发展。

推进AI芯片国产化 打磨有竞争力的产品

2020年,鲲云科技认为,外部市场环境在一定程度上给国内芯片发展带来了机会,加速了AI芯片国产化进程。国内的AI芯片厂商在加快形成完善的产品组合和国产化方案的同时,推进生态布局建设。

鲲云科技透露,今年鲲云科技的芯片及相应的产品已实现量产,并在智能制造、智能电力、智慧城市等领域实现规模落地。尽管有不错的成绩,鲲云科技也表示,从整体上来讲,打磨有竞争力的产品始终是公司发展的核心驱动力。

谈及2021年的发展展望,鲲云科技表示,公司将在应用落地和打磨产品的过程中,根据客户的需求反馈,不断推动鲲云自身芯片架构的升级及编译工具优化,同时鲲云科技也将基于此不断夯实在安防、安监、电力巡检、工业视觉检测各场景的应用落地,以及丰富产品形态,基于CAISA芯片和AI加速卡打造更多AI算力产品。

未来鲲云科技也期待能够同更多的业内外同行交流,为快速发展的人工智能行业的算力发展提供另一个技术方向的参考。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    446

    文章

    47746

    浏览量

    409041
  • 半导体
    +关注

    关注

    327

    文章

    24484

    浏览量

    202024
  • 人工智能
    +关注

    关注

    1776

    文章

    43796

    浏览量

    230570
收藏 人收藏

    评论

    相关推荐

    TSN时间敏感网络QoS数据流传输中干扰的三种模式#TSN #时间敏感网络

    数据流TSN
    北汇信息POLELINK
    发布于 :2024年04月24日 12:29:11

    stm32F429串口采用DMA方式发送,数据流使能失败的原因?

    DMA1 时钟稳定 DMA_DeInit(DMA2_Stream7);// 复位初始化DMA数据流 while (DMA_GetCmdStatus(DMA2_Stream7) != DISABLE
    发表于 04-17 07:05

    开发者手机 AI - 目标识别 demo

    。 NNRt host 实现了NNRt HDI接口功能,通过对接底层AI芯片接口为上层应用提供NPU硬件推理的能力。 功能实现 JS从相机数据流
    发表于 04-11 16:14

    fx3进行视频数据流的传输的时候,请问如何修改可以达到同步传输的要求?

    在fx3的固件中给出的slavefifo 是通过bulk传输的demo 我想进行视频数据流的传输的时候,请问如何修改可以达到同步传输的要求 我目前在固件里面只看到了bulk的方式,如果有同步传输的demo或者修改教程请不吝赐教 FX3中的ISO数据传输,这
    发表于 02-28 07:50

    英特尔3D封装技术实现规模量产

    近日,英特尔(Intel)宣布,其已成功实现基于业界领先的半导体封装解决方案的大规模生产,其中包括突破性的3D封装技术Foveros。这一技术在新墨西哥州Fab 9工厂中完成升级并投产。
    的头像 发表于 01-26 16:03 270次阅读

    光模块厂家如何实现千兆和万兆的大规模量产

    随着网络需求的不断增长,千兆光模块和万兆光模块成为了网络通信中不可或缺的组件。但是,如何实现这些高速光模块的量产却是厂家们面临的难题。本文将介绍千兆光模块和万兆光模块的生产工艺差异和技术挑战,并探讨厂家如何实现千兆和万兆的大
    的头像 发表于 11-06 14:56 259次阅读

    面向5G射频功放推出的高密度异构集成SiP解决方案即将在国内大规模量产

    JSCJ长晶长电科技面向5G射频功放推出的高密度异构集成SiP解决方案即将在国内大规模量产
    的头像 发表于 11-01 15:20 298次阅读

    同兴达:子公司芯片金凸块全流程封装测试项目启动量产

    2023年10月18日,昆山同兴达芯片和金凸块全过程的封装测试项目量产仪式在昆山隆重举行,下游客户包括奕力科技股份有限公司的ic设计等世界级大工厂莅临参加,标志同兴达先进封装测试项目大规模量产
    的头像 发表于 10-20 09:46 562次阅读

    英特尔宣布Intel 4已大规模量产,“四年五个制程节点”计划又进一步

    近日,英特尔宣布已开始采用极紫外光刻(EUV)技术大规模量产(HVM)Intel 4制程节点。Intel 4大规模量产的如期实现,再次证明了英特尔正以强大的执行力推进“四年五个制程节点”计划,并将
    的头像 发表于 10-13 21:20 314次阅读

    英特尔宣布Intel 4已大规模量产,“四年五个制程节点”计划又进一步

    近日,英特尔宣布已开始采用极紫外光刻(EUV)技术大规模量产(HVM)Intel 4制程节点。Intel 4大规模量产的如期实现,再次证明了英特尔正以强大的执行力推进“四年五个制程节点”计划,并将
    的头像 发表于 10-13 15:57 238次阅读

    鲲云科技携可重构数据流技术出席全球AI芯片峰会

    近日,2023 全球 AI 芯片峰会(GACS 2023)在深圳举行。峰会以「AI 大时代 逐鹿芯世界」为主题,作为国内最受关注的 AI 芯片
    的头像 发表于 09-19 11:09 480次阅读

    AI加速器架构设计与实现》+第2章的阅读概括

    首先感谢电子发烧友论坛提供的书籍和阅读评测的机会。 拿到书,先看下封面介绍。这本书的中文名是《AI加速器架构设计与实现》,英文名是Accelerator Based on CNN Design
    发表于 09-17 16:39

    长电科技面向5G射频功放推出的高密度异构集成SiP解决方案即将在国内大规模量产

    长电科技凭借在SiP封测技术的深厚积累,开发完成面向5G射频功放的SiP解决方案,并即将大规模量产
    的头像 发表于 06-20 10:28 461次阅读

    年产值30亿元! 安徽启泰传感车用金属基MEMS压敏芯片量产线和传感器生产项目在桐城开工

    6月12日上午,安徽启泰传感科技有限公司车用金属基MEMS压敏芯片量产线和传感器生产项目开工仪式在桐城经开区举行。 据悉,湖南启泰传感科技有限公司是国内
    的头像 发表于 06-14 08:45 748次阅读
    年产值30亿元! 安徽启泰传感车用金属基MEMS压敏<b class='flag-5'>芯片</b><b class='flag-5'>量产</b>线和传感器生产项目在桐城开工

    如何从网络服务器读取连续的JSON数据流

    我有个家庭自动化系统,它在网页上以 JSON 格式为十几个测量参数提供连续的数据流(每秒)。 我需要阅读它们并复制相应的变量。 所以全局三个步骤: 1. 登录到服务器(摘要式身份验证)-我认为已
    发表于 06-05 08:19