0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

鲲云科技AI芯片CAISA 430成功适配DeepSeek R1模型

鲲云科技 来源:鲲云科技 2025-02-07 09:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

鲲云科技全新一代的可重构数据流 AI 芯片 CAISA 430 成功适配 DeepSeek R1 蒸馏模型推理,这一创新举措为大模型应用的高效部署带来了全新的解决方案,标志着可重构数据流 AI 技术与大模型融合发展的又一重要里程碑,也展示了鲲云科技的可重构数据流技术的技术通用性和生态友好。

全新一代可重构数据流 AI 芯片 CAISA 430

此次适配的 CAISA 430 芯片是鲲云科技基于第四代可重构数据流架构技术研发,于 2023 年底回片,并于 2024 年实现量产,相较于上一代产品,其实测性能、通用性等关键指标实现了跨越性提升。该芯片采用国内成熟的 12nm 制程工艺生产,端到端芯片利用率最高可达 90%,有效算力指标表现突出。此外,凭借鲲云自主研发的 RainBuilder 编译工具链,CAISA 430 支持所有常用的 AI 算子和算法模型,展现出强大的通用性,可以满足不同深度学习算法的推理需求。

7af83a84-e475-11ef-9310-92fbcf53809c.png

▲ Rainbuilder 编译工具链

鲲云科技基于 CAISA 芯片推出了一系列 AI 算力产品,包括面向边缘端、数据中心进行深度学习推断的 AI 专用计算加速的星空加速卡 X3、X3A、N460H,面向低算力场景的星空 X6A、N430S/P/E 边缘小站,以及基于星空加速卡系列推出的智能计算服务器等,为计算机视觉、语音语义及大模型应用提供高性能、低延时、高算力性价比的 AI 算力支持。

高效适配,为 DeepSeek R1 推理提供底层 AI 算力支持

DeepSeek R1 作为一款先进的推理模型,基于 Transformer 架构,其参数规模庞大,对硬件的计算能力和内存容量提出了极高要求。CAISA 430 芯片凭借其高算力性价比和强大的通用性,能够为 DeepSeek R1 推理提供有力支持。CAISA 430 的高芯片利用率确保了在处理大规模模型时能够充分利用硬件资源,减少计算资源的浪费,从而提高推理效率。同时,CAISA 430 的可重构数据流架构能够根据 DeepSeek R1模型的特点进行动态配置,生成面向该模型的高性能定制化流水线,进一步优化推理性能。

7b11bcd4-e475-11ef-9310-92fbcf53809c.png

▲ DeepSeek R1 Llama 8B模型在RainBuilder上编译过程图示

鉴于 CAISA 430 强大的通用性,原生支持 DeepSeek R1 蒸馏模型的开源基础模型,DeepSeek R1 的QWen和 Llama 模型可直接在 CAISA 430 上运行,不需要复杂的适配工作,技术团队主要进行了精度验证和性能优化,适配模型包括已发布的 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B、DeepSeek-R1-Distill-Llama-8B、DeepSeek-R1-Distill-Llama-70B。

7b2d1b28-e475-11ef-9310-92fbcf53809c.png

▲ DeepSeek R1 Llama 8B模型运行图示

大模型友好:助力 AI 应用高效部署,加速人工智能落地

在大模型时代,如何高效地部署和运行这些模型成为了一个关键问题。CAISA 430 芯片的适配为 DeepSeek R1 推理提供了更加灵活和高效的解决方案,能够为不同规模和需求的 AI 项目提供底层算力支持。

高精度和强大推理能力的应用场景,CAISA 430 能够充分发挥其高实测性能的优势,满足 DeepSeek R1 模型的计算需求。

对资源有限的应用场景,CAISA 430 的通用性和可重构性让用户可以根据实际情况对模型进行优化和调整,降低硬件资源的消耗。

基于可重构数据流架构底层优势,适配后的CAISA430芯片算力产品的优势主要体现在:

产品形态多样:支持边缘盒子、一体机、AI 服务器、算力中心服务器集群等边缘至中心不同产品形态,适配不客户不同场景的AI推理需求;

适配算法丰富:配套的星云 AI 开发平台支持超过 400 种视觉模型、视觉大模型、大语言模型等算法模型,可灵活搭配按需使用,无论是复杂的视觉识别任务还是大规

模的语言处理应用,都能高效运行;

行业方案落地:配套的星空系列算力平台,提供深入行业、满足行业需求的 AI 解决方案,当前已落地覆盖超过 30 个行业,帮助客户加速落地智能化项目。

截止到目前,CAISA 系列芯片产品已服务上千客户,落地 5000+项目,实现规模化的业务落地,充分验证了商业可行性。

CAISA 芯片在短时间内快速完成DeepSeek R1 大模型适配,充分展示了 CAISA 系列可重构数据流架构芯片在高算力利用率的同时,可以做到对于深度学习算法的通用、便捷、快速支持,体现了 CAISA 芯片与工具链经过 4 代架构迭代后的深厚积累。未来,鲲云科技将沿着 CAISA 创新架构的全新技术路线,提供下一代计算平台基座,加速千行百业人工智能产品落地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296599
  • 鲲云科技
    +关注

    关注

    0

    文章

    58

    浏览量

    4414
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2812

原文标题:鲲云科技CAISA 430适配DeepSeek R1推理,开启高效AI应用新时代

文章出处:【微信号:鲲云科技,微信公众号:鲲云科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ORinNano离线部署Deepseek R1模型教程

    ORinNano离线部署Deepseek R1模型教程
    的头像 发表于 04-10 15:32 1030次阅读
    ORinNano离线部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>教程

    研华发布昇腾AI Box及Deepseek R1模型部署流程

    。这一举措标志着研华在AI边缘计算领域迈出了重要一步。 研华边缘AI Box MIC-ATL3S依托昇腾芯片的强大异构计算能力,结合研华在边缘计算领域的高可靠特点,为用户提供了高效、稳定的AI
    的头像 发表于 02-19 10:41 1085次阅读

    安霸大算力AI芯片接入DeepSeek R1

    安霸(Ambarela)在人工智能领域持续发力,已成功在多款 AI 芯片,包括 N 系列大算力 AI 芯片上本地部署了
    的头像 发表于 02-17 13:36 871次阅读

    景嘉微JM11 GPU已流片,JM、景宏系列完成DeepSeek R1系列模型适配

    电子发烧友网综合报道,近日,景嘉微JM系列、景宏系列与DeepSeek R1系列成功适配,进一步推动 DeepSeek
    发表于 02-15 00:01 3795次阅读
    景嘉微JM11 GPU已流片,JM、景宏系列完成<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>系列<b class='flag-5'>模型</b><b class='flag-5'>适配</b>

    研华边缘AI Box MIC-ATL3S部署Deepseek R1模型

    随着深度求索(DeepSeek)大模型的发布引发行业热议,研华科技基于昇腾Atlas平台边缘AI Box MIC-ATL3S正式发布与Deepseek
    的头像 发表于 02-14 16:08 2621次阅读
    研华边缘<b class='flag-5'>AI</b> Box MIC-ATL3S部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b><b class='flag-5'>模型</b>

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实
    发表于 02-14 02:08

    超星未来惊蛰R1芯片适配DeepSeek-R1模型

    日前,超星未来研发团队成功完成了惊蛰R1芯片DeepSeek-R1模型适配工作,实现了与用户
    的头像 发表于 02-13 14:05 1087次阅读

    景嘉微与DeepSeek系列成功适配,拓展边端应用

    近日,国内领先的芯片设计企业景嘉微宣布,其JM系列、景宏系列芯片成功适配DeepSeek R1
    的头像 发表于 02-12 14:32 1236次阅读

    景嘉微完成DeepSeek R1系列模型适配

    景嘉微JM系列、景宏系列与DeepSeek R1系列的成功适配,进一步推动 DeepSeek
    的头像 发表于 02-12 14:03 989次阅读

    Deepseek R1模型离线部署教程

    DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型DeepSeek-R1采用强化学习进行后训练,旨
    的头像 发表于 02-12 09:37 2441次阅读
    <b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>离线部署教程

    Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

    模型相比,较小尺寸的 DeepSeek 蒸馏版本模型 更适合企业内部实施部署,可以极大的降低落地成本 。 同时,这次 Deepseek R1
    的头像 发表于 02-10 09:56 1099次阅读
    Gitee <b class='flag-5'>AI</b> 联合沐曦首发全套 <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> 千问蒸馏<b class='flag-5'>模型</b>,全免费体验!

    AIBOX 全系产品已适配 DeepSeek-R1

    国产AI模型DeepSeek以出色的性价比和高效的模型技术,迅速成为全球AI关注的焦点。Firefly开源团队率先实现AIBOX系列产品对
    的头像 发表于 02-08 17:30 945次阅读
    AIBOX 全系产品已<b class='flag-5'>适配</b> <b class='flag-5'>DeepSeek-R1</b>

    扣子平台支持DeepSeek R1与V3模型

    近日,新一代AI应用搭建平台“扣子”宣布了一项重要更新,即正式支持DeepSeekR1和V3模型,并向广大用户开放免费体验。 扣子平台一直以来都致力于为用户提供便捷、高效的
    的头像 发表于 02-08 13:42 1861次阅读

    后摩漫界M30芯片成功适配DeepSeek-R1系列模型

    DeepSeek开源模型的热度席卷全球,其高效性和易用性正在成为推动AI技术普惠化的重要力量。后摩智能作为国产存算一体AI芯片的领军企业,自
    的头像 发表于 02-08 10:42 1559次阅读

    云天励飞上线DeepSeek R1系列模型

    -Distill-Llama-70B大模型DeepSeek V3/R1 671B MoE大模型也在有序适配中。
    的头像 发表于 02-06 10:39 1073次阅读
    云天励飞上线<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>系列<b class='flag-5'>模型</b>