0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研华边缘AI Box MIC-ATL3S部署Deepseek R1模型

研华智能地球 来源:研华智能地球 2025-02-14 16:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着深度求索(DeepSeek)大模型的发布引发行业热议,研华科技基于昇腾Atlas平台边缘AI Box MIC-ATL3S正式发布与Deepseek R1模型的部署流程。该平台依托昇腾芯片的强大异构计算能力,结合研华边缘AI Box高可靠特点,通过模型轻量化、算子适配等技术实现大模型边缘端部署。

硬件部署/

CPU:Atlas 310P

10个DaVinciV200 AI core,主频最高达1.08GHz

16个64位TaishanV200M处理器核,核主频最高1.9GHz

8个DaVinciV200 Vector core,主频最高达1GHz

内存:24G LPDDR4

AI算力:176TOPS INT8

操作系统:OpenEuler

模型:DeepSeek-R1

推理模型/

根据MIC-ATL3S硬件规格,我们选取了DeepSeek-R1-Distill-Qwen-1.5B这个精度和对硬件配置要求相对平衡的蒸馏模型进行适配和部署。

fd6c0612-eaa1-11ef-9310-92fbcf53809c.png

部署步骤/

昇腾310P + openEuler22.03部署deepseek-R1

1. 安装驱动包以及CANN

前往昇腾社区获当前芯片版本的驱动、FW、以及CANN(昇腾异构计算架构)

driver:Ascend-hdk-310p-npu-driver_xxxxx_linux-aarch64_chip-enable.run Firmware:Ascend-hdk-310p-npu-firmware_xxxxx_chip-enable.run CANN:Ascend-cann-toolkit_xxxxx_linux-aarch64.run

2. 安装依赖组件

3. 安装mindspore (昇思模型框架)

4. DeepSeek-R1模型拉取

拉取模型指令,以1.5B为例

yum install git-lfs -y git lfs install git clone https://ai.gitee.com/hf-models/DeepSeek-R1-Distill-Qwen-1.5B

fd83856c-eaa1-11ef-9310-92fbcf53809c.jpg

克隆完成示例如下,包含HF完整的仓库:

fd9eead2-eaa1-11ef-9310-92fbcf53809c.png

5. 模型转换

下载后的模型为safetensors格式,还不能直接使用,先用transformers转换为ONNX格式,再使用atc转换为OM(昇腾)格式才能使用。

创建python脚本将safetensors格式转换为ONNX格式,最终转换为OM格式。

fda9338e-eaa1-11ef-9310-92fbcf53809c.png

执行脚本后会生成对应模型文件,生成对应格式模型文件 执行:

Python3 convert.py ./convert.sh

fdd01b98-eaa1-11ef-9310-92fbcf53809c.png

最后,需要用一个简单的python脚本去做互动窗口,运行指令:python3 deepseek_r1.py

fde4cb92-eaa1-11ef-9310-92fbcf53809c.png

示例:

fe04a0d4-eaa1-11ef-9310-92fbcf53809c.png

fe2ff64e-eaa1-11ef-9310-92fbcf53809c.png

总结:目前研华进行MIC-ATL3S适配更多Deepseek模型,以及与生态伙伴展开具体应用场景测试,后续我们会持续公布研华边缘AI平台产品的部署&测试内容,敬请关注。

研华昇腾310系列边缘AI平台

研华基于昇腾Atlas 310系列平台开发出三款不同形态的边缘AI产品:工业标准化AI模组、边缘AI开发套件以及边缘AI盒子。此系列产品算力高达176 Tops,专注于工业场景下的细分应用。同时,在软件方面,研华聚焦底层开发,定期更新SDK套件以满足客户的开发需求,并自主研发工业领域远程部署和管理工具。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41115

    浏览量

    302607
  • 研华
    +关注

    关注

    0

    文章

    459

    浏览量

    40544
  • 昇腾
    +关注

    关注

    1

    文章

    187

    浏览量

    7552
  • DeepSeek
    +关注

    关注

    2

    文章

    839

    浏览量

    3406

原文标题:研华正式发布国产化昇腾AI Box与Deepseek R1模型部署全流程!

文章出处:【微信号:研华智能地球,微信公众号:研华智能地球】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    在过去几年中,人工智能的基础设施部署重心正经历一场深刻的转移。如果说2020年的关键词是“大模型训练”,2023年的关键词是“推理下沉”,那么2025-2026年的关键词无疑是 “边缘原生
    发表于 03-10 14:19

    模型 ai coding 比较

    ; sonnet4.5 > m2.5 但是我 希望从自身实践的角度 进行测试,我把所有的平台都办了月卡 我在这个基础上 添加了deepseek v3 结论 确实opus 4.6 更适合 ai coding
    发表于 02-19 13:43

    模型实战(SC171开发套件V3)2026版

    模型实战(SC171开发套件V3)2026版 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 火山引擎大模型调试指南 6分53秒 https://t.elecfa
    发表于 01-15 12:05

    边缘AI系统MIC-ATL3S荣获CEC 2025年度最佳产品奖

    华国产自主边缘AI系统MIC-ATL3S,在CEC2025年度最佳产品评选中荣获“CEC 2025年度最佳产品奖”。另一款
    的头像 发表于 09-30 10:39 1339次阅读

    广和通成功部署DeepSeek-R1-0528-Qwen3-8B模型

    近日,广和通在MediaTek MT8893平台上成功部署并运行了DeepSeek-R1-0528-Qwen3-8B模型,显著提升了端侧AI设备的处理效率与智能化水平,特别是在本地化复
    的头像 发表于 09-26 13:35 994次阅读

    华科技推出基于NVIDIA Jetson Thor平台的边缘AI新品MIC-743

    重磅推出基于NVIDIA Jetson Thor平台的边缘AI新品 MIC-743,这款突破性产品以高达2070 FP4 TOPS的
    的头像 发表于 08-29 14:53 2319次阅读

    边缘计算AI硬件如何接入DeepSeek吗?需要具备哪些条件?

    成本极低,R1模型的训练成本仅为560万美元,远低于美国科技巨头数亿美元乃至数十亿美元的投入。这一颠覆式创新打破了“更强大的硬件、更高的算力才是推动人工智能发展的关键”
    的头像 发表于 08-21 10:30 2042次阅读
    <b class='flag-5'>边缘</b>计算<b class='flag-5'>AI</b>硬件如何接入<b class='flag-5'>DeepSeek</b>吗?需要具备哪些条件?

    如何在NVIDIA Blackwell GPU上优化DeepSeek R1吞吐量

    开源 DeepSeek R1 模型的创新架构包含多头潜在注意力机制 (MLA) 和大型稀疏混合专家模型 (MoE),其显著提升了大语言模型
    的头像 发表于 08-12 15:19 4499次阅读
    如何在NVIDIA Blackwell GPU上优化<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>吞吐量

    速看!EASY-EAI教你离线部署Deepseek R1模型

    1.Deepseek简介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型
    的头像 发表于 07-25 15:22 1579次阅读
    速看!EASY-EAI教你离线<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    提升,达到 60TPS。 从书上得知,DeepSeek-V3的训练成本只需五百万美元,堪比AI领域的拼多多。而且其准确率在某几项评测指标上也达到了不错的水平 DeepSeek模型家族
    发表于 07-17 11:59

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R1 满血版的部署,目前已可提供线上服务。
    的头像 发表于 07-03 14:37 1432次阅读
    Arm Neoverse N2平台实现<b class='flag-5'>DeepSeek-R1</b>满血版<b class='flag-5'>部署</b>

    DeepSeek开源新版R1 媲美OpenAI o3

    ;还有一些网友的实测评价都显示, DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性价比的平替。 此外,关于De
    的头像 发表于 05-29 11:23 1500次阅读

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型
    的头像 发表于 05-13 17:07 1865次阅读
    瑞萨RZ/V2H平台支持<b class='flag-5'>部署</b>离线版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大语言<b class='flag-5'>模型</b>

    DeepSeek 引领边缘 AI 芯片向更高性能、更低功耗、更强泛化能力的方向演进

    DeepSeek 系列模型概览 DeepSeek 系列包括大型语言模型(如 DeepSeek LLM、R
    的头像 发表于 05-09 10:27 2421次阅读

    Deepseek海思SD3403边缘计算AI产品系统

    的训练样本和训练 模型,具体商业价值和保密性,采用海思SD3403边缘计算AI服务器+多路安防监控IPC,让差异化AI视频系统, 成本控制极具市场竞争力。 海思SD3403
    发表于 04-28 11:05