当前,人工智能技术正加速向大模型时代迈进,在政务、金融、医疗、工业等领域展现出颠覆性潜力。然而,大模型的训练与部署面临算力成本高、技术生态依赖性强、行业落地门槛高三大挑战。
为加速技术普惠,4月23日晚,开源中国直播栏目《数智漫谈》邀请华为昇腾生态技术专家、行业先行者以及迅龙软件等,分享一线开发经验,助力开发者与企业用户抓住国产 AI新红利。

该话题围绕“如何让AI既跑得快(性能优化)又用得好(场景适配)”而展开。华为云 HCDE、微软 Insider Dev Tour China姚圣伟针对“昇腾插件化接入vLLM加速大模型推理创新最佳实践”做了主题分享。他表示,基于自主研发的昇腾处理器及CANN异构计算架构,昇腾推出插件化接入方案,与开源推理框架vLLM深度适配,为大模型推理提供高性能、低时延的创新实践。通过该功能,用户可以像实现自定义模型一样,插件化的完成vLLM的硬件支持。用户可以实现自己的Woker、ModelRunner、Attention、Communicator以及自定义算子。

迅龙软件技术专家以OrangePi AI Studio Pro为例,分享了迅龙软件在AI方面的探索实践,并现场演示了在OrangePi AI Studio Pro上完成DeepSeek-R1-Distill-Qwen-14B模型的本地化部署。OPi AI Studio Pro是基于2个昇腾AI处理器的新一代高性能算力卡,可提供352 TOPS INT8的计算能力,内存提供了96GB和192GB两个版本。
OPi AI Studio Pro融合“通用处理器、AI Core、编解码” 于一体,提供超强AI推理、目标检索、视频图片编解码等功能,具有超强算力、超高能效、超大视频解析路数、高性能特征检索等优势,支持高清视频实时分析,可广泛应用于OCR识别、目标识别、搜索推荐、内容审核、智慧城市、智慧交通、智慧园区等诸多AI应用场景。

《数智漫谈》是开源中国推出的一档直播栏目,每月1期,已推出22期。以“深度对话、多元视角、前沿洞察”为核心理念,聚焦IT技术、开源治理、行业趋势与创新实践,通过轻松互动形式搭建开源领域的思想交流平台。
-
AI
+关注
关注
89文章
38163浏览量
296857 -
开发板
+关注
关注
25文章
6128浏览量
113488 -
迅龙软件
+关注
关注
0文章
51浏览量
2891
发布评论请先 登录
AI共创,江波龙携AI存储创新方案亮相2025数智科技生态大会
普华基础软件亮相2025 CCF中国开源大会
迅龙软件携最新成果亮相2025世界人工智能大会,共探AI未来新图景
迅龙软件参加昇腾 AI 开发者创享日・广东站,为开发者打造沉浸式实操体验
迅龙软件受邀参加2025龙芯产品发布暨用户大会,发布基于龙芯2K3000的OrangePi Nova
迅龙软件携多个AI产品参加鲲鹏昇腾开发者大会,重磅发布新品OrangePi AImax
迅龙软件联合发布昇腾五大创新方向成果,共建智能生态
2024源创会盛典上,香橙派现场解锁OrangePi AIpro/AI Studio搭载大模型实战案例,吸睛无数
迅龙软件受邀参加华为昇思人工智能框架峰会,展示昇思X香橙派的创新AI案例

迅龙软件参加开源中国《数智漫谈》,探讨AI如何迈进大模型时代
评论