英伟达近日宣布,其DeepSeek R1 671b版本已正式上线英伟达NIM(NVIDIA Inference Microservices)平台,并以预览版的形式在build.nvidia.com网站上发布。
据悉,DeepSeek R1 NIM微服务是英伟达在人工智能领域的一项重要创新,旨在为用户提供高效、精准的推理服务。在单个英伟达HGX H200系统上,该微服务每秒最多可处理3872个token,展现出强大的处理能力和高效性。
此次上线的DeepSeek R1 NIM微服务预览版,允许开发人员对其进行测试和实验,以更好地了解其性能和功能。英伟达表示,未来该API将作为英伟达AI Enterprise软件平台的一部分,以可下载的NIM微服务形式正式推出,为用户提供更加便捷、高效的使用体验。
英伟达一直致力于推动人工智能技术的发展和应用,此次发布的DeepSeek R1 NIM微服务预览版,不仅展示了英伟达在人工智能领域的强大技术实力,也为用户提供了更加高效、精准的推理服务。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
软件
+关注
关注
69文章
5360浏览量
91884 -
NIM
+关注
关注
0文章
10浏览量
8260 -
人工智能
+关注
关注
1820文章
50324浏览量
266938 -
英伟达
+关注
关注
23文章
4115浏览量
99619 -
DeepSeek
+关注
关注
2文章
839浏览量
3400
发布评论请先 登录
相关推荐
热点推荐
百度腾讯抢滩布局!DeepSeek-R1升级和开源背后,国产AI的逆袭之路
Hugging Face平台开源。用户可通过官方网页、App、小程序进入对话界面后,开启“深度思考”功能体验最新版本。API也已同步更新,调用方式不变。 DeepSeek-R1-0528编程能力提升
豪恩汽电发布基于英伟达平台的机器人域控与多维感知产品
3月26日下午,豪恩汽电举行豪恩机器人域控与多维感知产品发布暨投资者交流会,现场座无虚席,线上线下合计超过250名机构投资者与个人投资者,共同见证公司首款基于英伟达Jetson Thor平台
DeepSeek爆火一周年的寂静
,争先恐后地展示技术进步。而另一边,则是DeepSeek新模型缺席春节假期,与一年前R1横空出世、引爆全球关注的高光姿态,形成了鲜明对比。 恰逢R1爆火一周年的时刻,我们回溯了过去一年De
黄仁勋新年第一场演讲提了DeepSeek 黄仁勋:机器人领域迎来ChatGPT时刻
我们来看看英伟达首席执行官黄仁勋在CES 2026上发表的主题演讲。 黄仁勋新年第一场演讲提了DeepSeek 在当地时间1月5日黄仁勋在CES 2026上发表主题演讲,黄仁勋的新年
英伟达发布 NVQLink 开放系统架构;国内首个汽车芯片标准验证平台投入使用
英伟达发布 NVQLink 开放系统架构 在华盛顿特区举行的英伟达全球技术大会上,英伟
发表于 10-29 10:33
•1337次阅读
DeepSeek R1 MTP在TensorRT-LLM中的实现与优化
TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理性能的世界纪录,Multi-Token Prediction (MTP) 实现了大幅提速
如何在NVIDIA Blackwell GPU上优化DeepSeek R1吞吐量
开源 DeepSeek R1 模型的创新架构包含多头潜在注意力机制 (MLA) 和大型稀疏混合专家模型 (MoE),其显著提升了大语言模型 (LLM) 的推理效率。
速看!EASY-EAI教你离线部署Deepseek R1大模型
1.Deepseek简介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型。DeepSeek-R1采用强化学习进行后训练,旨在提升推理能力,尤其擅
【「DeepSeek 核心技术揭秘」阅读体验】--全书概览
讲解Deepseek的使用方法
第三章 深入剖析Deepseek-V3的模型架构、训练框架、推理阶段优化、后训练优化等关键技术
第四章关于DeepSeek-R1的技术剖析
第五章 从宏观角度分析
发表于 07-21 00:04
【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得
的展望,大模型的训练方法、推理部署,到 GPU 硬件及推理模型的发展趋势,以前瞻性的视角为读者描绘了大模型的发展蓝图。
技惊四座的DeepSeek -R1模型发布历程
2025年年初,全球人工智能领域
发表于 07-17 11:59
Arm Neoverse N2平台实现DeepSeek-R1满血版部署
颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R1 满血版的部署,目前已可提供线上服务。
DeepSeek开源新版R1 媲美OpenAI o3
DeepSeek“悄悄”地又放了一个大招,DeepSeek开源了R1最新0528版本。尽管DeepSeek目前还没有对该版本进行任何说明,但是根据著名代码测试
英伟达发布DeepSeek R1于NIM平台
评论