0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM在watsonx.ai平台推出DeepSeek R1蒸馏模型

科技绿洲 来源:网络整理 作者:网络整理 2025-02-14 10:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

IBM近日宣布了一项重要更新,为其企业级AI开发平台watsonx.ai引入了DeepSeek R1的Llama 3.1 8B和Llama 3.3 70b蒸馏版本。这一举措旨在通过先进的AI技术,进一步增强企业在安全、治理以及规模化部署方面的能力。

DeepSeek R1是IBM在AI领域的一项重要创新,它采用了蒸馏模型技术,能够在保持模型性能的同时,显著减小模型体积,提高运行效率。此次在watsonx.ai平台上推出的Llama 3.1 8B和Llama 3.3 70b蒸馏版本,正是DeepSeek R1技术的具体体现。

Llama 3.1 8B和Llama 3.3 70b作为大型语言模型,具有强大的自然语言处理和理解能力。通过蒸馏技术的优化,它们在保持高精度和泛化能力的同时,更加适合在企业环境中进行部署和应用。

IBM企业级AI开发平台watsonx.ai的此次更新,将为企业用户提供更加高效、安全的AI解决方案。借助DeepSeek R1的蒸馏模型,企业可以在保障数据安全和合规性的前提下,快速实现AI模型的规模化部署和应用,从而加速企业的数字化转型和创新发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1891

    浏览量

    77229
  • AI
    AI
    +关注

    关注

    91

    文章

    42239

    浏览量

    303267
  • 模型
    +关注

    关注

    1

    文章

    3882

    浏览量

    52379
  • DeepSeek
    +关注

    关注

    2

    文章

    862

    浏览量

    3500
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度腾讯抢滩布局!DeepSeek-R1升级和开源背后,国产AI的逆袭之路

    电子发烧友网报道(文/李弯弯)日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,当前版本为DeepSeek-R1-0528。次日,
    的头像 发表于 06-03 06:34 6482次阅读

    IBM发布"AI运营模式"蓝图

    四大核心产品——新一代多智能体编排工具IBM watsonx Orchestrate、实时数据流平台IBM Confluent、AI驱动智能
    的头像 发表于 05-12 09:50 667次阅读

    DeepSeek爆火一周年的寂静

    ,争先恐后地展示技术进步。而另一边,则是DeepSeek模型缺席春节假期,与一年前R1横空出世、引爆全球关注的高光姿态,形成了鲜明对比。   恰逢R1爆火一周年的时刻,我们回溯了过去
    的头像 发表于 02-26 14:15 1.2w次阅读
    <b class='flag-5'>DeepSeek</b>爆火一周年的寂静

    广和通成功部署DeepSeek-R1-0528-Qwen3-8B模型

    近日,广和通MediaTek MT8893平台上成功部署并运行了DeepSeek-R1-0528-Qwen3-8B模型,显著提升了端侧AI
    的头像 发表于 09-26 13:35 1081次阅读

    溪图科技与IBM合作打造AI基建生态系统

    近日,IBM 与溪图科技(杭州)有限公司(以下简称”溪图科技”)达成合作,双方将基于 IBM watsonx 数据和 AI 平台
    的头像 发表于 09-24 16:07 1248次阅读

    DeepSeek R1 MTPTensorRT-LLM中的实现与优化

    。我们之前的博客[1] 中介绍了 DeepSeek-R1 模型实现超低推理延迟的关键优化措施。本文将深入探讨 TensorRT-LLM 中的 MTP 实现与优化。
    的头像 发表于 08-30 15:47 4836次阅读
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> MTP<b class='flag-5'>在</b>TensorRT-LLM中的实现与优化

    OpenAI开源模型登陆IBM watsonx.ai开发平台

    OpenAI 已向公众发布了两款 AI 模型,允许开发者和企业可自由下载、运行并进行定制。其中一款模型现已部署 IBM
    的头像 发表于 08-26 15:36 1225次阅读

    边缘计算AI硬件如何接入DeepSeek吗?需要具备哪些条件?

    2025年伊始,一款来自中国初创公司“深度求索”的AI模型DeepSeek横空出世,惊艳全球。DeepSeek厉害之处在于,中国被外国芯
    的头像 发表于 08-21 10:30 2117次阅读
    边缘计算<b class='flag-5'>AI</b>硬件如何接入<b class='flag-5'>DeepSeek</b>吗?需要具备哪些条件?

    如何在NVIDIA Blackwell GPU上优化DeepSeek R1吞吐量

    开源 DeepSeek R1 模型的创新架构包含多头潜在注意力机制 (MLA) 和大型稀疏混合专家模型 (MoE),其显著提升了大语言模型
    的头像 发表于 08-12 15:19 4634次阅读
    如何在NVIDIA Blackwell GPU上优化<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>吞吐量

    速看!EASY-EAI教你离线部署Deepseek R1模型

    和自然语言推理等复杂任务。作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,全球人工智能领域引发广泛关注。本文主要说明DeepSeek-R1
    的头像 发表于 07-25 15:22 1659次阅读
    速看!EASY-EAI教你离线部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    提升,达到 60TPS。 从书上得知,DeepSeek-V3的训练成本只需五百万美元,堪比AI领域的拼多多。而且其准确率某几项评测指标上也达到了不错的水平 DeepSeek
    发表于 07-17 11:59

    信而泰×DeepSeekAI推理引擎驱动网络智能诊断迈向 “自愈”时代

    模态的技术特性,DeepSeek正加速推动AI金融、政务、科研及网络智能化等关键领域的深度应用。 信而泰:AI推理引擎赋能网络智能诊断新范式信而泰深度整合
    发表于 07-16 15:29

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    颇具优势。Arm 携手合作伙伴, Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R1 满血版的部署,目前已可提供线上服务。
    的头像 发表于 07-03 14:37 1505次阅读
    Arm Neoverse N2<b class='flag-5'>平台</b>实现<b class='flag-5'>DeepSeek-R1</b>满血版部署

    智能体AI面临非结构化数据难题:IBM推出解决方案

    北京 2025年7月1日 /美通社/ -- IBM 正在从根本上简化面向 AI 的数据堆栈。IBM Think大会上预览 
    的头像 发表于 07-02 09:40 743次阅读

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    的基础。对 DeepSeek-R1-Zero 的组相对策略优化**(GRPO)算法、奖励模型**等关键技术的深入剖析,可以帮助读者了解 DeepSeek 强化学习领域的创新性探索。对
    发表于 06-09 14:38