0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM企业级AI开发平台watsonx.ai上线DeepSeek R1蒸馏模型

IBM中国 来源:IBM中国 2025-02-12 10:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:IBM watsonx.ai 产品主管Maryam Ashoori;IBM AI 平台(watsonx.ai 和 watsonx.governance)产品管理副总裁Armand Ruiz;IBM watsonx.ai 产品经理Nisarg Patel

IBM日前宣布,DeepSeek-R1 的 Llama 3.1 8B 和 Llama 3.3 70b 蒸馏版本现已在 IBM 的企业级 AI 开发平台 watsonx.ai 上提供。

DeepSeek-R1 到底是啥?

DeepSeek-R1 是中国人工智能(AI)初创公司 DeepSeek 的推理大语言模型(LLM),是世界上最强大的开源模型之一,甚至可以与 OpenAI 的 o1 相媲美。DeepSeek-R1 在 MIT 许可证下发布,主要是通过在基础模型 DeepSeek-V3 上直接使用强化学习(RL)开发的,这是微调 LLM 的一项重大创新。

DeepSeek 还使用了一种称为知识蒸馏的技术,使用较大的 R1 模型生成的数据来微调多个 Llama 和 Qwen 模型。用户可以通过两种方式在 watsonx.ai 上访问 DeepSeek 蒸馏模型:

IBM 通过 “按需部署目录”在 watsonx.ai 中提供两种 Llama 蒸馏变体,允许用户部署专用实例进行安全推理。

用户还可以使用自定义基础模型导入功能导入 DeepSeek-R1 模型的其他变体,如 Qwen 蒸馏模型。

DeepSeek-R1 支持哪些类型的用例?

DeepSeek-R1 是一种先进的 AI 模型,以其卓越的推理能力而著称,支持各行各业的广泛应用:

规划:DeepSeek-R1 专注于思维逻辑链,能够执行需要逐步推理的任务,因此非常适合为智能体(代理)应用程序提供支持。

编码:DeepSeek-R1 擅长编码任务,提供代码生成、调试辅助和优化建议。

数学问题解决:该模型强大的推理能力使其善于解决复杂的数学问题,这对学术研究、工程和科学计算大有裨益。

开发人员可在 IBM watsonx.ai 中使用 DeepSeek-R1 等已部署的模型和解决方案功能构建人工智能解决方案:

以易于理解的格式和用户界面测试和评估模型输出

通过连接各种向量数据库和嵌入模型来构建 RAG 管道

与 LangChain、CrewAI 等流行框架和连接器协同工作

为何要在 watsonx.ai 上使用 DeepSeek 蒸馏模型?IBM watsonx.ai 使客户能够定制实施 DeepSeek-R1 等开源模型,从部署环境的完全灵活性到智能体(代理)开发、微调、RAG、提示工程和与企业应用程序集成的直观工作流,用户可以利用 watsonx.ai 的内置护栏来保护他们的应用程序。

当然,数据安全和 AI 治理是客户最关心的问题。除防护栏外,在 watsonx.ai 上部署时,这些模型将成为专用实例,这意味着除平台外,不会在其他任何地方共享数据。此外,与 IBM watsonx.governance 这一功能强大的治理、风险和合规性(GRC)工具包的无缝集成,可确保客户的 AI 在整个 AI 生命周期内都是负责任、透明和可解释的。

开始在 IBM watsonx.ai 上使用 DeepSeek

支持 DeepSeek-R1 的蒸馏变体是 IBM 致力于 AI 开源创新的一部分。DeepSeek Llama 的两个蒸馏模型都以纳入 IBM watsonx.ai 上按需部署目录,能够在专用 GPU 上按小时部署。

如何从 watsonx 资源中心按需部署 R1 模型从资源中心按需部署基础模型,请完成以下步骤:

1. 从导航菜单打开资源中心。

2. 从“按小时付费 ”部分,找到要按需部署的 DeepSeek 模型。

3. 从模型详细信息页面,单击“Deploy (部署)”。

4. 从基础模型磁贴中单击“Deploy (部署)”,然后选择要部署基础模型的部署空间。

5. 单击“Create (创建)”。

6. 通过 Prompt Lab 或 API/SDK 开始使用模型。

IBM watsonx.ai 在这里会用斜体显示模型的思维过程,而最终输出则用非斜体显示。正如你所见,只需一个简单的提示,模型就能推理并规划出响应中需要包含的各个部分。

如何通过 REST API 在 watsonx 上部署 R1 模型您也可以使用 REST API 来部署模型 当然,您必须将 bearer token 和 space-id 等信息替换为相应的凭证。模型部署完成后,您可以从 Prompt Lab 或 watsonx.ai API 提示基础模型。

通过让用户访问 watsonx.ai 上同类最优的开源模型(包括第三方模型和 IBM Granite),我们以期能够塑造协作和知识共享的文化。

关于 IBM

IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000家政府和企业实体依靠 IBM 混合云平台和红帽 OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1879

    浏览量

    77115
  • 模型
    +关注

    关注

    1

    文章

    3810

    浏览量

    52253
  • DeepSeek
    +关注

    关注

    2

    文章

    837

    浏览量

    3392

原文标题:企业通过 watsonx.ai 采用 DeepSeek R1 蒸馏模型,可增强安全、治理和规模化部署能力

文章出处:【微信号:IBMGCG,微信公众号:IBM中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型微调企业项目实战课

    自主可控大模型企业微调实战课,筑牢未来 AI 底座 在人工智能席卷全球商业版图的今天,企业对大模型(LLM)的态度已经从“新奇观望”转变
    发表于 04-16 18:48

    IBM完成对Confluent的收购,让实时数据成为企业级AI与智能体的引擎

    运营提供关键支持。 IBM和 Confluent 携手打造智能数据平台,为各类 AI 模型、智能体及自动化工作流提供实时、可信的数据支持,使其能够在本地和混合云环境中实现大规模稳定运行
    的头像 发表于 03-18 20:32 1271次阅读

    嵌入式AI开发必看:杜绝幻觉,才是工业IDE的核心底气

    1、全流程校验调试贯穿开发全生命周期 平台构建“软件调试 - 硬件联动 - AI 自动校验”三位一体的调试体系,将校验环节嵌入代码生成、图形化搭建、编译烧录、部署运行全流程。 从
    发表于 03-18 13:49

    模型 ai coding 比较

    %通过),Kimi 7/9(77.8%通过) 3. 代码重构/项目理解能力(权重25%) 测试目标 :模型对复杂项目的理解和工程化能力 测评题目:手工设计的企业级真实场景(10题) 覆盖题型: 读懂代码
    发表于 02-19 13:43

    溪图科技与IBM合作打造AI基建生态系统

    近日,IBM 与溪图科技(杭州)有限公司(以下简称”溪图科技”)达成合作,双方将基于 IBM watsonx 数据和 AI 平台
    的头像 发表于 09-24 16:07 1163次阅读

    OpenAI开源模型登陆IBM watsonx.ai开发平台

    OpenAI 已向公众发布了两款 AI 模型,允许开发者和企业可自由下载、运行并进行定制。其中一款模型现已部署在
    的头像 发表于 08-26 15:36 1125次阅读

    2025 IBM中国企业级AI巅峰论坛即将开幕

    的共创交流平台,将于 2025年 9月 5日在山东烟台举行 IBM 中国企业级 AI 巅峰论坛(此后简称“论坛“)。
    的头像 发表于 08-26 15:30 1283次阅读

    Cognizant加速AI模型企业级开发

    -Cognizant推出AI Training Data Services,助力企业级AI模型加速开发 Cognizant是数据与
    的头像 发表于 07-31 17:25 802次阅读

    速看!EASY-EAI教你离线部署Deepseek R1模型

    1.Deepseek简介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型
    的头像 发表于 07-25 15:22 1560次阅读
    速看!EASY-EAI教你离线部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    提升,达到 60TPS。 从书上得知,DeepSeek-V3的训练成本只需五百万美元,堪比AI领域的拼多多。而且其准确率在某几项评测指标上也达到了不错的水平 DeepSeek模型家族
    发表于 07-17 11:59

    信而泰×DeepSeekAI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI
    发表于 07-16 15:29

    智能体AI面临非结构化数据难题:IBM推出解决方案

    ,同时提供一个开放的混合数据基础架构和企业级的结构化和非结构化数据管理。 智能体AI面临非结构化数据难题:IBM推出解决方案 测试结果显示,与传统RAG相比,IBM
    的头像 发表于 07-02 09:40 660次阅读

    DeepSeek开源新版R1 媲美OpenAI o3

    DeepSeek“悄悄”地又放了一个大招,DeepSeek开源了R1最新0528版本。尽管DeepSeek目前还没有对该版本进行任何说明,但是根据著名代码测试
    的头像 发表于 05-29 11:23 1463次阅读

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型
    的头像 发表于 05-13 17:07 1845次阅读
    瑞萨RZ/V2H<b class='flag-5'>平台</b>支持部署离线版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大语言<b class='flag-5'>模型</b>

    IBM Think 2025重磅发布:混合云平台全栈升级,加速企业级AI变革

    / -- 今天,IBM在年度科技盛会 Think大会上发布了一系列混合云技术创新,有望打破企业级人工智能(AI)规模应用的长期桎
    的头像 发表于 05-07 18:39 794次阅读