0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Kneron AI实现部署DeepSeek-R1大模型

Kneron耐能 来源:Kneron耐能 2025-02-10 11:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能的快速发展浪潮中,Kneron 始终紧跟最前沿的技术,并不断优化自身的 AI 方案,以更强大的能力和更优的性价比赋能各行各业。

如今,Kneron 取得了一个令人兴奋的突破——借助 DeepSeek-R1 论文中提到的前沿训练技巧,Kneron 成功让自研的 LLM 模型掌握了“思维链推理(Chain-of-Thought Reasoning)”和“自我反思(Reflection)”的能力,并已部署在 Kneo300 和 Kneo330 AI 一体机上,为企业提供更智能、更精准的 AI 解决方案,Kneron智能决策系统已落地医疗金融等多个场景。

这意味着,Kneron 的 AI 不再仅仅是回答问题或执行任务,而是能够“思考”和“推理”,让 AI 具备更强的逻辑推导能力,从而更好地理解复杂问题,给出更可靠、更专业的答案。

Kneron 已经在医疗、金融、企业客服等多个行业场景中成功应用了这一创新技术,帮助客户实现更高效的 AI 赋能。

什么是“思维链推理”和“自我反思”?

在传统的 AI 对话系统中,模型往往直接给出答案,但很多时候,这些答案缺乏逻辑推导,容易出现前后矛盾或不够严谨的情况。而 “思维链推理” 让 AI 学会像人类一样,逐步拆解问题,形成清晰的推理步骤,避免“拍脑袋”式的回答。

更重要的是,Kneron 的 AI 还具备了“自我反思(Reflection)”能力--在回答复杂问题时,它可以回顾自己的推理过程,检查是否有逻辑错误,并在发现问题后主动调整答案。这种能力在数学计算、金融分析、医学诊断等领域尤其重要,因为这些场景需要 AI 不仅提供答案,还要保证答案的正确性和推理过程的严谨性。

经训练提升后, KneronLLM-R1 可以有一个推理思考的过程,可以通过思考输出更正确的答案。

突破创新:Kneron 如何做到的?

这次突破的核心在于 Kneron 采用了 DeepSeek-R1 论文中提出的强化学习(Reinforcement Learning, RL)和蒸馏(Distillation)等技术,使 AI 在训练过程中逐步学会推理和反思。其关键步骤包括:

1.高质量数据整理与冷启动训练

参考 DeepSeek-R1 的方法,Kneron 通过构建高质量的思维链(Chain-of-Thought, CoT)数据,精心筛选多轮推理示例,进行冷启动训练。这一阶段提高了模型的可读性和稳定性,使 AI 具备基本推理能力。

2.拒绝采样 + 蒸馏

Kneron 采用拒绝采样(Rejection Sampling),筛选出最优推理路径,并结合知识蒸馏(Knowledge Distillation),将Deepseek-r1及o1等大模型的推理能力迁移到轻量级模型,使 Kneron AI 既具备强大的推理能力,又能在 Kneo300 和 Kneo330 上高效运行。

3.强化学习优化推理能力

训练后期,Kneron 采用类似于 DeepSeek-R1 的强化学习策略,在训练过程中让 AI 通过自对比和奖励机制学习最佳推理路径。模型会生成多个不同的推理链,并根据准确性和逻辑一致性进行优化。

4.语言一致性与长文本优化

由于 AI 需要适应不同场景,Kneron 还借鉴 DeepSeek-R1 在语言优化方面的方法,引入语言一致性奖励,确保模型在复杂推理过程中保持逻辑清晰,避免回答混乱或前后矛盾。

最终,耐能成功将这一增强版 AI 部署在 Kneo300 和 Kneo330 AI 一体机 上,让更多企业和开发者可以直接使用具备推理能力的 AI,为他们的业务赋能。

更智能的 AI,如何助力行业升级?

这项技术的突破,正在帮助多个行业实现 AI 赋能,耐能已经在以下场景中实现落地应用:

1. 医疗问卷 AI 助手

在医疗行业,医生和医院需要收集大量的患者信息,进行健康评估。Kneron 的 AI 可在问卷填写过程中进行推理,根据患者的回答动态调整问题,并分析可能的健康风险,提高诊断效率。

2.金融衍生品定价 AI

金融衍生品定价涉及复杂数学计算和市场分析。Kneron AI 结合“思维链推理”技术,精准解析结构与条款,融合金融数学模型,智能推导定价策略,为金融机构提供高效、精准的投资优化与风险管控方案。

3. 金融数据分析助手

金融行业的数据繁多且复杂,传统的 AI 只能提供简单的报表分析,而 Kneron 的 AI 能够基于数据推理找出数据中的异常,帮助财务人员和分析师做出更高维度的分析。

4. 企业资料智能客服

许多企业客服需要处理大量的内部文档和客户问题,Kneron AI 可自动读取、理解企业文档,并提供准确的回答,降低企业客服成本,同时提升客户体验。

5. 会议纪要 AI 助手

Kneron AI 可帮助企业自动生成高质量的会议纪要,不仅记录内容,还能分析会议重点,提炼核心观点,帮助企业提升会议效率。

为什么选择耐能?

这次技术升级,充分展现了耐能在AI领域的创新能力和技术实力。耐能不仅能紧跟前沿技术趋势,还能将这些技术快速落地,为客户提供极具性价比的软硬一体 AI 解决方案。

Kneron AI 的核心优势:

软硬一体,性能更优:AI 直接运行在 Kneo300 和 Kneo330 上,速度更快,成本更低,无需依赖云端计算,实现软硬件深度协同优化,显著优化部署成本与提高隐私安全指标。

推理更强,结果更精准:认知推理能力突破,具备“思维链推理”和“自我反思”能力,在自然语言处理、复杂决策支持等场景提供更具逻辑性答案。

应用灵活,行业适配广:已落地医疗、金融、企业客服等多个场景,助力各行业智能升级。

在 AI 时代,拥有强大的推理能力意味着 AI 不仅能“回答问题”,还能“思考问题”。Kneron 的这一突破,为行业提供了一种全新的 AI 解决方案,帮助企业更高效地利用 AI,创造更大的价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38120

    浏览量

    296661
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51713
  • 耐能
    +关注

    关注

    0

    文章

    38

    浏览量

    11072
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2812

原文标题:突破性融合DeepSeek-R1训练框架!Kneron AI实现行业芯片级思维链推理

文章出处:【微信号:KneronChina,微信公众号:Kneron耐能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    速看!EASY-EAI教你离线部署Deepseek R1模型

    1.Deepseek简介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型
    的头像 发表于 07-25 15:22 1022次阅读
    速看!EASY-EAI教你离线<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R1 满血版的部署,目前已可提供线上服务。
    的头像 发表于 07-03 14:37 992次阅读
    Arm Neoverse N2平台<b class='flag-5'>实现</b><b class='flag-5'>DeepSeek-R1</b>满血版<b class='flag-5'>部署</b>

    如何使用OpenVINO运行DeepSeek-R1蒸馏模型

    DeepSeek-R1在春节期间引发了全球科技界的热度,DeepSeek-R1 是由 DeepSeek 开发的开源推理模型,用于解决需要逻辑推理、数学问题解决和实时决策的任务。
    的头像 发表于 03-12 13:45 2036次阅读
    如何使用OpenVINO运行<b class='flag-5'>DeepSeek-R1</b>蒸馏<b class='flag-5'>模型</b>

    在英特尔哪吒开发套件上部署DeepSeek-R1实现方式

    随着人工智能技术的快速发展,企业对 AI 模型部署方式有了更多选择。本地部署 DeepSeek-R1
    的头像 发表于 03-12 13:38 880次阅读
    在英特尔哪吒开发套件上<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b>的<b class='flag-5'>实现</b>方式

    RK3588开发板上部署DeepSeek-R1模型的完整指南

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,
    发表于 02-27 16:45

    行芯完成DeepSeek-R1模型本地化部署

    近日,行芯正式宣布完成 DeepSeek-R1模型本地化部署实现在多场景、多产品中应用。解锁“芯”玩法,开启“芯”未来!
    的头像 发表于 02-24 15:17 1143次阅读

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    ,Gemma 和其他多种模型,在安装Ollama工具之后,使用以下命令即可一键部署15亿参数的deepseek-r1模型,运行之后如下图所示: ollama run
    发表于 02-14 17:42

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实
    发表于 02-14 02:08

    超星未来惊蛰R1芯片适配DeepSeek-R1模型

    日前,超星未来研发团队成功完成了惊蛰R1芯片对DeepSeek-R1模型的适配工作,实现了与用户之间的流畅对话。这一成果标志着超星未来在人工智能芯片和
    的头像 发表于 02-13 14:05 1092次阅读

    Deepseek R1模型离线部署教程

    DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型DeepSeek-R1采用强化学习进行后训练,旨
    的头像 发表于 02-12 09:37 2445次阅读
    <b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>离线<b class='flag-5'>部署</b>教程

    广和通支持DeepSeek-R1蒸馏模型

    近期,国产大模型DeepSeek凭借开放性、更低训练成本、端侧部署等优势,迅速成为增速最快的AI应用之一,推动AI普惠化。目前,广和通高算力
    的头像 发表于 02-11 09:41 906次阅读

    AIBOX 全系产品已适配 DeepSeek-R1

    国产AI模型DeepSeek以出色的性价比和高效的模型技术,迅速成为全球AI关注的焦点。Firefly开源团队率先
    的头像 发表于 02-08 17:30 946次阅读
    AIBOX 全系产品已适配 <b class='flag-5'>DeepSeek-R1</b>

    DeepSeek-R1本地部署指南,开启你的AI探索之旅

    R1 2025.01.20 DeepSeek-R1 发布,DeepSeek R1DeepSeek
    的头像 发表于 02-08 10:30 8336次阅读
    <b class='flag-5'>DeepSeek-R1</b>本地<b class='flag-5'>部署</b>指南,开启你的<b class='flag-5'>AI</b>探索之旅

    deepin UOS AI接入DeepSeek-R1模型

    DeepSeek-R1 模型自发布以来吸引了众多用户关注,为了让 deepin 用户更好地体验这一前沿技术,UOS AI 现已适配接入 DeepSeek-R1 端侧
    的头像 发表于 02-08 09:52 2218次阅读

    芯动力神速适配DeepSeek-R1模型AI芯片设计迈入“快车道”!

    近期,国产大模型 DeepSeek-R1横空出世,迅速成为AI领域的焦点。 芯动力在24小时内完成了与DeepSeek-R1模型的适配。
    的头像 发表于 02-07 16:55 899次阅读
    芯动力神速适配<b class='flag-5'>DeepSeek-R1</b>大<b class='flag-5'>模型</b>,<b class='flag-5'>AI</b>芯片设计迈入“快车道”!