0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中软国际谈DeepSeek大模型带来的影响

中软国际 来源:中软国际 2025-02-18 10:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“计算机技术的发展史告诉我们,当更多的计算能力交到开发者手中时,他们总能发掘出新的应用场景和更多的任务去解决以前所解决不了的问题,或者是更高程度的优化以前的Solution。”——中软国际金融AI实验室主任简仁贤

小执:欢迎简总做客《前行者》访谈栏目!最近DeepSeek迅速出圈火爆全球,前不久您也刚接受了凤凰卫视直播间访问。请问DeepSeek到底好在哪里?又会带来怎样的影响?

简仁贤:DeepSeek凭借低成本、高效能的全开源模式,打破了训练大语言模型需巨额投入,和大语言模型只有闭源模型才能够做得最好的迷思。DeepSeek-V3基础模型通过混合精度优化、混合专家模型等技术,将训练成本降低至十分之一甚至二十分之一;R1推理模型则通过多阶段训练大幅降低推理成本,显著降低了AI模型开发的门槛。全开源优势让开发者可直接基于现有成果微调,无需从零训练。这些技术使DeepSeek以不到600万美元成本训练出与上亿美元模型相当的性能,掀起了一场AI革命。

今年,DeepSeek带来的几个重大的趋势会更为明显。闭源模型(如OpenAI)主导的"黑盒时代"正在终结,开源模型将成为主流;高端训练芯片需求增长放缓,推理芯片市场爆发;AI Agent将进一步繁荣,以及由此带来的对数据中心GPU计算资源的需求将持续上升。

小执:您能具体阐释下DeepSeek带来的这几点影响吗?

简仁贤:DeepSeek的技术架构显著降低了对高端硬件的依赖。传统大模型训练需数千块高端GPU,而DeepSeek通过优化算法,使得中小机构甚至可用消费级显卡(如NVIDIA 4090)进行微调。低功耗、低成本显卡(如未来NVIDIA 5090/6090)将成为主流,Mac mini等设备已能流畅运行DeepSeek 7B/14B模型。芯片毛利率或从当前的92%高位回落,推动硬件普惠化。由此,DeepSeek-R1增强技术进一步释放潜力:通过注入领域专家数据(如医疗、法律、金融的链式思考数据),开发者能快速训练出专业级模型,每个企业都可拥有专属智能体。软件架构开始深度集成开源模型生态,DeepSeek的开源模式和多模态分析技术也将催生更多创新应用,一些缺乏透明度的闭源公司可能面临泡沫化风险,被迫转向开源架构或垂直场景。

企业可企业通过云端算力资源与本地化部署结合,自主部署本地模型,摆脱对云端模型API的依赖,实现"模型自由"。预计全球将有超10万家企业基于其模型开发定制化智能体(如投资分析Agent、医疗诊断Agent),中小型企业首次获得与大厂对等的AI能力。软件行业迎来模型应用定制化服务红利期。结合低训练成本与开源生态,可负担的通用人工智能(Affordable AGI)将成为现实。

DeepSeek通过创新的技术整合(如混合专家模型、混合精度计算等),在保持强大推理能力的同时,大幅降低了AI模型的训练和推理成本,降幅达50-60倍,调用价格也降低了96.3%。尽管单次计算成本下降,根据杰文斯悖论,技术效率提升往往会刺激需求增长。随着AI在各行各业的广泛应用(如医疗、教育、金融等),更多的场景模型和AI智能体将涌现,带动数据中心、边缘及端侧算力建设,驱动算力整体需求增长。

小执:基于以上改变,您对政府/企业决策者有什么建议?

简仁贤:从微软、亚马逊英伟达等科技巨头,到Perplexity等企业都已经上线DeepSeek,再到600万美元训练顶尖模型的成本突破,这场由开源力量驱动的变革,正在重构全球AI产业格局,从芯片、软件到商业模式的未来的软件的范式将因此革新。全球AI正实现从“主权AI”到平权AI”,开启一个前所未有的创新爆炸时代。对于决策者而言,理解DeepSeek的技术贡献与逻辑至关重要,在技术层,优先采用开源架构,建立本地化模型部署能力,避免受制于闭源服务商;在战略层,聚焦高质量领域数据积累,利用R1推理能力打造垂直场景护城河;在生态层,参与开源社区协作,推动模块化Agent开发,抢占AI软件新生态的先机。

小执:对此,中软国际有什么举措?

简仁贤:目前,中软国际已将自主研发的JointPilot人工智能平台接入DeepSeek-R1,中软国际模型工场基于昇腾云、DeepSeek模型,推出升级版一站式AI解决方案服务。例如,在金融领域,可助力智能风险评估、精准客户营销;在制造业,可赋能设备故障预测、生产流程优化;在医疗领域,可实现智能诊断、辅助治疗决策等,进一步提升企业生产效率、打造新质生产力。中软国际科创中心以“DeepSeek+昇腾”为引擎,将DeepSeek全参模型满血版部署在全国产化智算环境中,实现671B参数的DeepSeek模型稳定运行,并面向社会提供DeepSeek的昇腾迁移、模型部署、模型蒸馏、模型精调、SAAS应用、Agent开发等多样化AI服务。

未来,中软国际也将帮助企业和开发者把更多以DeepSeek-R1为代表的推理模型接入实际应用场景,更广泛的满足生产级、高要求场景的业务提效需求,并助力各个领域提供服务,各行各业推出更多适配场景的AI应用和服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296527
  • 中软国际
    +关注

    关注

    0

    文章

    715

    浏览量

    8089
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2808

原文标题:前行者|中软国际金融AI实验室主任简仁贤:DeepSeek将推动AI Agent生态爆发

文章出处:【微信号:CSI00354,微信公众号:中软国际】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国际打造票据智能风控解决方案

    近年来,随着票据市场规模扩大与业务复杂度提升,银行票据风控面临监管趋严、商票风险频发等挑战。国际金融业务集团基于DeepSeek模型
    的头像 发表于 04-25 13:58 967次阅读

    国际助力北京理工大学珠海校区展开科研创新

    近日,国际助力北京理工大学(珠海)基于华为云昇腾AI云服务DeepSeek满血版大模型展开科研及教学创新。北京理工大学(珠海)经济监督大
    的头像 发表于 03-10 18:13 1090次阅读

    国际推出DeepSeek生态环境综合执法大模型一体机

    近日,国际正式推出“DeepSeek生态环境综合执法大模型一体机”解决方案。该方案以DeepSeek
    的头像 发表于 03-07 16:51 965次阅读

    HarmonyOS NEXT开发实战:DevEco StudioDeepSeek的使用

    随着HarmonyOS Next的持续发布,鸿蒙系统对AI能力的支持显著增强。本文将深入探讨如何在鸿蒙应用中集成AI模型,结合接入DeepSeek,一起来探索开发鸿蒙原生应用的更多可能吧! 第一步
    发表于 03-07 14:56

    国际发布基于昇腾计算架构的“DeepSeek社保基金监管大模型一体机”解决方案

          为了提升社保基金监管效能,推动社保基金管理的智能化、科学化、精准化,国际正式推出“DeepSeek社保基金监管大模型一体机”
    的头像 发表于 03-06 19:19 1683次阅读
    <b class='flag-5'>中</b><b class='flag-5'>软</b><b class='flag-5'>国际</b>发布基于昇腾计算架构的“<b class='flag-5'>DeepSeek</b>社保基金监管大<b class='flag-5'>模型</b>一体机”解决方案

    国际Lumi智能体开发平台支持DeepSeek

    作为大模型领域的一颗璀璨新星,DeepSeek模型结构到训推流程进行了全面优化,并完全开源,打破了算力依赖路径,推动行业从 “规模至上” 迈向 “效率优先”。
    的头像 发表于 02-28 15:46 934次阅读

    国际审计智能体平台接入DeepSeek满血版大模型

    近期,DeepSeek模型凭借卓越的技术性能和广泛的应用场景迅速成为行业焦点,推动AI技术向纵深发展。国际审计团队基于科创中心的算力基
    的头像 发表于 02-24 15:42 1593次阅读

    国际携手华为云助力北京昌平上线DeepSeek政务大模型

    近日,国际依托科创中心华为昇腾算力平台,支撑昌平区政务和数据局,成功完成DeepSeek-V3及DeepSeek-R1
    的头像 发表于 02-21 10:57 975次阅读

    国际智云数智平台接入DeepSeek

    在国产AI技术蓬勃发展的浪潮国际教育科技集团自研智云数智平台积极响应“AI+教育”趋势,与深度求索(DeepSeek)大
    的头像 发表于 02-19 10:33 1029次阅读

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    这也会带来新问题,随着模型参数增加,回复速度会明显下降,实际应用需根据需求权衡。使用 Ollama 工具部署的推理模型运行时主要依赖 CPU 运算。从运行监测数据能看到,
    发表于 02-14 17:42

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实
    发表于 02-14 02:08

    通动力天元智算接入DeepSeek系列模型

    近日,通动力天元智算大模型网关迎来重磅升级,正式接入DeepSeek系列模型,为企业生产力提升带来全新助力。
    的头像 发表于 02-10 09:44 874次阅读

    国际科创中心上线DeepSeek模型

    近日,国际科创中心以“DeepSeek+昇腾”为引擎,紧跟行业趋势,将DeepSeek全参模型
    的头像 发表于 02-08 18:02 1741次阅读

    国际推出升级版一站式AI解决方案服务

    近日,国际模型工场基于昇腾云、DeepSeek模型,推出升级版一站式AI解决方案服务。基于昇
    的头像 发表于 02-08 10:18 1064次阅读

    国际JointPilot平台上线DeepSeek-R1模型

    近日,DeepSeek-R1模型凭借其开源优势,超低训练成本和高性能,在全球人工智能领域引发广泛关注。国际积极拥抱AI时代变革,致力于将
    的头像 发表于 02-06 09:55 1246次阅读