0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产大模型发展的经验与教训

架构师技术联盟 来源:国产算力训练大模型的经 2024-11-11 11:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文介绍大模型的计算特征(国产平台介绍、系统挑战、算子实现、容错)、框架的并行性支持、未来算法等。

随着ChatGPT的横空出世,人工智能大模型成为各行各业热议的焦点,国内外各种大模型如雨后春笋般涌现,引发了新一轮人工智能热潮。但在看到大模型取得巨大进步的同时,也要看到当前国内大模型的研发推广仍然面临不小的挑战和压力。

面对上述挑战,需从战略层面统筹考虑大模型研发运营等相关问题,充分发挥“集中力量办大事”的制度优势,强化顶层设计,加大统一规划,加大政策支持和资源投入力度,推动中国人工智能从“跟跑”迈向“领跑”。

一是提高算力规模。进一步完善信息基础设施,加快推进“东数西算”步伐,加大算力网络建设力度,为大模型研发运营提供足够算力,同时进一步提高网络速度,降低网络时延,为更多大模型走向应用创造条件。

二是加强数据管理。国家层面加强对数据的管控,明确行业标准,建立数据使用规则,确保大模型训练数据的质量。同时,针对行业数据,破除不同厂家之间数据互相不能查询的壁垒,确保大模型训练有充足、准确的专业数据。

三是建立大模型研发“国家队”。集中全国顶尖人才和优质资源,举全国之力进行攻坚突破,同时解决大模型研发中存在的“小而散”问题,减少无效或低效大模型开发对算力和能源的浪费。

四是加大资金投入。建立国家大模型基金,专门用于大模型的研发、训练等。

五是加大政策支持。面向大模型研发,制订更加优惠的税收政策。针对国有企业在大模型研发上投入的资金,允许以两倍规模计为企业净利润。

六是加大科技投入。解决核心技术“卡脖子”问题,特别是加大人工智能芯片研发制造力度。

0057c2ec-9054-11ef-a511-92fbcf53809c.jpg

006aa010-9054-11ef-a511-92fbcf53809c.jpg

007af7c6-9054-11ef-a511-92fbcf53809c.jpg

009ee514-9054-11ef-a511-92fbcf53809c.jpg

00bd551c-9054-11ef-a511-92fbcf53809c.jpg

00d5e9d8-9054-11ef-a511-92fbcf53809c.jpg

01167714-9054-11ef-a511-92fbcf53809c.jpg

012e2f58-9054-11ef-a511-92fbcf53809c.jpg

014d67e2-9054-11ef-a511-92fbcf53809c.jpg

0161fb9e-9054-11ef-a511-92fbcf53809c.jpg

0183083e-9054-11ef-a511-92fbcf53809c.jpg

019b65e6-9054-11ef-a511-92fbcf53809c.jpg

01b1d3c6-9054-11ef-a511-92fbcf53809c.jpg

01ca3754-9054-11ef-a511-92fbcf53809c.jpg

01f4fbec-9054-11ef-a511-92fbcf53809c.jpg

020f59ce-9054-11ef-a511-92fbcf53809c.jpg

022502f6-9054-11ef-a511-92fbcf53809c.jpg

023a462a-9054-11ef-a511-92fbcf53809c.jpg

0263bd5c-9054-11ef-a511-92fbcf53809c.jpg

0287fb22-9054-11ef-a511-92fbcf53809c.jpg

0298d0d2-9054-11ef-a511-92fbcf53809c.jpg

02bfe352-9054-11ef-a511-92fbcf53809c.jpg

02deee00-9054-11ef-a511-92fbcf53809c.jpg

030166ce-9054-11ef-a511-92fbcf53809c.jpg

031746b0-9054-11ef-a511-92fbcf53809c.jpg

03388db6-9054-11ef-a511-92fbcf53809c.jpg

034fbb12-9054-11ef-a511-92fbcf53809c.jpg

0369f586-9054-11ef-a511-92fbcf53809c.jpg

0383de2e-9054-11ef-a511-92fbcf53809c.jpg

03a2fd68-9054-11ef-a511-92fbcf53809c.jpg

03cd573e-9054-11ef-a511-92fbcf53809c.jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算力
    +关注

    关注

    2

    文章

    1383

    浏览量

    16554
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4960

原文标题:国产大模型的经验与教训

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    成都汇阳投资关于国产开源模型持续突破,国产AI 竞争力增强

           国产开源模型领跑 ,AI 生态有望加速繁荣 根据独立 AI 基准测试与分析平台 Artificial Analysis 最新榜单 , 国产模型 KimiK2Thinkin
    的头像 发表于 11-24 14:01 163次阅读

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识别的神经网络
    发表于 10-22 07:03

    100%全国产工控整机,助力工控“芯”发展

    在科技飞速发展的当下,工业控制领域正经历着深刻变革。随着对信息安全和自主可控需求的不断提升,全国产化的工控产品成为行业发展的新趋势。其中,100% 全国产的工控整机 以其卓越的性能和可
    的头像 发表于 08-30 10:34 657次阅读

    华为CANN与智谱GLM端侧模型完成适配

    已于7月28日正式开源其新一代基座模型GLM-4.5,其GLM端侧模型已完成与CANN的适配。这标志着国产模型与计算架构在端云协同方向实现关键突破,
    的头像 发表于 08-11 11:00 2189次阅读

    信创浪潮下,国产主板有什么新的发展机遇?

    在信息技术应用创新浪潮的推动下,国产主板迎来了诸多新的发展机遇。信创产业旨在实现信息技术领域的自主可控,这一战略目标为国产主板的发展提供了广阔的空间。信创浪潮下
    的头像 发表于 05-09 09:24 564次阅读
    信创浪潮下,<b class='flag-5'>国产</b>主板有什么新的<b class='flag-5'>发展</b>机遇?

    支持国货!!!免积分分享国产芯片电机驱动系统设计

    美国对中国的芯片出口进行严格管制,导致中国很多科技企业陷入困难境地,发展和使用国产化的芯片刻不容缓,在此背景下,本文设计了一款全国产化的电机驱动系统。
    发表于 03-07 13:36

    国产飞腾主板,是科技创新发展的坚实后盾力量

    科技创新发展到现在已经形成了完整的工业体系,各种各样的产业随之发起起来,加速了科技生活的发展。而一个完整的工业体系同样离不开国产主板的支持,而国产飞腾主板以其各种各样的功能特性以及对恶
    的头像 发表于 02-20 11:18 668次阅读

    中软国际科创中心上线DeepSeek模型

    DeepSeek的昇腾迁移、模型部署、模型蒸馏、模型精调、SAAS应用、Agent开发等多样化AI服务,推动人工智能在各领域的应用,加速国产化AGI产业
    的头像 发表于 02-08 18:02 1739次阅读

    墨芯S40计算卡实现DeepSeek大模型部署

    近期,“国产之光”DeepSeek系列大模型发展迅猛,领跑开源大模型技术与生态,为中国人工智能行业带来了前所未有的变革动力,对全球科技竞争格局产生积极影响。
    的头像 发表于 02-08 10:40 1369次阅读

    海光信息技术团队完成模型与DCU国产化适配

    近期,中科曙光国家先进计算产业创新中心有限公司对外发布了一则重要消息。据悉,该公司的海光信息技术团队已经成功完成了DeepSeek V3和R1模型与海光DCU(深度计算单元)的国产化适配工作,并
    的头像 发表于 02-06 11:37 1742次阅读

    Meta组建四大专研小组,深入探索DeepSeek模型

    近日,据报道,脸书母公司Meta为了提升其大模型Llama的性能,专门成立了四个研究小组,深入探索量化巨头幻方量化旗下的国产模型DeepSeek的工作原理。 据悉,Meta组建的这四个小组各有侧重
    的头像 发表于 02-05 14:02 704次阅读

    国产工控主板,高性能需求产业的发展的核心动力

    随着科技时代的发展,我们的国产主板也是经历了一代又一代的更新,国产主板的更新换代意味着它性能的提升、功能配置的丰富。而高性能的国产主板也更贴切我们的购买首选,在市场上,企业对高性能
    的头像 发表于 02-05 09:02 521次阅读

    【「大模型启示录」阅读体验】+开启智能时代的新钥匙

    的对话,提供各种信息和帮助。我也听闻大模型在智能写作、智能客服等领域有着出色的表现,能够大大提高工作效率和服务质量。但是,我对于大模型背后的技术原理、发展历程以及它对社会和未来的深远影响,却知之甚少。我
    发表于 12-24 13:10

    【「大模型启示录」阅读体验】对大模型更深入的认知

    内容让我对大模型技术的发展有了更全面的认识。我意识到,大模型不仅仅是一些算法和代码的堆砌,它们背后有着深刻的科技变革和产业竞争。 书中对大模型与不同行业结合的讨论,更是让我眼前一亮。我
    发表于 12-20 15:46

    【「大模型启示录」阅读体验】如何在客服领域应用大模型

    模型可以提高客户满意度和服务质量。新引入的模型需要能够无缝集成到现有系统中,以确保服务的连续性和稳定性。因此,在选择模型时需要考虑其与现有系统的兼容性。同时,随着企业业务的发展,可能
    发表于 12-17 16:53