0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产大模型发展的经验与教训

架构师技术联盟 来源:国产算力训练大模型的经 2024-11-11 11:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文介绍大模型的计算特征(国产平台介绍、系统挑战、算子实现、容错)、框架的并行性支持、未来算法等。

随着ChatGPT的横空出世,人工智能大模型成为各行各业热议的焦点,国内外各种大模型如雨后春笋般涌现,引发了新一轮人工智能热潮。但在看到大模型取得巨大进步的同时,也要看到当前国内大模型的研发推广仍然面临不小的挑战和压力。

面对上述挑战,需从战略层面统筹考虑大模型研发运营等相关问题,充分发挥“集中力量办大事”的制度优势,强化顶层设计,加大统一规划,加大政策支持和资源投入力度,推动中国人工智能从“跟跑”迈向“领跑”。

一是提高算力规模。进一步完善信息基础设施,加快推进“东数西算”步伐,加大算力网络建设力度,为大模型研发运营提供足够算力,同时进一步提高网络速度,降低网络时延,为更多大模型走向应用创造条件。

二是加强数据管理。国家层面加强对数据的管控,明确行业标准,建立数据使用规则,确保大模型训练数据的质量。同时,针对行业数据,破除不同厂家之间数据互相不能查询的壁垒,确保大模型训练有充足、准确的专业数据。

三是建立大模型研发“国家队”。集中全国顶尖人才和优质资源,举全国之力进行攻坚突破,同时解决大模型研发中存在的“小而散”问题,减少无效或低效大模型开发对算力和能源的浪费。

四是加大资金投入。建立国家大模型基金,专门用于大模型的研发、训练等。

五是加大政策支持。面向大模型研发,制订更加优惠的税收政策。针对国有企业在大模型研发上投入的资金,允许以两倍规模计为企业净利润。

六是加大科技投入。解决核心技术“卡脖子”问题,特别是加大人工智能芯片研发制造力度。

0057c2ec-9054-11ef-a511-92fbcf53809c.jpg

006aa010-9054-11ef-a511-92fbcf53809c.jpg

007af7c6-9054-11ef-a511-92fbcf53809c.jpg

009ee514-9054-11ef-a511-92fbcf53809c.jpg

00bd551c-9054-11ef-a511-92fbcf53809c.jpg

00d5e9d8-9054-11ef-a511-92fbcf53809c.jpg

01167714-9054-11ef-a511-92fbcf53809c.jpg

012e2f58-9054-11ef-a511-92fbcf53809c.jpg

014d67e2-9054-11ef-a511-92fbcf53809c.jpg

0161fb9e-9054-11ef-a511-92fbcf53809c.jpg

0183083e-9054-11ef-a511-92fbcf53809c.jpg

019b65e6-9054-11ef-a511-92fbcf53809c.jpg

01b1d3c6-9054-11ef-a511-92fbcf53809c.jpg

01ca3754-9054-11ef-a511-92fbcf53809c.jpg

01f4fbec-9054-11ef-a511-92fbcf53809c.jpg

020f59ce-9054-11ef-a511-92fbcf53809c.jpg

022502f6-9054-11ef-a511-92fbcf53809c.jpg

023a462a-9054-11ef-a511-92fbcf53809c.jpg

0263bd5c-9054-11ef-a511-92fbcf53809c.jpg

0287fb22-9054-11ef-a511-92fbcf53809c.jpg

0298d0d2-9054-11ef-a511-92fbcf53809c.jpg

02bfe352-9054-11ef-a511-92fbcf53809c.jpg

02deee00-9054-11ef-a511-92fbcf53809c.jpg

030166ce-9054-11ef-a511-92fbcf53809c.jpg

031746b0-9054-11ef-a511-92fbcf53809c.jpg

03388db6-9054-11ef-a511-92fbcf53809c.jpg

034fbb12-9054-11ef-a511-92fbcf53809c.jpg

0369f586-9054-11ef-a511-92fbcf53809c.jpg

0383de2e-9054-11ef-a511-92fbcf53809c.jpg

03a2fd68-9054-11ef-a511-92fbcf53809c.jpg

03cd573e-9054-11ef-a511-92fbcf53809c.jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算力
    +关注

    关注

    2

    文章

    1680

    浏览量

    16833
  • 大模型
    +关注

    关注

    2

    文章

    3787

    浏览量

    5273

原文标题:国产大模型的经验与教训

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    联合华为!国产模型登顶全球,0.1元一张图

    被海外巨头垄断的背景下,中国团队首次用纯国产算力底座,训练出达到世界领先水平的多模态SOTA模型。    
    的头像 发表于 01-17 00:48 1.3w次阅读
    联合华为!<b class='flag-5'>国产</b>大<b class='flag-5'>模型</b>登顶全球,0.1元一张图

    摩尔线程 x 中国移动|国产GPU率先支撑央企大模型,S5000完成九天35B大模型适配

    ,依托成熟的MUSA软件栈与高性能算子优化,已率先完成九天35B模型的全流程适配与推理验证。这不仅是国产GPU与央企大模型的深度协同,更意味着国产AI算力已具备支撑行业级大
    发表于 04-28 08:32 696次阅读

    基于米尔RK3576核心板的国产割草机器人解决方案

    在智慧庭院与机器人产业高速发展的今天,割草机器人正经历从“随机碰撞式”向“规划自主式”的深刻变革。与此同时,在国产化替代、供应链自主可控的产业政策推动下,国内整机厂商对高算力、低功耗、国产自主可控
    发表于 04-24 17:31

    九天菜菜大模型agent智能体开发实战2026一月班

    ,引领着自主 AI 迈向全新范式。(搜星 课it。top) 大模型 Agent 的崛起并非偶然,它是人工智能发展到一定阶段的必然产物。传统 AI 往往局限于单一任务,缺乏自主性和灵活性,难以应对
    发表于 04-15 16:04

    了解全国产转速地磁测量模块的应用前景

    在当今科技迅速发展的时代,地磁测量成为了众多领域关注的焦点。特别是全国产转速地磁测量模块,以其独特的功能和优势,有望在多种应用场景中发挥重要作用。那么,什么是全国产转速地磁测量模块?它的应用前景又有
    发表于 03-23 10:35

    国产MCU工具6个月内给原厂添加200+的经验分析

    我们参与了一个国产 MCU 原厂的 Studio 工具建设, 最终支持了 200+ MCU 型号。 这里不谈功能,只谈工程实践。 一条非常重要的经验 不要试图给每个芯片型号做一套配置;不要试图用
    发表于 02-06 09:22

    上海交大发布国产光学大模型Optics GPT

    电子发烧友网综合报道 1月25日,上海交通大学正式推出光学领域垂直大语言模型——Optics GPT(光学大模型),这是一款完全自主研发的国产模型。该
    的头像 发表于 01-26 09:59 2220次阅读
    上海交大发布<b class='flag-5'>国产</b>光学大<b class='flag-5'>模型</b>Optics GPT

    云知声荣登MedAIBench优秀国产医疗大模型榜单

    12月20日,国家人工智能应用中试基地(医疗)·浙江正式发布《MedAIBench测评榜(优秀国产医疗大模型)》。在这一具备行业权威性与临床导向性的严格测评中,云知声自主研发的山海·知医大模型凭借全面领先的综合能力与扎实的落地成
    的头像 发表于 12-29 14:36 931次阅读

    成都汇阳投资关于国产开源模型持续突破,国产AI 竞争力增强

           国产开源模型领跑 ,AI 生态有望加速繁荣 根据独立 AI 基准测试与分析平台 Artificial Analysis 最新榜单 , 国产模型 KimiK2Thinkin
    的头像 发表于 11-24 14:01 737次阅读

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识别的神经网络
    发表于 10-22 07:03

    100%全国产工控整机,助力工控“芯”发展

    在科技飞速发展的当下,工业控制领域正经历着深刻变革。随着对信息安全和自主可控需求的不断提升,全国产化的工控产品成为行业发展的新趋势。其中,100% 全国产的工控整机 以其卓越的性能和可
    的头像 发表于 08-30 10:34 1011次阅读

    华为CANN与智谱GLM端侧模型完成适配

    已于7月28日正式开源其新一代基座模型GLM-4.5,其GLM端侧模型已完成与CANN的适配。这标志着国产模型与计算架构在端云协同方向实现关键突破,
    的头像 发表于 08-11 11:00 2779次阅读

    国产芯片多架构开发实践:从工业控制到边缘AI的硬件设计经验

    近年来,国产处理器与异构计算架构的成熟为硬件开发者提供了新选择。我们基于飞腾、龙芯、海光等平台,在VPX/COMe/ITX架构上完成了多个工业级项目验证,在此分享一些实战经验。 硬件架构技术解析
    的头像 发表于 05-23 09:24 1178次阅读

    中软国际科创中心上线阿里Qwen3-235B模型

    近日,中软国际科创中心快速部署阿里Qwen3-235B模型并完成测试,为客户提供 AI 项目POC的模型新选择,助力企业快速实现智能化转型,加速国产化通用人工智能(AGI)产业发展
    的头像 发表于 05-12 15:40 1200次阅读

    信创浪潮下,国产主板有什么新的发展机遇?

    在信息技术应用创新浪潮的推动下,国产主板迎来了诸多新的发展机遇。信创产业旨在实现信息技术领域的自主可控,这一战略目标为国产主板的发展提供了广阔的空间。信创浪潮下
    的头像 发表于 05-09 09:24 872次阅读
    信创浪潮下,<b class='flag-5'>国产</b>主板有什么新的<b class='flag-5'>发展</b>机遇?