0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息发布源2.0基础大模型,千亿参数全面开源

全球TMT 来源:全球TMT 作者:全球TMT 2023-11-28 09:10 次阅读

11月27日,浪潮信息发布"源2.0"基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。

当前,大模型技术正在推动生成式人工智能产业迅猛发展,而基础大模型的关键能力则是大模型在行业和应用落地能力表现的核心支撑,但基础大模型的发展也面临着在算法、数据和算力等方面的诸多挑战。源2.0基础大模型则针对性地提出了新的改进方法并获得了能力的提升。

算法方面,源2.0提出并采用了一种新型的注意力算法结构:局部注意力过滤增强机制(LFA:Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确、更人性,提升了模型的自然语言表达能力,进而提升了模型精度。

wKgZomVkrZuAFWGyAACX2OTQDsk961.jpg


数据方面,源2.0通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比,结合高效的数据清洗流程,为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据,我们清洗了从2018年至今约12PB的互联网数据,但仅获取到了约10GB的数学数据,投入巨大,收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源2.0采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量,获取了一批高质量的数学与代码预训练数据。

wKgaomVkrZuAeYSmAADRtny3Qdk117.jpg


算力方面,源2.0采用了非均匀流水并行的方法,综合运用流水线并行+优化器参数并行+数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题,该方法显著降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。

wKgaomVlP6mALQxWAAM0Ok9OLqE815.jpg


源2.0作为千亿级基础大模型,在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,源2.0在多项模型评测中,展示出了较为先进的能力表现。

wKgZomVkrZ6Af_R2AABvvDO94lM918.jpg


源2.0采用全面开源策略,全系列模型参数和代码均可免费下载使用。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 半导体
    +关注

    关注

    328

    文章

    24528

    浏览量

    202183
  • 浪潮
    +关注

    关注

    1

    文章

    404

    浏览量

    23576
  • 大模型
    +关注

    关注

    2

    文章

    1532

    浏览量

    1130
收藏 人收藏

    评论

    相关推荐

    浪潮信息“元脑”品牌全面升级,全力进击人工智能!

    在北京举行的浪潮信息生态伙伴大会(IPF2024)上,浪潮信息总经理胡雷钧表示,未来,一切计算皆AI,“元脑”全面升级为包括所有计算产品的智算品牌,同时“元脑”也是生态品牌。
    的头像 发表于 04-19 10:42 284次阅读
    <b class='flag-5'>浪潮信息</b>“元脑”品牌<b class='flag-5'>全面</b>升级,全力进击人工智能!

    浪潮信息发布企业大模型开发平台&quot;元脑企智&quot;EPAI,加速AI创新落地

    北京2024年4月18日 /美通社/ -- 4月17日,在2024浪潮信息生态伙伴大会(IPF2024)上,浪潮信息发布企业大模型开发平台"元脑企智"EPAI(Enterprise P
    的头像 发表于 04-18 21:21 147次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>企业大<b class='flag-5'>模型</b>开发平台&quot;元脑企智&quot;EPAI,加速AI创新落地

    浪潮信息发布企业大模型开发平台“元脑企智”EPAI

    4月17日,在2024浪潮信息生态伙伴大会(IPF2024)上,浪潮信息重磅发布企业大模型开发平台“元脑企智”EPAI(Enterprise Platform of AI),为企业AI
    的头像 发表于 04-18 10:12 115次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>企业大<b class='flag-5'>模型</b>开发平台“元脑企智”EPAI

    浪潮信息与英特尔合作推出一种大模型效率工具“YuanChat”

    3月26日,浪潮信息与英特尔正式宣布,浪潮信息“源2.0系列基础大模型”已和最新的英特尔® 酷睿™ Ultra处理器平台完成适配,本地推理速度提升100%。
    的头像 发表于 03-27 13:50 206次阅读
    <b class='flag-5'>浪潮信息</b>与英特尔合作推出一种大<b class='flag-5'>模型</b>效率工具“YuanChat”

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型开发效率提升10倍

    北京2024年2月29日 /美通社/ -- 近日,潞晨科技Colossal-AI大模型开发工具与浪潮信息AIStation智能业务创新生产平台完成兼容性互认证。基于AIStation平台部署与调度
    的头像 发表于 03-01 09:43 239次阅读
    潞晨科技Colossal-AI + <b class='flag-5'>浪潮信息</b>AIStation,大<b class='flag-5'>模型</b>开发效率提升10倍

    XEDP与KeyarchOS完成浪潮信息澎湃技术认证

    北京2024年2月27日 /美通社/ -- 近日,北京星辰天合科技股份有限公司(简称"XSKY星辰天合")企业级分布式统一数据平台XEDP与浪潮信息云峦操作系统KeyarchOS V5完成浪潮信息
    的头像 发表于 02-27 17:56 264次阅读
    XEDP与KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技术认证

    浪潮信息澎湃认证:浪潮信息集中式存储携手仪电云i-stack云操作系统软件完成兼容性认证

    近日, 仪电云i-stack云操作系统软件与浪潮信息集中式存储AS/HF系列产品完成并通过浪潮信息澎湃技术相互兼容性测试认证, 测试结果显示,仪电云i-stack云操作系统软件与浪潮信息集中式存储
    的头像 发表于 12-08 16:40 336次阅读
    <b class='flag-5'>浪潮信息</b>澎湃认证:<b class='flag-5'>浪潮信息</b>集中式存储携手仪电云i-stack云操作系统软件完成兼容性认证

    大普微与keyarchOS完成浪潮信息澎湃技术认证

    北京2023年10月10日 /美通社/ -- 日前,大普微与keyarchOS完成浪潮信息澎湃技术认证,测试结果表明,大普旗下DapuStor蛟容5、嵘神5系列企业级NVMe SSD与浪潮信息
    的头像 发表于 10-11 01:47 307次阅读
    大普微与keyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技术认证

    浪潮信息澎湃认证:浪潮信息集中式存储携手达梦数据库管理系统V8完成兼容性认证

    近日, 达梦数据库管理系统V8与浪潮信息集中式存储AS/HF系列产品完成并通过浪潮信息澎湃技术相互兼容性测试认证 ,测试结果显示,达梦数据库管理系统V8与浪潮信息集中式存储AS/HF系列产品完全兼容
    的头像 发表于 09-27 17:10 378次阅读
    <b class='flag-5'>浪潮信息</b>澎湃认证:<b class='flag-5'>浪潮信息</b>集中式存储携手达梦数据库管理系统V8完成兼容性认证

    东芝 MG10系列企业级SATA HDD获得浪潮信息澎湃技术兼容性认证

      点击蓝字 关注我们 近日,TOSHIBA(东芝) MG10系列企业级SATA HDD (MG10ACA) 完成与浪潮信息NF5280M6服务器平台的兼容性适配认证,获得浪潮信息澎湃技术认证授权证
    的头像 发表于 09-22 19:35 454次阅读
    东芝 MG10系列企业级SATA HDD获得<b class='flag-5'>浪潮信息</b>澎湃技术兼容性认证

    浪潮信息NF5468服务器LLaMA训练性能

    浪潮信息宣布旗下NF5468系列AI服务器率先支持英伟达最新推出的L40S GPU,可为人工智能大模型训练和推理、元宇宙及图形视频处理等应用提供强大算力。实际测试表明,搭载8颗NVIDIA L40S
    的头像 发表于 09-22 11:16 1872次阅读

    浪潮信息发布模型智算软件栈OGAI,为大模型创新打造高效生产力

    浪潮信息正式发布模型智算软件栈 OGAI。OGAI (Open GenAI Infra)"元脑生智",是为大模型业务提供AI算力系统环境部署、算力调度保障及
    的头像 发表于 08-28 08:08 380次阅读

    浪潮信息联合英特尔发布新一代AI服务器NF5698G7

    浪潮信息联合英特尔发布面向生成式AI领域创新开发的新一代AI服务器NF5698G7。该AI服务器支持8颗OAM高速互联的Gaudi2加速器,具备高性能、高扩展、高能效和开放生态等优点,将为AI客户提供强大的大模型训练和推理能力。
    的头像 发表于 07-13 09:43 423次阅读

    商汤日日新大模型全面升级,SenseCore可支持20个千亿参数量大模型同时训练

    将多方位全面升级,并宣布在该体系下一系列的大模型产品更新和落地成果。   “日日新SenseNova ”全面升级及应用落地   商汤科技发布的“商量”
    的头像 发表于 07-13 00:13 2462次阅读
    商汤日日新大<b class='flag-5'>模型</b><b class='flag-5'>全面</b>升级,SenseCore可支持20个<b class='flag-5'>千亿</b><b class='flag-5'>参数</b>量大<b class='flag-5'>模型</b>同时训练

    网迅科技与浪潮信息KOS完成兼容性认证

    北京2023年6月6日 /美通社/ -- 日前,北京网迅科技有限公司多款产品与浪潮信息KOS完成并通过了澎湃技术认证,此次测试的产品包括网迅科技WX1860系列千兆网络控制器、SP1000A
    的头像 发表于 06-07 07:16 286次阅读
    网迅科技与<b class='flag-5'>浪潮信息</b>KOS完成兼容性认证