0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息发布源2.0基础大模型,千亿参数全面开源

全球TMT 来源:全球TMT 作者:全球TMT 2023-11-28 09:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

11月27日,浪潮信息发布"源2.0"基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。

当前,大模型技术正在推动生成式人工智能产业迅猛发展,而基础大模型的关键能力则是大模型在行业和应用落地能力表现的核心支撑,但基础大模型的发展也面临着在算法、数据和算力等方面的诸多挑战。源2.0基础大模型则针对性地提出了新的改进方法并获得了能力的提升。

算法方面,源2.0提出并采用了一种新型的注意力算法结构:局部注意力过滤增强机制(LFA:Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确、更人性,提升了模型的自然语言表达能力,进而提升了模型精度。

wKgZomVkrZuAFWGyAACX2OTQDsk961.jpg


数据方面,源2.0通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比,结合高效的数据清洗流程,为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据,我们清洗了从2018年至今约12PB的互联网数据,但仅获取到了约10GB的数学数据,投入巨大,收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源2.0采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量,获取了一批高质量的数学与代码预训练数据。

wKgaomVkrZuAeYSmAADRtny3Qdk117.jpg


算力方面,源2.0采用了非均匀流水并行的方法,综合运用流水线并行+优化器参数并行+数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题,该方法显著降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。

wKgaomVlP6mALQxWAAM0Ok9OLqE815.jpg


源2.0作为千亿级基础大模型,在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,源2.0在多项模型评测中,展示出了较为先进的能力表现。

wKgZomVkrZ6Af_R2AABvvDO94lM918.jpg


源2.0采用全面开源策略,全系列模型参数和代码均可免费下载使用。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 半导体
    +关注

    关注

    336

    文章

    29999

    浏览量

    258448
  • 浪潮
    +关注

    关注

    1

    文章

    476

    浏览量

    25307
  • 大模型
    +关注

    关注

    2

    文章

    3446

    浏览量

    4972
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    浪潮信息发布"元脑SD200"超节点,面向万亿参数模型创新设计

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息发布面向万亿参数模型的超节点AI服务器"元脑SD200"。该产品基于浪潮信息
    的头像 发表于 08-08 22:17 531次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>&quot;元脑SD200&quot;超节点,面向万亿<b class='flag-5'>参数</b>大<b class='flag-5'>模型</b>创新设计

    飞利信与浪潮信息达成战略合作

    近日,2025年浪潮信息北京ISP战略伙伴签约授牌仪式成功举办。浪潮信息与北京飞利信电子技术有限公司等22家战略合作伙伴达成签约,其中将面向北京人工智能应用大市场,在产品技术共创、行业场景深化及区域
    的头像 发表于 06-24 17:37 908次阅读

    天瞳威视与浪潮信息达成战略合作,推进高阶智驾车载计算系统创新

    北京2025年3月22日 /美通社/ -- 近日,苏州天瞳威视电子科技有限公司与浪潮信息旗下苏州元脑智能科技有限公司达成战略合作协议。此次合作依托浪潮信息提供的车载算力平台硬件系统、底层软件环境
    的头像 发表于 03-27 16:55 549次阅读
    天瞳威视与<b class='flag-5'>浪潮信息</b>达成战略合作,推进高阶智驾车载计算系统创新

    浪潮信息:元脑EPAI已接入DeepSeek,大幅提升DeepSeek企业应用准确率

    北京2025年2月21日 /美通社/ -- 浪潮信息宣布元脑企智EPAI企业大模型开发平台已全面接入支持DeepSeek大模型。通过元脑企智EPAI,企业用户能够将业务数据与DeepS
    的头像 发表于 02-23 07:32 886次阅读
    <b class='flag-5'>浪潮信息</b>:元脑EPAI已接入DeepSeek,大幅提升DeepSeek企业应用准确率

    浪潮信息发布元脑R1推理服务器

    近日,浪潮信息正式推出了其创新的元脑R1推理服务器。这款服务器通过系统的创新与软硬件的协同优化,实现了对DeepSeek R1 671B模型的单机部署与运行,为客户在智能应用部署方面带来了显著的突破
    的头像 发表于 02-17 10:32 1041次阅读

    浪潮信息存储SATA SSD:技术创新引领数据存储新时代

    在智慧时代,数据存储需求日益增长,对存储产品的性能和稳定性提出了更高要求。浪潮信息存储,作为行业内的佼佼者,积极响应市场需求,通过自主研发,不断积累技术优势,致力于为用户提供高性能、高稳定性的存储
    的头像 发表于 02-07 13:41 1014次阅读

    浪潮信息存储SATA SSD:以技术创新,开启数据存储新篇章

    计算平台以及个人用户的数字化需求,迫切需要高效、可靠的存储解决方案。 浪潮信息存储积极响应市场需求,通过自主研发不断积累技术优势,推出了SATA、NVMe、双端口、ZNS等全系列存储产品。近期,浪潮信息自研SATA SSD新品—TS6000G1,以出色的性能和
    的头像 发表于 01-24 10:02 711次阅读

    浪潮信息升级数据中心服务器故障智能诊断AIOps技术

    近日,浪潮信息对其数据中心服务器故障智能诊断AIOps技术进行了全面升级。该技术旨在解决数据中心服务器日常巡检中故障人工识别效率低、难以精准定位的问题。 基于数百万台服务器的运维管理经验,浪潮信息
    的头像 发表于 12-31 13:38 964次阅读

    浪潮信息与智研究院携手共建大模型多元算力生态

    近日,浪潮信息与北京智人工智能研究院正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升大模型创新
    的头像 发表于 12-31 11:49 876次阅读

    浪潮信息与智研究院达成战略合作协议

    近日,浪潮信息与智研究院达成战略合作协议,双方将紧密协作共建大模型多元算力开源创新生态,提升大模型创新研发的算力效率,降低大
    的头像 发表于 12-26 10:25 900次阅读

    浪潮信息发布&quot;&quot;Yuan-EB,刷新RAG检索最高成绩

    近日,浪潮信息在AI领域取得了重大突破,成功发布了其嵌入模型""Yuan-EB(Yuan-embedding-1.0)。在备受瞩目的C-MTEB榜单中,"
    的头像 发表于 12-25 15:54 813次阅读

    浪潮信息与17家元脑伙伴共签亿级分销协议

    近日,一场意义非凡的签约仪式——2025年浪潮信息亿级分销伙伴签约大会圆满落幕。在这场盛会中,浪潮信息与来自全国12个省区的17家元脑生态伙伴共同签署了亿级分销合作协议,携手开启合作共赢的新篇章
    的头像 发表于 12-25 15:46 1194次阅读

    捷通达携手浪潮信息,ERP系统性能大幅提升

    在汽车市场服务领域,捷通达汽车集团股份有限公司一直保持着佼佼者的地位。为了进一步提升业务效率和客户满意度,捷通达与浪潮信息展开了深度合作,共同推动了原有SAP HANA系统的全面升级。 经过双方
    的头像 发表于 12-24 14:36 904次阅读

    借助浪潮信息元脑企智EPAI高效创建大模型RAG

    生成能力,提高生成质量和可靠性。但企业构建知识检索系统并非易事,通常面临开发门槛高、生成内容差等难题。而借助浪潮信息元脑企智EPAI企业大模型开发平台,企业仅需三步即可高效创建大模型RAG,让企业内部积累的大量数据得到有效利用,
    的头像 发表于 12-19 14:32 1047次阅读
    借助<b class='flag-5'>浪潮信息</b>元脑企智EPAI高效创建大<b class='flag-5'>模型</b>RAG

    阶跃星辰发布国内首个千亿参数端到端语音大模型

    近日,阶跃星辰在官方公众号上宣布了一项重大突破——推出Step-1o千亿参数端到端语音大模型。该模型被誉为“国内首个千亿
    的头像 发表于 12-17 13:43 1062次阅读