0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程预训练语言模型MusaBert荣登CLUE榜单TOP10

摩尔线程 来源:摩尔线程 作者:摩尔线程 2022-12-19 10:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摩尔线程联合潞晨科技研发的预训练语言模型MusaBert(MUSA为摩尔线程提出的通用元计算架构),在12月16日的中文语言理解领域权威CLUE榜单上进入TOP 10,最终以82.889得分在CLUE1.1总排行榜中排名(除人类成绩以外)第9,并在AFQMC任务中以86.92分取得排名第一的成绩,这意味着摩尔线程AI在语义理解与匹配能力上超越了人类水平。同时,这也是潞晨科技的AI大模型开发系统Colossal-AI在自然语言处理领域应用的重要进展。

eafabd56-7f42-11ed-8abf-dac502259ad0.png

(2022年12月16日CLUE1.1总排行榜最新成绩)

相较于CLUE总排行榜TOP 10的其他中文预训练模型,MusaBert仅包含3亿参数量,是前十名中规模最小的模型,并且为单模型(single model),没有进行任何集成。此外,摩尔线程基于MusaBert的语义嵌入模型MusaSim在AFQMC任务上击败一众大规模模型,取得第一名,不仅为检索系统、分类对话等更深度语义理解研究打下坚固基石,也证明了摩尔线程在中文自然语言处理领域和低资源大模型训练方面的强大能力。

一直以来,语义理解都是NLP(自然语言处理)技术的重要目标,通过一系列AI算法,可将文本解析为结构化的、机器可读的意图与词槽信息。通常来说,训练数据的获取与处理、模型的迭代和训练等都是NLP技术的落地难点。MusaBert仅使用了极少的参数量便取得了比肩甚至超越百亿参数大模型的成绩,主要是得益于多方面获得的突破性进展:

▼技术层面:摩尔线程拥有“软硬一体”的技术能力,使得MusaBert能够从底到上进行优化;摩尔线程多功能GPU内置AI加速和并行计算等硬件模块,能够提供AI和科学计算在内的全栈功能,能够为AI推理计算加速、低资源大模型训练等应用场景提供通用、高性价比、节能环保的AI能力。

▼算法层面:MusaBert使用了潞晨科技的AI大模型开发系统Colossal-AI,在上游训练方面,充分发挥了该系统的易用性及强大的并行训练性能,同时MusaBert针对模型数据预处理使用的DataLoader进行了优化,可以在低资源的条件下快速处理大规模数据;在下游任务方面,摩尔线程通过采用合适的优化建模、在领域内进行数据增强以及在模型的训练优化中采用了先进的Adan优化器等方式,尽可能发掘和展现出预训练语言模型强大的语义理解能力。摩尔线程自研的语义嵌入模型MusaSim以MusaBert为基座模型,使用对比学习方法进行精调,并利用了摩尔线程收集的百万对有监督数据。得益于MusaBert和高质量的数据集,MusaSim不仅在语义相似度任务上超越了众多更大规模的模型,在意图识别、情绪分析等分类任务上,也能得到较好的效果。

▼数据层面:MusaBert除使用了摩尔线程自身收集的高质量语义相似数据以外,还使用了200GB悟道开源数据和80GB的CLUE社区数据,以及浪潮电子信息产业股份有限公司提供的1T高质量数据集。大规模高质量的数据使得模型在相对小的规模下仍然保持了较高的性能。

目前,MusaBert作为基座模型,已经应用于摩尔线程研发的智能客服与数字人等项目,并相继在下游语义相似度、情绪识别、阅读理解、声韵识别等领域落地。

为了更进一步降低大模型开发和应用的门槛,MusaBert代码现已开源到Colossal-AI仓库(https://github.com/hpcaitech/ColossalAI/tree/main/examples/language/roberta),使用该脚本,可在短时间内训练出高质量的中文Bert模型。包括MusaBert和MusaSim在内的一系列高质量模型也将在近期开源以贡献中文NLP社区。此外,经摩尔线程与潞晨科技的严格测试,仅通过摩尔线程多功能GPU单卡,即可进行MusaBert甚至是更大规模的GPT2的训练,大大降低了预训练成本,这也为双方实现低资源大模型训练的共同愿景,迈出了坚实一步。

作为中文语言理解领域最具权威性的测评基准之一,CLUE 涵盖文本相似度、分类、自然语言推理、阅读理解等众多语义分析和理解类子任务,工业界和学术界纷纷用 CLUE 作为预训练算法能力的验证和衡量标准。此次进入CLUE榜单TOP 10,代表了摩尔线程与潞晨科技联合研发团队在中文预训练研究领域已达到业内领先水平。

展望未来,摩尔线程还将与潞晨科技紧密合作,着手更适当规模的自然语言大模型研究,充分利用上游数据,产出能力更强的模型并且开源。同时,保持算法和系统两个层面并行,持续优化大模型在摩尔线程多功能GPU上的训练能力,尤其在单张消费级显卡等低资源场景下的训练能力,可以大大降低使用大模型训练的门槛和成本,进一步促进AI民主化。

▼ 关于潞晨科技

潞晨科技是一家致力于“解放AI生产力”的全球性公司,核心产品面向大模型时代的通用深度学习系统 Colossal-AI,可实现高效快速部署AI大模型训练和推理,降低AI大模型应用成本。自开源以来,Colossal-AI已经多次在GitHub热榜位列世界第一,获得GitHub Star约七千颗,并成功入选SC、AAAI、PPoPP等国际AI与HPC顶级会议的官方教程。相关解决方案已成功在自动驾驶云计算、零售、医药、芯片等行业知名厂商落地应用、广受好评。

▼ 关于摩尔线程

摩尔线程是一家以 GPU 芯片设计为主的集成电路高科技公司,专注于研发设计全功能 GPU 芯片及相关产品,能够为中国科技生态合作伙伴提供强大的计算加速能力。公司成立于 2020年10月,致力于创新面向元计算应用的新一代 GPU,构建融合视觉计算、3D 图形计算、科学计算及人工智能计算的综合计算平台,建立基于云原生 GPU计算的生态系统,助力驱动数字经济发展。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI算法
    +关注

    关注

    0

    文章

    270

    浏览量

    13056
  • 自然语言处理

    关注

    1

    文章

    629

    浏览量

    14563
  • 摩尔线程
    +关注

    关注

    2

    文章

    256

    浏览量

    6215

原文标题:Colossal-AI助力,摩尔线程预训练语言模型MusaBert荣登CLUE榜单TOP10

文章出处:【微信号:moorethreads,微信公众号:摩尔线程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程新一代大语言模型对齐框架URPO入选AAAI 2026

    近日,摩尔线程在人工智能前沿领域取得重要突破,其提出的新一代大语言模型对齐框架——URPO统一奖励与策略优化,相关研究论文已被人工智能领域的国际顶级学术会议AAAI 2026收录。这一
    的头像 发表于 11-17 16:03 229次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>新一代大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>对齐框架URPO入选AAAI 2026

    易华录入选全国数智企业TOP10榜单

    近日,2025全球数字贸易博览会——西湖论剑·数字安全大会在杭州召开。活动现场,北京交通大学教授张向宏发布《全国数智产业发展研究报告(2024-2025)》,并推出全国首个数智产业动态化智能图谱及《全国数智企业TOP10榜单》,旨在为数智产业的高质量发展提供参考与指引。
    的头像 发表于 10-13 15:13 547次阅读

    摩尔线程发布大模型训练仿真工具SimuMax v1.0

    近日,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax 1.0版本。该版本在显存和性能仿真精度上实现突破性提升,同时引入多项关键功能,进一步增强了
    的头像 发表于 09-11 18:19 3339次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>发布大<b class='flag-5'>模型</b><b class='flag-5'>训练</b>仿真工具SimuMax v1.0

    润和软件“润知“知识处理大模型荣登“2025中国大模型TOP30”榜单

    ”知识处理大模型成功入选。这一荣誉不仅体现了润和软件在多模态大模型技术上的领先地位,也标志着其在推动企业智能化转型方面迈出了坚实一步。  润和软件“润知”知识处理大模型荣登“2025中
    的头像 发表于 08-22 10:13 3802次阅读

    摩尔线程“AI工厂”:五大核心技术支撑,打造大模型训练超级工厂

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打
    的头像 发表于 07-28 11:28 3983次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>“AI工厂”:五大核心技术支撑,打造大<b class='flag-5'>模型</b><b class='flag-5'>训练</b>超级工厂

    天合储能荣获自产电池系统TOP10榜单

    近日,在2025高工储能产业TOP50企业的颁奖典礼上,天合储能凭借深厚的全栈自研能力、卓越的系统集成优势和强大的全球化交付实力,荣膺 “自产电池·系统” TOP10榜单。这一奖项不仅是对天合储能技术实力与市场地位的认可,更是对
    的头像 发表于 07-11 17:44 993次阅读

    中国固态电池综合竞争力企业TOP10榜单发布,宁德时代、太蓝新能源领跑

    近日,中国最强固态电池TOP10榜单《中国固态电池综合竞争力企业TOP10》正式发布。该榜单由OFweek产业研究中心以技术、产能、市场及生态四维评价体系,深度剖析电池厂商在固态电池赛
    的头像 发表于 04-19 13:44 6128次阅读

    兆芯荣登2025中国IC设计处理器公司TOP10榜单

    的自主CPU产品体系、以及显著的行业信创成果等多项优势,兆芯成功入围中国IC设计处理器公司TOP10榜单,再度收获业界高度赞许。     2025中国IC设计Fabless100榜单覆盖MCU、AI芯片
    的头像 发表于 04-07 11:59 1211次阅读
    兆芯<b class='flag-5'>荣登</b>2025中国IC设计处理器公司<b class='flag-5'>TOP10</b><b class='flag-5'>榜单</b>

    锐成芯微荣登2025中国IC设计Fabless100排行榜之TOP10 IP公司

    近日,国际电子技术领域头部媒体AspenCore发布了《2025中国IC设计Fabless100排行榜》,锐成芯微凭借自主创新实力、技术生态布局及行业贡献,再度荣登TOP10 IP公司”榜单
    的头像 发表于 03-31 17:49 1269次阅读

    敏芯股份荣登2025中国IC设计Fabless100排行榜之TOP10传感器公司

    近日,AspenCore发布了“2025中国IC设计Fabless100”排行榜,向社会展示了一批优秀企业以及各类TOP10榜单,这也是AspenCore第六年发布产业榜单。敏芯股份入选“TO
    的头像 发表于 03-31 14:45 1397次阅读

    用PaddleNLP为GPT-2模型制作FineWeb二进制训练数据集

    作者:算力魔方创始人/英特尔创新大使刘力 《用PaddleNLP在4060单卡上实践大模型训练技术》发布后收到读者热烈反响,很多读者要求进一步讲解更多的技术细节。本文主要针对大语言
    的头像 发表于 03-21 18:24 3828次阅读
    用PaddleNLP为GPT-2<b class='flag-5'>模型</b>制作FineWeb二进制<b class='flag-5'>预</b><b class='flag-5'>训练</b>数据集

    摩尔线程GPU原生FP8计算助力AI训练

    并行训练和推理,显著提升了训练效率与稳定性。摩尔线程是国内率先原生支持FP8计算精度的国产GPU企业,此次开源不仅为AI训练和推理提供了全新
    的头像 发表于 03-17 17:05 1214次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>GPU原生FP8计算助力AI<b class='flag-5'>训练</b>

    天合储能荣登2024全球及中国储能系统出货量TOP10榜单

    近日,储能领域知名研究机构GGII正式发布“2024中国储能系统企业出货量分析及排名”榜单。天合储能凭借卓越的系统集成能力与全球化交付能力,强势入围“全球储能系统出货量Top10”及“中国储能系统
    的头像 发表于 03-05 15:28 1067次阅读

    摩尔线程宣布成功部署DeepSeek蒸馏模型推理服务

    。 据悉,DeepSeek开源模型在多语言理解与复杂推理任务中一直表现出卓越的性能,其V3、R1等系列模型更是备受业界关注。而此次摩尔线程
    的头像 发表于 02-06 13:49 1184次阅读

    四维图新入选2024中国AIEV产业智驾创新企业TOP10榜单

    近日,由亿欧汽车主办的GTM2024第七届科技出行大会暨《科技出行产业创新榜单》发布会在上海举行。凭借对智驾领域的前瞻理解和全面布局与运用,四维图新成功入选“2024中国AIEV产业智驾创新企业TOP10榜单
    的头像 发表于 12-24 09:26 1197次阅读