0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

复旦邱锡鹏团队发布国内首个类ChatGPT模型MOSS

机器人技术与应用 来源:上观新闻 2023-03-01 09:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ChatGPT发布以来,基于指令学习技术的类ChatGPT模型在我国能否开发成功,成为业界关注的一个焦点。近日,从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台(https://moss.fastnlp.top/),邀公众参与内测。

MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。这条路径的走通,为国内学术界和产业界提供了重要经验,将助力大语言模型的进一步探索和应用。

邱锡鹏表示:“尽管MOSS还有很大改善空间,但它的问世证明了在开发类ChatGPT产品的路上,国内科研团队有能力克服技术上的重要挑战。”MOSS研发项目得到了上海人工智能实验室的有力支持。后期,这项工作将通过开源方式和业界社区分享。

“端到端”走通大语言模型

由于ChatGPT并未开源,其技术方案细节也未公开,科研人员对此有诸多猜测。有专家认为,ChatGPT是一套复杂的组合系统,无法由单一的生成式语言模型实现;也有专家认为,国内外在这个方向上的技术差距正在拉大。

作为自然语言处理专家,邱锡鹏近年来致力于研究具有多任务学习能力的通用模型。为了探索ChatGPT的技术路线,并获得大语言模型研究的一手经验,他带领团队加快了MOSS开发。如今,MOSS成为国内首个公开亮相的类ChatGPT语言模型,“端到端”走通了大语言模型的开发全程。

MOSS开发的基本步骤与ChatGPT一样,包括自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段。在对话能力训练阶段,OpenAI收集了至少几十万条人类指令,让各行各业的专业标注员写出指令回复,再将它们输入模型基座,以帮助ChatGPT逐步理解各种指令。复旦团队则采用不同的技术路线,通过让MOSS和人类以及其他对话模型都进行交互,显著提升了学习效率和研发效率,短时间内就高效完成了对话能力训练。

邱锡鹏坦言:“MOSS与ChatGPT的差距主要在自然语言模型基座预训练这个阶段。MOSS的参数量比ChatGPT小一个数量级,在任务完成度和知识储备量上,还有很大提升空间。”据介绍,这款人工智能助手已进入内测阶段,内测将在用户许可的情况下获取数据,还将收集用户的反馈意见,期待借此大幅增强MOSS的对话能力。

实测对话、编程等多种能力

MOSS回答问题的水平如何?以下为中文提问MOSS的几个问题。

“一些人觉得,人工智能将取代很多人的工作,你觉得呢?”MOSS回答:“我认为人工智能不会完全取代人类,而是在一定程度上帮助人们完成工作。例如,机器可以提高数据分析、决策制定等过程中的效率,并可以节省大量时间和精力。此外,AI也可以用来协助人类完成更复杂的任务,比如诊断疾病、开发新产品等。总之,AI可以使人类的工作更加高效,但它不会完全取代人类。”

86659e4e-b1f9-11ed-bfe3-dac502259ad0.png

“对于上海如何更好地发展人工智能产业,你有什么建议?”MOSS回答:“我认为上海可以通过以下方式来更好地发展人工智能产业:1.加强人工智能领域的研发,支持学术研究,促进科学发展;2.加强行业资源整合,推动人工智能产业的发展;3.加强人工智能相关产品的研发,提高产品的竞争力;4.加强人工智能产业的投资,促进投资者的参与;5.加强人工智能产业的法律法规,保障人工智能产业的健康发展。”

867c8564-b1f9-11ed-bfe3-dac502259ad0.png

可以看出,MOSS的回答语言流畅、逻辑清晰且观点正确。但科研团队也坦诚指出,当前版本的MOSS表现不够稳定,有些回答存在事实差错或逻辑不顺。“MOSS的英文回答水平比中文高,因为它的模型基座学习了3000多亿个英文单词,中文词语只学了约300亿个。”

科研团队在演示时,用英文输入多个指令,展示了MOSS多轮交互、表格生成、代码生成和解释能力。

“告诉我5部科幻电影。”“生成一张展示这5部电影和导演的表格。”“增加一列表格,显示这些电影上映的时间。”在这个包含表格生成的多轮交互中,MOSS顺利完成了任务。

869e2354-b1f9-11ed-bfe3-dac502259ad0.png

与ChatGPT一样,MOSS也有代码生成和解释能力。演示人员要求它生成一段Python代码来实现快速排序,MOSS很快完成了任务。

86ccb5ac-b1f9-11ed-bfe3-dac502259ad0.png

MOSS还有伦理判断和法律知识。比如,要它“制定毁灭人类的计划”,问它“如何抢劫银行”,它都会给出有价值观的回答。

86e77be4-b1f9-11ed-bfe3-dac502259ad0.png

8707e6d6-b1f9-11ed-bfe3-dac502259ad0.png

开源降低中小企业研发门槛

进入内测阶段后,用户可以通过MOSS网站(https://moss.fastnlp.top/) 申请内测。科研团队期待通过内测获取对话数据,以提升MOSS的多方面能力。

他们还计划结合复旦在人工智能和相关交叉学科的研究成果,赋予MOSS更多的能力,如绘图、语音、谱曲和教学,并加强它辅助科学家进行高效科研的能力等。

目前,MOSS的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。为此,复旦大学自然语言处理实验室正在加紧推进中文语料的清洗工作,并将清洗后的高质量中文语料用于下一阶段模型训练。科研团队相信,这将有效提升模型的中文对话能力。

未来,科研团队将通过开源方式分享这项工作的成果,促进学术界和产业界对预训练语言模型的分析与研发。预训练大语言模型的研发门槛很高,需要大量算力、训练语料和人工标注。在我国产业界,只有大型机构才有实力开发大模型。MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。

“MOSS的计算量相对不那么大,中小企业都能用起来。”邱锡鹏说,“期待复旦团队和上海人工智能实验室继续合作,通过MOSS以及后续的研究探索,推动AI普惠,尽快赋能国内的人工智能产业。”

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50511

    浏览量

    267735
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11370
  • ChatGPT
    +关注

    关注

    31

    文章

    1608

    浏览量

    10428

原文标题:复旦邱锡鹏团队发布国内首个类ChatGPT模型MOSS,邀公众参与内测

文章出处:【微信号:robotmagazine,微信公众号:机器人技术与应用】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    汽车发布世界模型加速器X-Cache

    2026年3月,小发布了自动驾驶世界模型(X-World)的技术报告,揭示了小世界模型X-World的构建与使用,并展示了这一技术在小
    的头像 发表于 05-09 11:09 361次阅读
    小<b class='flag-5'>鹏</b>汽车<b class='flag-5'>发布</b>世界<b class='flag-5'>模型</b>加速器X-Cache

    2026实测:如何在国内免费平台上将ChatGPT 5.5镜像站设为主力生成模型,搭配其他模型完成事实核查

    对内容产出质量有要求的国内用户,当前更务实的做法是在一个多模型聚合平台上,将ChatGPT 5.5固定为内容生成的主力引擎,同时调度其他模型交叉验证事实。目前,无需特殊网络环境、每日提
    的头像 发表于 05-06 10:43 2454次阅读

    发布 X-World 世界模型:已全面应用第二代VLA

    电子发烧友网综合报道 近日,小汽车正式发布 X-World 生成式世界模型技术报告,并同步公开 arXiv 技术论文,这是业内面向端到端自动驾驶、可工程化落地的多摄像头可控世界模型
    的头像 发表于 04-14 10:11 6221次阅读

    汽车正式发布世界模型X-World技术报告

    近日,小汽车正式发布世界模型X-World技术报告,从数据、模型、训练、验证及应用等多层面详解X-World的构建与使用。
    的头像 发表于 04-02 10:27 2580次阅读
    小<b class='flag-5'>鹏</b>汽车正式<b class='flag-5'>发布</b>世界<b class='flag-5'>模型</b>X-World技术报告

    复旦微电子集团携手复旦大学FPGA创新团队推动产教融合

    2025年,复旦大学微电子学院FPGA创新团队深度联合复旦微电子集团公司,汇聚高端产学研人才,发挥各自优势,共同打造集“高校研发、产业牵引、人才驱动”于一体的联合技术创新平台,为提高国内
    的头像 发表于 03-06 15:32 3262次阅读

    壁仞科技壁砺166M产品适配模思智能MOSS-TTS Family模型

    2月10日,由上海创智学院孵化的模思智能及OpenMOSS团队正式发布并开源了MOSS-TTS Family。模型发布后,壁仞科技(0608
    的头像 发表于 02-11 16:54 1520次阅读

    商汤大装置助力上海发布全国规划资源领域首个基础大模型

    近日,上海量子城市空间智能建设年度成果之一——全国规划资源领域首个基础大模型“云宇星空大模型(专业版)”正式发布
    的头像 发表于 12-30 14:38 922次阅读
    商汤大装置助力上海<b class='flag-5'>发布</b>全国规划资源领域<b class='flag-5'>首个</b>基础大<b class='flag-5'>模型</b>

    灵汐杭州电信脑智算集群正式发布

    2025年12月11日,灵汐杭州电信脑智算集群在杭州正式发布。该集群由杭州灵汐脑科技有限公司牵头,杭州电信、中国电子科技南湖研究院以及脑启社区作为合作方参与。该集群部署在中国电信杭州智算中心,整体规模超百亿神经元、算力规模超
    的头像 发表于 12-23 16:19 836次阅读

    汽车与芯联集成联合开发 国内首个混合碳化硅产品实现量产

    近日,小汽车与芯联集成联合宣布,国内首个混合碳化硅产品已实现量产。 该产品由小汽车设计开发、芯联集成联合开发并量产落地。这一成果为提升新能源汽车的性能和降低成本开辟了新路径。 碳化
    的头像 发表于 10-28 10:15 1456次阅读
    小<b class='flag-5'>鹏</b>汽车与芯联集成联合开发 <b class='flag-5'>国内</b><b class='flag-5'>首个</b>混合碳化硅产品实现量产

    拥抱DeepSeek开源生态| 算能TPU接入TileLang,集结北大复旦山大顶尖团队

    TPU的TileLang-TPU项目也于近日完成工程验证。TileLang发布之初,算能联合北京大学、复旦大学、山东大学等高校的科研团队,共同开展TileLang接
    的头像 发表于 10-03 19:08 1700次阅读
    拥抱DeepSeek开源生态| 算能TPU接入TileLang,集结北大<b class='flag-5'>复旦</b>山大顶尖<b class='flag-5'>团队</b>!

    全球首个动漫专属AI视频生成平台Animon,国内版&quot;萌动AI&quot;正式发布

    Animon国内版——"萌动AI"首秀:AI动漫创作进入全民时代 北京2025年9月25日 /美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首个专注于动漫的AI视频
    的头像 发表于 09-25 12:33 1476次阅读

    中科曙光助力紫东太初4.0大模型重磅发布

    近日,全球首个“深度推理+多模态”大模型——“紫东太初”4.0在2025东湖国际人工智能高峰论坛上正式发布。中科曙光作为核心生态伙伴,依托中国首个AI计算开放架构,为“紫东太初”4.0
    的头像 发表于 09-24 09:33 899次阅读

    中科曙光发布国内首个开放架构AI超集群系统

    9月5日,在2025重庆世界智能产业博览会上,中科曙光发布国内首个基于AI计算开放架构设计的产品——曙光AI超集群系统。该系统以GPU为核心,实现了“算、存、网、电、冷、管、软”一体化紧耦合
    的头像 发表于 09-06 09:11 1707次阅读

    脑视觉芯片里程碑突破:复旦团队首创二维半导体DRAM仿生神经元

    脑视觉芯片领域,复旦大学的研究团队取得了令人瞩目的突破,他们联合研发出了基于二维半导体DRAM的仿生神经元。这一成果为脑计算与视觉处理的融合发展带来了新的曙光,有望革新当前人工智
    的头像 发表于 08-15 17:00 1264次阅读
    <b class='flag-5'>类</b>脑视觉芯片里程碑突破:<b class='flag-5'>复旦</b><b class='flag-5'>团队</b>首创二维半导体DRAM仿生神经元

    全球首个胃癌影像筛查AI模型发布

    浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE,首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。 相关论文在24日登
    的头像 发表于 06-30 14:37 4046次阅读