0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

160亿参数,新增多项能力,复旦MOSS开源了

3D视觉工坊 来源:机器之心 2023-04-27 15:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今年 2 月份,机器之心报道了复旦大学推出中国版 ChatGPT 的消息,引起了广泛关注。当时,邱锡鹏教授就曾表示将于四月份开源 Moss。

昨天,开源版的 Moss 真的来了。

项目地址:https://github.com/OpenLMLab/MOSS

MOSS 是一个支持中英双语和多种插件的开源对话语言模型,但参数数量比 ChatGPT 少得多。在 v0.0.2 之后,团队持续对其进行调整,推出了 MOSS v0.0.3,也就是目前开源的版本。相比于早期版本,功能也实现了多项更新。

最初的测试中,MOSS 的基础功能与 ChatGPT 类似,可以按照用户输入的指令完成各类自然语言处理任务,包括文本生成、文本摘要、翻译、代码生成、闲聊等等。

开放内测后,团队继续加大中文语料的预训练:「截止目前,MOSS 003 的基座语言模型已经在 100B 中文 token 上进行了训练,总训练 token 数量达到 700B,其中还包含约 300B 代码。」

在开放内测后,我们也收集了一些用户数据,我们发现真实中文世界的用户意图和 OpenAI InstructGPT 论文中披露的 user prompt 分布有较大差异(这不仅与用户来自的国家差异有关,也跟产品上线时间有关,早期产品采集的数据中存在大量对抗性和测试性输入),于是我们以这部分真实数据作为 seed 重新生成了约 110 万常规对话数据,涵盖更细粒度的 helpfulness 数据和更广泛的 harmlessness 数据。

内容来源:https://www.zhihu.com/question/596908242/answer/2994534005

目前,团队已将 moss-moon-003-base、moss-moon-003-sft、moss-moon-003-sft-plugin 三个模型上传到 HuggingFace。后续,还有三个模型将会开源。

0ea0e28e-e4ca-11ed-ab56-dac502259ad0.png

根据项目主页介绍,moss-moon 系列模型具有 160 亿参数,在 FP16 精度下可在单张 A100/A800 或两张 3090 显卡运行,在 INT4/8 精度下可在单张 3090 显卡运行。

团队同时表示,由于模型参数量较小和自回归生成范式,MOSS 仍然可能生成包含事实性错误的误导性回复或包含偏见 / 歧视的有害内容,请谨慎鉴别和使用 MOSS 生成的内容,请勿将 MOSS 生成的有害内容传播至互联网。

新增能力

在 MOSS v0.0.3 中,团队加入了多项新能力。

团队构造了约 30 万插件增强的对话数据,包含搜索引擎、文生图、计算器、方程求解等。关于插件版 MOSS 如何使用,后续团队将在 GitHub 公布。

0eacf600-e4ca-11ed-ab56-dac502259ad0.png

MOSS v0.0.3 现已引入使用多种插件的能力。

下图展示了调用搜索引擎的能力:

0eb1dee0-e4ca-11ed-ab56-dac502259ad0.png

下图展示了调用方程求解器的能力:

0eba72d0-e4ca-11ed-ab56-dac502259ad0.png

下图展示了从文本生成图片的能力:

0ec1c2ce-e4ca-11ed-ab56-dac502259ad0.png

项目作者孙天祥补充说,MOSS 003 支持启用插件的能力是通过 meta instruction 来控制,类似 gpt-3.5-turbo 里的 system prompt。「因为是模型控制的,所以并不能保证 100% 控制率,以及还存在一些多选插件时调用不准、插件互相打架的缺陷,我们正在尽快开发新的模型来缓解这些问题。」

下载安装

下载本仓库内容至本地 / 远程服务器:

git clone https://github.com/OpenLMLab/MOSS.gitcd MOSS

创建 conda 环境:

conda create --name moss python=3.8 conda activate moss

安装依赖:

pip install -r requirements.txt

其中 torch 和 transformers 版本不建议低于推荐版本。

根据协议,开源的 MOSS 可用于商业用途:

0ed45e98-e4ca-11ed-ab56-dac502259ad0.png

此外,开发者也可通过 API 调用 MOSS 服务,团队将根据当前服务压力考虑通过 API 接口形式提供服务,接口格式可参考:https://github.com/OpenLMLab/MOSS/blob/main/moss_api.pdf

目前,已有开发者根据开源内容进行而创,比如通过 VideoChat 进行视频问答

VideoChat 是一款多功能视频问答工具,结合了动作识别、视觉字幕和 StableLM 的功能。该工具可为视频中的任何对象和动作生成密集的描述性字幕,提供一系列语言风格以满足不同的用户偏好。它支持用户进行不同长度、情绪、语言真实性的对话。

0edbf838-e4ca-11ed-ab56-dac502259ad0.png

项目地址:https://github.com/OpenGVLab/Ask-Anything/tree/main/video_chat_with_MOSS

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4031

    浏览量

    45559
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11253
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10070

原文标题:160亿参数,新增多项能力,复旦MOSS开源了

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深开鸿荣获多项开源鸿蒙“年度价值商用案例”!

    各行各业的智能化升级与生态协同发展提供可复制、可推广的宝贵实践经验。智慧交通:开源鸿蒙助力高速公路机电系统迈向“万物智联”在智慧交通领域,深开鸿与河北高速集团有限公
    的头像 发表于 12-04 18:08 35次阅读
    深开鸿荣获<b class='flag-5'>多项</b><b class='flag-5'>开源</b>鸿蒙“年度价值商用案例”!

    Matter 1.5 正式发布

    景,包括对摄像头、闭合设备、土壤传感器的支持,同时还新增多项能源管理功能。此次更新延续 Matter 的核心使命,即简化智能家居开发流程、增强设备互操作性,为消费者与开发者打造更丰富、更可持续的互操作体验。 今年早些时候联盟发布的聚焦质量优化的 Matter 1.
    的头像 发表于 12-01 14:45 223次阅读
    Matter 1.5 正式发布

    连接标准联盟正式推出Matter 1.5版本

    、土壤传感器的支持,同时还新增多项能源管理功能。此次更新延续 Matter 的核心使命,即简化智能家居开发流程、增强设备互操作性,为消费者与开发者打造更丰富、更可持续的互操作体验。
    的头像 发表于 11-30 10:34 550次阅读

    开放原子开源基金会联合主办上海高校开源教育研讨会

    近日,一场聚焦开源教育和人才培养主题的研讨会在复旦大学成功召开。本次会议既是复旦大学计算机学院建院50周年系列活动、开放原子校源行(上海站)的重要组成,也是计算机“101计划”上海工作组的重要工作会议。
    的头像 发表于 10-24 14:10 388次阅读

    复旦大学探索开源人才发展新模式

    复旦大学作为一所与国家命运紧密相连的百年学府,始终将服务国家战略需求、培养拔尖创新人才作为核心使命。在科研领域,以敢为人先、开放协作的姿态,探索着高校与产业、社区联动的创新路径。近年来,复旦大学围绕开源生态与
    的头像 发表于 10-17 11:05 470次阅读

    开鸿Bot系列大版本更新:体验稳定升级,乐享高效协同!

    V5.0.1.22版本开鸿Bot系列今日,开鸿Bot系列迎来第二次大版本更新——V5.0.1.22。此次版本更新致力于进一步提升系统稳定性与用户体验,新增多项实用功能,并在磁盘管理、OTA升级、设备
    的头像 发表于 09-26 17:06 1123次阅读
    开鸿Bot系列大版本更新:体验稳定升级,乐享高效协同!

    NVIDIA RAPIDS 25.06版本新增多项功能

    RAPIDS 是一套面向 Python 数据科学的 NVIDIA CUDA-X 库,最新发布的 25.06 版本引入了多项亮眼新功能,其中包括 Polars GPU 流执行引擎——这是一种面向图
    的头像 发表于 09-09 09:54 724次阅读

    【小智AI语音开发板】做个自己的Moss机器人?

    以下作品由安信可社区用户 WT_0213 制作 通过小安Moss+AiPi-PalChatV1+AiPi-BW21+机器视觉项目,让家居更加智能,可玩性更高!更有乐趣!   先上视频看看效果
    的头像 发表于 08-27 15:46 2363次阅读
    【小智AI语音开发板】做个自己的<b class='flag-5'>Moss</b>机器人?

    2025年7月开放原子开源基金会新增捐赠人

    2025年7月,新增以下单位成为开放原子开源基金会及旗下项目捐赠人。
    的头像 发表于 08-12 10:32 1346次阅读

    亚马逊云科技在2025纽约峰会发布多项AI agent创新

    七大核心服务,帮助企业大规模、安全部署与运行AI agents 亚马逊云科技Marketplace新增多项产品,助力企业发现、采购并部署领先的AI agents和工具 向亚马逊云科技生成式AI创新中心
    的头像 发表于 07-17 16:06 684次阅读
    亚马逊云科技在2025纽约峰会发布<b class='flag-5'>多项</b>AI agent创新

    匠芯创发布新版GUI开发工具 新增多国语言设置等功能

    。此次版本更新,为用户带来了诸多实用的新功能,进一步提升了设计体验和开发效率。 在V1.3.0版本中,AiUIBuilder新增 多国语言切换功能,支持设计界面显示刻度尺,拖动控件与相邻控件对齐停靠
    发表于 07-16 13:54

    EL3041 DIP-6 EVERLIGHT/亿光双向可控硅-EL3041光耦详细参数

    EL3041 DIP-6 EVERLIGHT/亿光双向可控硅-EL3041光耦详细参数
    发表于 04-24 11:14

    开放原子开源基金会新增捐赠人一览

    2024年12月,新增以下单位成为开放原子开源基金会及旗下项目捐赠人。
    的头像 发表于 01-15 10:38 1269次阅读

    衢州季丰新增参数特色检测能力氨气测试

    随着光伏产业的快速发展,对检测服务的需求也在不断增加,衢州季丰作为一家专业从事光伏产品检测的第三方实验室,也在不断拓展自己特色检测能力的范畴。
    的头像 发表于 12-31 11:10 717次阅读

    SOLIDWORKS 2025设计新增功能

    SOLIDWORKS 2025的发布为设计领域注入了新的活力,其新增功能不仅提升了设计效率,还增强了协作和数据管理的能力
    的头像 发表于 12-20 17:13 1055次阅读