一套开源的大型语言模型（LLM）—— StableLM-电子发烧友网

Stability AI 是 Stable Diffusion 图像生成工具背后的公司，如今他们不再局限于开发图像 / 视频生成方面的 AI，于今天正式发布了一套开源的大型语言模型（LLM）—— StableLM，首次涉足目前由 OpenAI、Meta 和 Google 等科技公司主导的语言模型领域。

StableLM 跟 ChatGPT、Bard 这些一样，被设计用来生成文本和代码。它是通过使用开源数据集 the Pile 训练而来的，这个数据集包含的数据来源就有维基百科、Stack Exchange 和 PubMed。不过，Stability AI 在 the Pile 的基础上进行了扩展，所使用的数据集大小是标准 the Pile 的 3 倍。

Stability AI 现在已经将这个 StableLM 模型发布到了 GitHub 上，开发者可以使用或经过调整后再使用。StableLM 模型还处于 Alpha 阶段，它的参数也比较少，只有 30 亿和 70 亿个参数，之后他们还会推出有 150 亿到 650 亿参数的模型。

对于 AI 可能会产生的风险，Stability AI 也给出了提醒：

对于任何没有额外微调和强化学习的预训练大型语言模型来说，用户得到的回应质量可能参差不齐，并且可能包括冒犯性的语言和观点。这有望随着规模、更好的数据、社区反馈和优化而得到改善。

除了将代码托管在 GitHub 上，Stability AI 还在 Hugging Face 上发布了一个演示版本，经过测试 StableLM 会说中文，但只会一点点（回复内容对应不上，语句也不通顺）。

在 Stable Diffusion 发布后，Stability AI 遭到了很多艺术家的投诉和起诉，指控它通过使用网络抓取的受版权保护的图像开发 AI 图像生成工具，侵犯了艺术家们的权利。在之前的纠纷还没解决的情况下，如今推出 StableLM 不知道是否还会引发更多的诉讼。

Stability AI 在去年 10 月融资了 1 亿美元，公司估值也超过了 10 亿美元。但 AI 是一个投入非常高，可能短期也很难产生收益的领域，也不知道这 1 亿美金现在还剩多少，为了在这个领域持续发展，Stability AI 会不会继续融资，亦或是投入某个大型公司的怀抱呢？

项目地址：https://github.com/Stability-AI/StableLM

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

语言模型

语言模型

+关注

关注
0

文章
575

浏览量
11343
数据集

数据集

+关注

关注
4

文章
1240

浏览量
26261
GitHub

GitHub

+关注

关注
3

文章
489

浏览量
18763
LLM

LLM

+关注

关注
1

文章
350

浏览量
1394

原文标题：AI作画鼻祖Stability AI推出大型语言模型，会一点点中文

文章出处：【微信号：OSC开源社区，微信公众号：OSC开源社区】欢迎添加关注！文章转载请注明出处。

搜索历史

一套开源的大型语言模型（LLM）—— StableLM

评论