0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Stability AI推出迄今为止更小、更高效的1.6B语言模型

OSC开源社区 来源:OSC开源社区 2024-01-23 10:11 次阅读

Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B。以英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据为基础进行了训练,体积小、速度快,降低了硬件门槛;并提供了完全透明的训练细节,旨在让开发人员和模型创建者能够快速进行实验和迭代。

Stable LM 是一种文本内容生成 LLM,Stability AI 于 2023 年 4 月首次推出了 30 亿和 70 亿参数模型。新的 StableLM 模型实际上是 Stability AI 在 2024 年发布的第二个模型,此前该公司在早些时候还发布了一个 Stable Code 3B。

Stability AI 声称,Stable LM 2 1.6B 在大多数基准测试中均优于其他参数低于 20 亿个的小语言模型,如微软的 Phi-1.5 (1.3B) 和 Phi-2 (2.7B)、TinyLlama 1.1B 或 Falcon 1B。

6999b044-b913-11ee-8b88-92fbcf53809c.png69b6cbac-b913-11ee-8b88-92fbcf53809c.png69e0a7ec-b913-11ee-8b88-92fbcf53809c.png69f47498-b913-11ee-8b88-92fbcf53809c.png

不过他们也警告称,由于小型、低容量语言模型的特性,Stable LM 2 1.6B 可能会出现高幻觉率、潜在的有毒语言等类似的常见问题。“我们要求社区在构建应用程序时牢记这一点,并采取适当措施确保以负责任的方式进行开发。”

Stable LM 2 1.6B 目前可在商业和非商业领域使用,只要拥有 Stability AI 会员资格,即可在 Hugging Face 上测试该模型。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语言模型
    +关注

    关注

    0

    文章

    435

    浏览量

    10051
  • LLM
    LLM
    +关注

    关注

    0

    文章

    202

    浏览量

    233

原文标题:Stability AI推出更小、更高效的1.6B语言模型

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Stability AI发布Stable Code Instruct 3B大语言模型,可编译多种编程语言

    据报道,Stability AI公司近期推出了适配程序员使用的Stable Code Instruct 3B大语言模型,此款
    的头像 发表于 03-27 10:04 124次阅读

    搭载星火认知大模型AI鼠标:一键呼出AI助手,办公更高效

    搭载星火认知大模型AI鼠标:一键呼出AI助手,办公更高效 在这个AI时代,如果你想在激烈竞争的职场中不被淘汰,讯飞
    的头像 发表于 03-25 11:52 119次阅读
    搭载星火认知大<b class='flag-5'>模型</b>的<b class='flag-5'>AI</b>鼠标:一键呼出<b class='flag-5'>AI</b>助手,办公<b class='flag-5'>更高效</b>

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,该模型以其独特的功能吸引了众多关注。此
    的头像 发表于 03-22 10:30 262次阅读

    Stability AI与Morph AI共同推出一体化AI视频创作工具

    近日,业界领先的AI技术公司Stability AI与中国AI创业公司Morph AI达成重要合作。双方宣布共同
    的头像 发表于 03-05 10:44 369次阅读

    Stability AI试图通过新的图像生成人工智能模型保持领先地位

    Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大,而Stable Diffusion是许多其他文本到图像生成
    的头像 发表于 02-19 16:03 432次阅读
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>试图通过新的图像生成人工智能<b class='flag-5'>模型</b>保持领先地位

    Stability AI推出商业版会员计划 对AI模型的商业使用收费

    该公司在一篇博客文章中表示:“随着我们公司的不断成熟和规模化,Stability AI会员将在助力我们未来的核心模型研发方面发挥关键作用。” The Verge联系了Stability
    的头像 发表于 12-26 16:48 415次阅读

    语言模型简介:基于大语言模型模型全家桶Amazon Bedrock

    本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶:Bedrock对大语言模型进行介绍。大
    的头像 发表于 12-04 15:51 409次阅读

    研究人员发现了迄今为止最快的半导体

    科学家们发现了他们所说的迄今为止最快、最高效的半导体。尽管这种新材料是用地球上最稀有的元素之一制成,但研究人员表示,有可能会发现由更丰富的材料制成的替代物,其运行速度相当快。
    的头像 发表于 11-08 16:28 353次阅读

    高通推出骁龙X Elite——AI赋能的强大平台将为PC带来变革

    专为AI打造,支持在终端侧运行超过130亿参数的生成式AI模型,凭借快达竞品4.5倍的AI处理速度,其将继续扩大高通在AI领域的领先优势。
    的头像 发表于 10-25 10:30 187次阅读
    高通<b class='flag-5'>推出</b>骁龙X Elite——<b class='flag-5'>AI</b>赋能的强大平台将为PC带来变革

    【KV260视觉入门套件试用体验】Vitis AI 构建开发环境,并使用inspector检查模型

    的扩展性,对模型进行更快速和更高效的优化。我可以使用 pytorch 或者 tensorflow 提供的一些优化技术,如剪枝、量化、蒸馏等,来减少模型的大小和复杂度。然后我可以使用 Vitis
    发表于 10-14 15:34

    Stability AI推出Stable audio的文本到音频生成人工智能平台

    Stability AI是一家主要以人工智能生成的视觉效果而闻名的公司,它推出了一个名为Stable audio的文本到音频生成人工智能平台。 Stable Audio使用扩散模型,与
    的头像 发表于 09-20 10:20 948次阅读

    虹科分享 | 谷歌Vertex AI平台使用Redis搭建大语言模型

    基础模型和高性能数据层这两个基本组件始终是创建高效、可扩展语言模型应用的关键,利用Redis搭建大语言
    的头像 发表于 09-18 11:26 339次阅读
    虹科分享 | 谷歌Vertex <b class='flag-5'>AI</b>平台使用Redis搭建大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    科学家制造出迄今为止分辨率最高的超透镜

    一个由中国和英国科学家组成的团队制造了迄今为止分辨率最高的光学成像透镜。 19世纪以来,医生们一直认为,光学显微镜存在一个分辨率极限,超出这个极限就无法清楚地看到物体。当物体小于200纳米,比如
    的头像 发表于 09-01 06:28 433次阅读

    开启AI算力芯时代

    ChatGPTOpenAI的大语言模型ChatGPT在推出约两个月后,达到1亿月活,成为迄今为止增长最快的消费者应用程序。ChatGPT不仅是新一代聊天机器人的突破,也为信息产业带来巨
    的头像 发表于 07-31 17:48 424次阅读
    开启<b class='flag-5'>AI</b>算力芯时代

    人大发表迄今为止最大最全的大模型综述

    语言模型目前已经成为学界研究的热点。我们统计了arXiv论文库中自2018年6月以来包含关键词"语言模型"以及自2019年10月以来包含关键词"大
    的头像 发表于 07-06 16:36 2016次阅读
    人大发表<b class='flag-5'>迄今为止</b>最大最全的大<b class='flag-5'>模型</b>综述