0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Stability AI推出迄今为止更小、更高效的1.6B语言模型

OSC开源社区 来源:OSC开源社区 2024-01-23 10:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B。以英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据为基础进行了训练,体积小、速度快,降低了硬件门槛;并提供了完全透明的训练细节,旨在让开发人员和模型创建者能够快速进行实验和迭代。

Stable LM 是一种文本内容生成 LLM,Stability AI 于 2023 年 4 月首次推出了 30 亿和 70 亿参数模型。新的 StableLM 模型实际上是 Stability AI 在 2024 年发布的第二个模型,此前该公司在早些时候还发布了一个 Stable Code 3B。

Stability AI 声称,Stable LM 2 1.6B 在大多数基准测试中均优于其他参数低于 20 亿个的小语言模型,如微软的 Phi-1.5 (1.3B) 和 Phi-2 (2.7B)、TinyLlama 1.1B 或 Falcon 1B。

6999b044-b913-11ee-8b88-92fbcf53809c.png69b6cbac-b913-11ee-8b88-92fbcf53809c.png69e0a7ec-b913-11ee-8b88-92fbcf53809c.png69f47498-b913-11ee-8b88-92fbcf53809c.png

不过他们也警告称,由于小型、低容量语言模型的特性,Stable LM 2 1.6B 可能会出现高幻觉率、潜在的有毒语言等类似的常见问题。“我们要求社区在构建应用程序时牢记这一点,并采取适当措施确保以负责任的方式进行开发。”

Stable LM 2 1.6B 目前可在商业和非商业领域使用,只要拥有 Stability AI 会员资格,即可在 Hugging Face 上测试该模型。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语言模型
    +关注

    关注

    0

    文章

    574

    浏览量

    11341
  • LLM
    LLM
    +关注

    关注

    1

    文章

    350

    浏览量

    1394

原文标题:Stability AI推出更小、更高效的1.6B语言模型

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    特斯拉AI芯片战略升级,“史诗级”芯片接棒Dojo

    电子发烧友网报道(文/黄山明)近期,特斯拉CEO马斯克在社交媒体上发文称,特斯拉AI5芯片设计团队已完成出色的设计评审,并表示这款芯片将成为“史诗级”产品,并且接下来推出AI6也有望成为迄今
    的头像 发表于 09-09 09:01 7706次阅读

    Google正式推出最新开放模型Gemma 4

    今天,我们正式推出 Gemma 4 —— 这是我们迄今为止最智能的开放模型。Gemma 4 专为高级推理和智能体 (Agentic) 工作流而设计,实现了单位参数下前所未有的智能水平。这一突破性进展
    的头像 发表于 04-08 10:06 468次阅读
    Google正式<b class='flag-5'>推出</b>最新开放<b class='flag-5'>模型</b>Gemma 4

    亮亮视野联合智谱AI推出AR+AI会议翻译系统

    模型能力,可支持54种语言实时翻译,延迟小于1秒,单次续航8小时,并可7×24小时稳定运行。这标志着国际会议翻译从传统设备和人工依赖,迈向更高效率、更低成本、更强普惠性的 AR+AI
    的头像 发表于 03-30 11:39 446次阅读

    MCXE31B处理器的数据不可用怎么解决?

    出现错误。 这是我迄今为止尝试过的: 重新启动软件和 PC。 重新安装最新版本的软件。 当我将相同的工具与MCXN947处理器,一切都可以完美运行——问题只发生在MCXE31B.
    发表于 03-16 08:02

    AI基础设施中部署大语言模型的三大举措

    文:Gartner研究副总裁周玲中国企业机构已逐步在生产环境中运行或者计划运行大语言模型,但在AI基础设施的生产部署与高效运营方面仍面临诸多挑战。目前,中国正加速提升其生成式
    的头像 发表于 02-09 16:28 543次阅读
    在<b class='flag-5'>AI</b>基础设施中部署大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的三大举措

    使用NORDIC AI的好处

    不依赖持续联网,整体系统可靠性更高。[Edge AI 概述; Nordic Edge AI 技术页] 覆盖从“小 MCU”到“高性能 SoC”的完整产品线 Neuton 模型 :超
    发表于 01-31 23:16

    谷歌正式推出最新Gemini 3 AI模型

    今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,与之前的版本相比,它在所有主要的 AI 基准
    的头像 发表于 11-24 11:10 1416次阅读
    谷歌正式<b class='flag-5'>推出</b>最新Gemini 3 <b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    谷歌Gemini 3模型开启智能新纪元

    大约两年前,我们开启了 Gemini 时代,这是公司迄今为止投入最大的科研和产品项目之一。自那时起,看到大家对它的喜爱程度,着实令人惊叹。现在,每月有 20 亿用户使用 AI 概览 (AI
    的头像 发表于 11-24 11:07 987次阅读
    谷歌Gemini 3<b class='flag-5'>模型</b>开启智能新纪元

    NVIDIA推出面向语言、机器人和生物学的全新开源AI技术

    NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展 AI 的普及并推动创新。NVIDIA 正将这些
    的头像 发表于 11-06 11:49 1268次阅读

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    Figure 03发布,迄今为止最像人的机器人

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2025年10月10日 11:24:24

    微软企业级应用AI能力全面升级

    微软宣布,已将 OpenAI 迄今为止最具突破性的的 AI 技术系统 GPT-5 全面集成至其产品生态中,全面增强平台的的推理、代码生成与对话体验。最新版 GPT-5 已在 Microsoft
    的头像 发表于 08-15 11:44 1483次阅读

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    核心网络支撑。未来,随着1.6T光模块的落地,睿海光电将进一步推动数据中心向更高性能、更智能化演进,携手全球伙伴开启AI新时代。 睿海光电——AI网络升级的可靠伙伴!
    发表于 08-13 19:01

    环旭电子即将推出新一代1.6T光模组产品

    全球领先的电子设计与制造服务供货商USI环旭电子宣布,即将推出新一代1.6T光模组产品,锁定高速运算与AI数据中心应用,协助客户提升数据中心网络拓扑效能,应对AI
    的头像 发表于 07-30 10:45 2459次阅读

    谷歌Gemini 2.5模型系列更新

    今年 3 月,我们发布了迄今为止最智能的模型 Gemini 2.5 Pro,两周前,我们提前为您带来了 I/O 更新,以便开发者构建出色的网络应用。
    的头像 发表于 05-23 14:56 1349次阅读