0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Stability AI推出迄今为止更小、更高效的1.6B语言模型

OSC开源社区 来源:OSC开源社区 2024-01-23 10:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B。以英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据为基础进行了训练,体积小、速度快,降低了硬件门槛;并提供了完全透明的训练细节,旨在让开发人员和模型创建者能够快速进行实验和迭代。

Stable LM 是一种文本内容生成 LLM,Stability AI 于 2023 年 4 月首次推出了 30 亿和 70 亿参数模型。新的 StableLM 模型实际上是 Stability AI 在 2024 年发布的第二个模型,此前该公司在早些时候还发布了一个 Stable Code 3B。

Stability AI 声称,Stable LM 2 1.6B 在大多数基准测试中均优于其他参数低于 20 亿个的小语言模型,如微软的 Phi-1.5 (1.3B) 和 Phi-2 (2.7B)、TinyLlama 1.1B 或 Falcon 1B。

6999b044-b913-11ee-8b88-92fbcf53809c.png69b6cbac-b913-11ee-8b88-92fbcf53809c.png69e0a7ec-b913-11ee-8b88-92fbcf53809c.png69f47498-b913-11ee-8b88-92fbcf53809c.png

不过他们也警告称,由于小型、低容量语言模型的特性,Stable LM 2 1.6B 可能会出现高幻觉率、潜在的有毒语言等类似的常见问题。“我们要求社区在构建应用程序时牢记这一点,并采取适当措施确保以负责任的方式进行开发。”

Stable LM 2 1.6B 目前可在商业和非商业领域使用,只要拥有 Stability AI 会员资格,即可在 Hugging Face 上测试该模型。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11255
  • LLM
    LLM
    +关注

    关注

    1

    文章

    340

    浏览量

    1258

原文标题:Stability AI推出更小、更高效的1.6B语言模型

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    太强了!AI PC搭载70B模型,算力狂飙,内存开挂

    DeepSeek-R1不同模型。相对来说,DeepSeek-R1 70B模型或许是日常AI功能的顶格需求,它也是当前高性能AI PC的着力
    的头像 发表于 03-24 08:52 2986次阅读
    太强了!<b class='flag-5'>AI</b> PC搭载70<b class='flag-5'>B</b>大<b class='flag-5'>模型</b>,算力狂飙,内存开挂

    谷歌正式推出最新Gemini 3 AI模型

    今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,与之前的版本相比,它在所有主要的 AI 基准
    的头像 发表于 11-24 11:10 802次阅读
    谷歌正式<b class='flag-5'>推出</b>最新Gemini 3 <b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    谷歌Gemini 3模型开启智能新纪元

    大约两年前,我们开启了 Gemini 时代,这是公司迄今为止投入最大的科研和产品项目之一。自那时起,看到大家对它的喜爱程度,着实令人惊叹。现在,每月有 20 亿用户使用 AI 概览 (AI
    的头像 发表于 11-24 11:07 488次阅读
    谷歌Gemini 3<b class='flag-5'>模型</b>开启智能新纪元

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    微软企业级应用AI能力全面升级

    微软宣布,已将 OpenAI 迄今为止最具突破性的的 AI 技术系统 GPT-5 全面集成至其产品生态中,全面增强平台的的推理、代码生成与对话体验。最新版 GPT-5 已在 Microsoft
    的头像 发表于 08-15 11:44 1101次阅读

    谷歌Gemini 2.5模型系列更新

    今年 3 月,我们发布了迄今为止最智能的模型 Gemini 2.5 Pro,两周前,我们提前为您带来了 I/O 更新,以便开发者构建出色的网络应用。
    的头像 发表于 05-23 14:56 1003次阅读

    Google推出第七代TPU芯片Ironwood

    在 Google Cloud Next 25 大会上,我们隆重推出第 7 代 Tensor Processing Unit (TPU) — Ironwood。这不仅是我们迄今为止性能最高、扩展性最佳的定制 AI 加速器,更是第一
    的头像 发表于 04-16 11:20 1341次阅读
    Google<b class='flag-5'>推出</b>第七代TPU芯片Ironwood

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    应用开发不用“等平台”,彻底释放开发效率和模型接入自由度。 自DeepSeek横空出世以来,这种更适合端侧部署,回答效率更高效的训练模式快速引爆了AI行业,主流大模型纷纷加强了推理能力
    发表于 04-13 19:52

    树莓派发布了迄今为止最优秀的电源解决方案!

    无论是运行树莓派还是为笔记本电脑充电,电源质量都至关重要。树莓派团队近日发布了迄今为止最优秀的电源解决方案——售价15美元的45WUSB-C电源适配器,这款产品可完美胜任上述两种使用场景。高效稳压
    的头像 发表于 04-09 18:36 745次阅读
    树莓派发布了<b class='flag-5'>迄今为止</b>最优秀的电源解决方案!

    适用于数据中心和AI时代的800G网络

    随着人工智能(AI)技术的迅猛发展,数据中心面临着前所未有的计算和网络压力。从大语言模型(LLM)训练到生成式AI应用,海量数据处理需求推动了网络带宽的快速增长。在此背景下,800G网
    发表于 03-25 17:35

    语言模型在军事应用中的安全性考量

    大型语言模型(LLM)(如 ChatGPT、Claude 和 Meta AI)的出现是迄今为止人工智能领域最重大的进步。这项新技术也带来了新风险。众所周知的例子包括偏见、幻觉、知识产权
    的头像 发表于 02-09 10:30 762次阅读

    广和通正式推出AI玩具大模型解决方案

    广和通近期推出了一款创新的AI玩具大模型解决方案,该方案深度融合了豆包等AI模型,并内置了广和通Cat.1模组,为智能玩具的
    的头像 发表于 01-24 10:36 1742次阅读

    广和通推出AI玩具大模型解决方案

    广和通推出AI玩具大模型解决方案,该方案深度融合豆包等AI模型、内置广和通Cat.1模组,助力智能玩具实现
    的头像 发表于 01-21 10:27 1677次阅读

    语言模型管理的作用

    要充分发挥语言模型的潜力,有效的语言模型管理非常重要。以下,是对语言模型管理作用的分析,由
    的头像 发表于 01-02 11:06 573次阅读

    AI语言模型开发步骤

    开发一个高效、准确的大语言模型是一个复杂且多阶段的过程,涉及数据收集与预处理、模型架构设计、训练与优化、评估与调试等多个环节。接下来,AI
    的头像 发表于 12-19 11:29 1225次阅读