0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一套开源的大型语言模型(LLM)—— StableLM

OSC开源社区 来源:OSC开源社区 2023-04-24 10:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Stability AI 是 Stable Diffusion 图像生成工具背后的公司,如今他们不再局限于开发图像 / 视频生成方面的 AI,于今天正式发布了一套开源的大型语言模型(LLM)—— StableLM,首次涉足目前由 OpenAI、Meta 和 Google 等科技公司主导的语言模型领域。

StableLM 跟 ChatGPT、Bard 这些一样,被设计用来生成文本和代码。它是通过使用开源数据集 the Pile 训练而来的,这个数据集包含的数据来源就有维基百科、Stack Exchange 和 PubMed。不过,Stability AI 在 the Pile 的基础上进行了扩展,所使用的数据集大小是标准 the Pile 的 3 倍。

Stability AI 现在已经将这个 StableLM 模型发布到了 GitHub 上,开发者可以使用或经过调整后再使用。StableLM 模型还处于 Alpha 阶段,它的参数也比较少,只有 30 亿和 70 亿个参数,之后他们还会推出有 150 亿到 650 亿参数的模型。

e9cfbea8-df9c-11ed-bfe3-dac502259ad0.png

对于 AI 可能会产生的风险,Stability AI 也给出了提醒:

对于任何没有额外微调和强化学习的预训练大型语言模型来说,用户得到的回应质量可能参差不齐,并且可能包括冒犯性的语言和观点。这有望随着规模、更好的数据、社区反馈和优化而得到改善。

e9ff4f24-df9c-11ed-bfe3-dac502259ad0.jpg

除了将代码托管在 GitHub 上,Stability AI 还在 Hugging Face 上发布了一个演示版本,经过测试 StableLM 会说中文,但只会一点点(回复内容对应不上,语句也不通顺)。

ea1836ba-df9c-11ed-bfe3-dac502259ad0.png

在 Stable Diffusion 发布后,Stability AI 遭到了很多艺术家的投诉和起诉,指控它通过使用网络抓取的受版权保护的图像开发 AI 图像生成工具,侵犯了艺术家们的权利。在之前的纠纷还没解决的情况下,如今推出 StableLM 不知道是否还会引发更多的诉讼。

Stability AI 在去年 10 月融资了 1 亿美元,公司估值也超过了 10 亿美元。但 AI 是一个投入非常高,可能短期也很难产生收益的领域,也不知道这 1 亿美金现在还剩多少,为了在这个领域持续发展,Stability AI 会不会继续融资,亦或是投入某个大型公司的怀抱呢?

项目地址:https://github.com/Stability-AI/StableLM

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11343
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261
  • GitHub
    +关注

    关注

    3

    文章

    489

    浏览量

    18763
  • LLM
    LLM
    +关注

    关注

    1

    文章

    350

    浏览量

    1394

原文标题:AI作画鼻祖Stability AI推出大型语言模型,会一点点中文

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    解读大型语言模型的偏见

    项新的研究中,研究人员发现了LLM中某种偏见的根本原因,为更准确、更可靠的AI系统铺平了道路。研究表明,大型语言模型
    的头像 发表于 04-15 14:44 694次阅读
    解读<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>的偏见

    从网络接口到 DMA,一套面向工程师的 FPGA 网络开发框架

    在高性能网络、数据中心和智能网卡加速领域,硬件与软件协同设计已成为提升网络处理效率的关键。Liberouter 提供的 Network Development Kit(NDK) 就是这样一套专门用来
    的头像 发表于 02-12 11:28 522次阅读
    从网络接口到 DMA,<b class='flag-5'>一套</b>面向工程师的 FPGA 网络开发框架

    芯盾时代如何破局LLM供应链漏洞危机

    随着人工智能技术进入 2026 年的爆发期,大语言模型LLM)已不再是实验室里的原型,而是支撑企业核心业务的“数字引擎”。然而,LLM的强大高度依赖于全球化的AI生态。从海量的互联网
    的头像 发表于 02-04 16:53 1426次阅读

    什么是大模型,智能体...?大模型100问,快速全面了解!

    、概念篇1.什么是大模型?大模型是指参数规模巨大(通常达到数十亿甚至万亿级别)、使用海量数据训练而成的人工智能模型。2.什么是大语言
    的头像 发表于 02-02 16:36 1130次阅读
    什么是大<b class='flag-5'>模型</b>,智能体...?大<b class='flag-5'>模型</b>100问,快速全面了解!

    NVIDIA ACE现已支持开源Qwen3-8B小语言模型

    为助力打造实时、动态的 NPC 游戏角色,NVIDIA ACE 现已支持开源 Qwen3-8B 小语言模型(SLM),可实现 PC 游戏中的本地部署。
    的头像 发表于 10-29 16:59 1417次阅读

    广和通发布端侧情感对话大模型FiboEmo-LLM

    9月,广和通正式发布自主研发的端侧情感对话大模型FiboEmo-LLM。该模型专注于情感计算与自然语言交互融合,致力于为AI玩具、智能陪伴设备等终端场景提供“情感理解-情感响应”
    的头像 发表于 09-26 13:37 2024次阅读

    我如何用Prompt工程将大模型调教成风控专家

    作为个交易风控的算法工程师,在日常工作中,我常常与海量的数据和复杂的模型打交道,试图在看似平静的水面下,捕捉那些隐藏的风险暗流。最近,我尝试将大语言模型
    的头像 发表于 09-08 14:22 554次阅读
    我如何用Prompt工程将大<b class='flag-5'>模型</b>调教成风控专家

    米尔RK3576部署端侧多模态多轮对话,6TOPS算力驱动30亿参数LLM

    加载 → 图片预处理 → 用户交互 → 推理输出”的核心流程,支持图文体的多模态对话,适配多轮问答、视觉问答等典型场景。 具体运行机制可拆解为以下步骤:1. 模型初始化首先加载大语言模型
    发表于 09-05 17:25

    3万字长文!深度解析大语言模型LLM原理

    我们正在参加全球电子成就奖的评选,欢迎大家帮我们投票~~~谢谢支持本文转自:腾讯技术工程作者:royceshao大语言模型LLM的精妙之处在于很好地利用数学解决了工业场景的问题,笔者基于过往工程经验
    的头像 发表于 09-02 13:34 3616次阅读
    3万字长文!深度解析大<b class='flag-5'>语言</b><b class='flag-5'>模型</b><b class='flag-5'>LLM</b>原理

    Votee AI借助NVIDIA技术加速方言小语种LLM开发

    了精准的方言及小语种大语言模型 (LLM)。此举成功解决了数据稀缺、语言复杂及计算效率等挑战,为全球数以百万计、缺乏数字化资源的语言使用者提
    的头像 发表于 08-20 14:21 1029次阅读

    如何在NVIDIA Blackwell GPU上优化DeepSeek R1吞吐量

    开源 DeepSeek R1 模型的创新架构包含多头潜在注意力机制 (MLA) 和大型稀疏混合专家模型 (MoE),其显著提升了大语言
    的头像 发表于 08-12 15:19 4499次阅读
    如何在NVIDIA Blackwell GPU上优化DeepSeek R1吞吐量

    如何在魔搭社区使用TensorRT-LLM加速优化Qwen3系列模型推理部署

    TensorRT-LLM 作为 NVIDIA 专为 LLM 推理部署加速优化的开源库,可帮助开发者快速利用最新 LLM 完成应用原型验证与产品部署。
    的头像 发表于 07-04 14:38 2428次阅读

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI。
    的头像 发表于 06-12 15:42 1382次阅读

    LM Studio使用NVIDIA技术加速LLM性能

    随着 AI 使用场景不断扩展(从文档摘要到定制化软件代理),开发者和技术爱好者正在寻求以更 快、更灵活的方式来运行大语言模型LLM)。
    的头像 发表于 06-06 15:14 1447次阅读
    LM Studio使用NVIDIA技术加速<b class='flag-5'>LLM</b>性能

    小白学大模型:从零实现 LLM语言模型

    在当今人工智能领域,大型语言模型LLM)的开发已经成为个热门话题。这些模型通过学习大量的文本
    的头像 发表于 04-30 18:34 1449次阅读
    小白学大<b class='flag-5'>模型</b>:从零实现 <b class='flag-5'>LLM</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>