0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zyphra推出Zamba2-mini 1.2B模型

CHANBAEK 来源:网络整理 作者:网络整理 2024-08-29 18:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,AI创新先锋Zyphra公司在科技界投下了一颗震撼弹,正式揭晓其最新力作——Zamba2-mini 1.2B模型。这款被誉为端侧SOTA(State-Of-The-Art)级别的小语言模型,以其卓越的性能参数和极致的压缩效率,成为了业界关注的焦点。

Zamba2-mini 1.2B携带着惊人的12亿参数量,却能在严苛的4bit量化条件下,将内存占用控制在惊人的700MB以下,这一成就无疑是对AI模型轻量化探索的一次重大突破。其背后,是Zyphra团队对模型架构的深度优化与大胆创新,成功融合了多种神经网络设计的精髓,既保留了大型密集变压器模型的高质量输出特性,又实现了小模型难以企及的计算与内存效率。

Zamba2-mini 1.2B的问世,不仅为端侧设备提供了更为强大的智能支持,更预示着AI技术在实际应用场景中的广泛落地与深度融合。随着这一技术的不断成熟与普及,我们有理由相信,未来的端侧AI将更加智能、高效,为人们的生活带来更多便利与惊喜。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 变压器
    +关注

    关注

    162

    文章

    7945

    浏览量

    145034
  • AI
    AI
    +关注

    关注

    89

    文章

    38120

    浏览量

    296660
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51713
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌与耶鲁大学合作发布最新C2S-Scale 27B模型

    我们很荣幸发布与耶鲁大学合作研究的 Cell2Sentence-Scale 27B (C2S-Scale),这是一个新的 270 亿参数基础模型,旨在理解单个细胞的 "语言"。C
    的头像 发表于 11-06 10:35 516次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2
    的头像 发表于 08-27 12:45 1401次阅读
    NVIDIA Nemotron Nano <b class='flag-5'>2</b>推理<b class='flag-5'>模型</b>发布

    Coherent推出适用于Mini2P显微成像的Axon FL光纤耦合输出模块

    当小鼠在迷宫中自由探索时,Mini2P显微成像系统就像一台"脑内摄像机",实时而清晰地捕捉其大脑深处神经元的动态活动。Coherent推出的全新Axon FL光纤耦合输出模块,能够将Axon 920
    的头像 发表于 08-13 09:55 221次阅读
    Coherent<b class='flag-5'>推出</b>适用于<b class='flag-5'>Mini2</b>P显微成像的Axon FL光纤耦合输出模块

    OpenAI发布2款开源模型

    OpenAI开源了两款高性能权重语言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 发布了!我们做了一个开放模型
    的头像 发表于 08-06 14:25 882次阅读

    鸿利智汇推出mini型CHIP LED解决方案

    在智能设备步入毫米级精密化与极致轻薄化竞争的时代,鸿利智汇突破性推出mini 型CHIP LED解决方案,以1.0×0.5mm的mini级封装尺寸(较传统0603封装体积缩减60%)重塑行业标准。
    的头像 发表于 04-15 14:47 1134次阅读

    在MAC mini4上安装Ollama、Chatbox及模型交互指南

    作者:算力魔方创始人/英特尔创新大使刘力 一,简介 本文将指导您如何在MAC mini4上安装Ollama和Chatbox,并下载Deepseek-r1:32b模型。Ollama是一个用于管理和运行
    的头像 发表于 03-11 17:17 1249次阅读
    在MAC <b class='flag-5'>mini</b>4上安装Ollama、Chatbox及<b class='flag-5'>模型</b>交互指南

    壁仞科技推出阿里QWQ-32B模型一体机

    能力等关键测试中展现出卓越性能。 作为国产AI算力重要推动力量,壁仞科技不断测试与更新适配最先进大模型,联合生态合作伙伴共同推出QWQ-32B模型一体机。 在
    的头像 发表于 03-10 09:05 1631次阅读
    壁仞科技<b class='flag-5'>推出</b>阿里QWQ-32<b class='flag-5'>B</b>大<b class='flag-5'>模型</b>一体机

    摩尔线程支持阿里云通义千问QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义千问QwQ-32B。摩尔线程在该模型发布后2小时内,迅速且高效完成了对千问QwQ-32B的支持。
    的头像 发表于 03-07 17:48 1121次阅读
    摩尔线程支持阿里云通义千问QwQ-32<b class='flag-5'>B</b>开源<b class='flag-5'>模型</b>

    OpenAI o3-mini模型思维链遭质疑

    近日,OpenAI公开了其大模型o3-mini的推理思维链,这一举措使得免费用户和付费用户都能深入了解模型的思考过程。这一透明度的提升,原本旨在增强用户对模型的信任和理解,然而却意外引
    的头像 发表于 02-08 10:57 907次阅读

    OpenAI:GPT-4o及4o-mini模型性能下降,正展开调查

    ,并承诺将尽快发布最新的调查结果和解决方案。这一事件不仅对OpenAI自身的技术声誉产生了影响,也引发了业界对于大型语言模型稳定性和可靠性的担忧。 GPT-4o及4o-mini作为OpenAI推出的先进语言
    的头像 发表于 01-21 10:34 937次阅读

    OpenAI或将推出o3 mini推理AI模型

    近日,据最新消息,OpenAI即将在几周内推出一款全新的推理AI模型——o3 mini。这一消息由OpenAI的首席执行官Sam Altman在1月17日通过社交媒体平台X发布的一篇文章中透露
    的头像 发表于 01-21 10:06 882次阅读

    OpenAI即将推出o3 mini推理AI模型

    计划在接下来的几周内正式推出这一创新成果。 这一消息无疑为人工智能领域注入了新的活力。作为OpenAI的最新力作,o3 mini推理AI模型在技术上实现了诸多突破,旨在为用户提供更加高效、精准的推理服务。通过采用先进的算法和
    的头像 发表于 01-20 10:54 785次阅读

    OpenAI即将推出o3-mini,降低高级推理门槛

    OpenAI在人工智能领域的探索与创新从未停歇,为开发者们带来了一个又一个惊喜。近日,OpenAI开发者体验负责人传来好消息,表示公司即将向广大开发者推出全新的o3-mini模型。 这一消息的发布
    的头像 发表于 01-18 11:23 1099次阅读

    图森未来发布“Ruyi”视频大模型,Ruyi-Mini-7B版本现已开源

    重大献礼。 尤为值得一提的是,图森未来已经将Ruyi的Mini-7B版本正式开源,用户现在可以通过huggingface平台轻松下载并使用这一强大的工具。这一举措无疑将极大地推动视频大模型在更广泛领域的应用和发展。 “Ruyi”模型
    的头像 发表于 12-20 15:19 1673次阅读

    Meta推出Llama 3.3 70B,AI大模型竞争白热化

    在今年的AI领域,Meta也不甘落后,推出了其压轴之作——Llama 3.3 70B模型。与此同时,马斯克的xAI也宣布其Grok模型从今天起全球免费开放(但存在一定的使用限制)。
    的头像 发表于 12-09 14:50 1015次阅读