0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新火种AI|2024乍到,会成为小模型的当打之年吗?

新火种 来源:新火种 作者:新火种 2024-01-10 22:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


作者:小岩

编辑:美美

乘着ChatGPT爆火的东风,2023年成为了当之无愧的“大模型爆发之年”。跟随ChatGPT的脚步,诸多大厂和知名企业推出了自己的AI大模型。也正因此,大模型赛道的竞争变得异常激烈,烧钱的势头也变得异常凶猛。

不过,这样的趋势很可能在2024年产生变化。每个事物的发展都要经历“产生,发展,高潮,低谷”的阶段,已经在2023年大放异彩,涌现无数高光时刻的大模型很可能在2024年渐渐冷却,褪掉光环,而小模型,则有可能成为今年的破局之道。

“大模型虽然亮眼,但企业对这些技术的采用几乎没有实质性的增长”。

众所周知,在高新技术和烧钱测试的加持下,大模型产品的表现变得十分突出,整个赛道也卷的出奇。但可惜的是,这些花大力气砸出来的优秀大模型产品很难成功变现。

根据印度IT巨头Infosys的最新发现,只有6 %的欧洲公司通过生成式AI用例创造了商业价值。麦肯锡也在2023年的一份报告中得出结论,“尽管生成式AI的使用可能会刺激其他人工智能工具的采用,但我们认为,企业对这些技术的采用几乎没有实质性的增长。”

而资本市场对于大模型AI的态度也不乐观。从融资规模来看,生成式AI的投资浪潮是一次“短暂繁荣”,尽管头部以及率先抢占先机的AI公司获得了不少资本的青睐,但后续的AI公司如果想要收获资金,并不容易。根据Crunchbase数据显示,2023 年,人工智能独角兽公司的融资大幅下降,仅为 2021 年市场高峰时的25 %左右;全球最活跃的9大 VC 在AI独角兽公司的投资也是大幅下降。

究其原因,这并不难理解。潮水退去,方知谁在裸泳。投资者都是趋利避害的,自然想看到自己投资的AI公司产出尽可能多的利润。在这种情况下,针对AI的投资泡沫会越来越少,据此,AI公司试错的成本将大大提高。

大模型发展即将受阻,小模型能否顺势而为,迎来自己的井喷元年?

在这种情况下,AI模型需要朝着效率更高,成本更低的方向去发展。从这个角度去说,小模型很可能比大模型更实用,更方便。

Snorkel AI曾做过一个试验,分别用GPT-3微调和自己搭建的小模型来训练一个法律领域的垂直模型。GPT-3的微调和搭建成本是7418美元,10000推理的花费是173美元,而自己搭建的小模型成本仅为1915美元,10000次推理也只是花费了0.26美元。从正确率来看,GPT-3微调的垂直模型正确率为71.4 %,小模型则为71.3 %。

值得一提的是,GPT-3的参数量很大,是小模型的1400倍。我们当然不能因为GPT-3微调的正确率与小模型的正确率相似就妄下结论,认为“参数量没用”。不过,这或许就是“杀鸡焉用牛刀”的道理,就像《华尔街日报》提到的那句玩笑,用GPT-4总结电子邮件就像“让兰博基尼送披萨”。毕竟,在很多场景下,用户需要的并没有那么多。

目前,国内的AI领域也在面临相同的状况。

如今,国内已经发布的所谓“大模型”超过200个,“百模大战”进行的如火如荼。而处于头部的几个大模型都曾宣称自己的参数规模超千亿级别,有的甚至达到了万亿的规模。

但规模只要够大,就一定够好吗?未必。百度的李彦宏曾经说过,“100多个大模型浪费社会资源……尤其在中国算力还受限制情况下,企业应该去探索各行各业的应用结合,全新的 APP产品可能性等。”

事实上,与李彦宏持有相同观点的人并不在少数。相较于要把AI模型的规模不断做大这件事,大家更应该关注如何将模型更好的应用到实处。不是大模型做不起,而是小模型更具性价比。

做小模型的本质,其实是在做离用户更近的模型。

更重要的是,从某种层面来说,更好操作,更低成本的小模型或许更能匹配C端用户的核心诉求。

大模型看似高大上,但却存在成本高,个性化不足的问题。如果大模型可以变小,甚至直接走进移动端,将模型塞进手机,智能汽车,机器人等设备,那么一定会大大提高C端用户的黏着度。特别是从创业角度来看,搭建离用户更近的模型自然也更有生存空间,因为他们离用户更近。

事实上,很多企业已经将这样的策略提上了日程。有媒体报道,早在2022年初,阿里巴巴达摩院,上海浙江大学高等研究院,以及上海人工智能实验室的联合研究团队通过蒸馏压缩和参数共享等技术手段,将3.4亿参数的M6模型压缩到了百万参数,其规模只有以大模型的三十分之一,却保留了大模型90 %以上的性能。当然,2022年的3.4亿,较今天的大模型规模来看不算太大,但这个举动无疑为“大规模瘦身”开了一个好头。

2023年初,关于AI大模型的竞争逐渐激烈,局面逐渐焦灼,最终演变成了一场声势浩大的模型竞赛。如今,潮水褪去,在耗费了大量金钱,人力,时间成本之后,愈来愈多的AI公司悟出了一个道理:如何“变大”并不是关键,关键在于要如何“既大又好”,更重要的是,当大模型进入应用环节,如何该做到“以小驭大。

如同区块链行业一样,野蛮生长之后势必会迎来监管的压力,AI也将面临同样的状况。如今,随着AI影响力的增强,相关的问题也开始凸显譬如Midjourney + Elevenlabs 生成的假新闻就引起过极大的影响。

此外,AI大模型的推进将消耗掉大量的资源。有新闻报道,到2027年,全球的AI需求可能会消耗掉66亿立方米的水资源,几乎相当于美国华盛顿州全年的取水量。AI对环境和能源可能造成的影响会对AI行业造成一定的经济压力和政治压力。到了那时,如何用更少的数据,更少的能源训练出更好用的模型,就成为了未来的重中之重。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38322

    浏览量

    297430
  • 人工智能
    +关注

    关注

    1813

    文章

    49791

    浏览量

    261957
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10100
  • 大模型
    +关注

    关注

    2

    文章

    3479

    浏览量

    5019
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片AGI芯片

    、现阶段更智能、更接近AGI的6中算法与模型 1、MoE模型 MoE模型作为Transfomer模型的后继者,代表着AI技术的一项重大创新和
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑在本质上就是一台湿润的软组织
    发表于 09-06 19:12

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    在人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,
    发表于 07-04 11:10

    如何赋能医疗AI模型应用?

    “百模大战”。不仅如此,这些通用AI模型还逐渐渗透各个垂直行业中,其中生命科学和医疗健康行业成为了拓展速度较快的一个领域。从2023年2月至10月初,国内市场上
    的头像 发表于 05-07 09:36 542次阅读
    如何赋能医疗<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>应用?

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、管锴、张心雨。 大模型的普及是近三年来的一件大事,万物皆可大模型
    发表于 05-02 09:26

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    AI的演进正在逼近“终端智能涌现”的拐点,从通用模型向场景落地迁移成为关键议题。联发科以“AI随芯,应用无界”为主题召开天玑开发者大会2025(MDDC 2025),不仅聚合了全球生态
    发表于 04-13 19:52

    AI模型端侧部署正当时:移远端侧AI模型解决方案,激活场景智能新范式

    AI技术飞速发展的当下,AI模型的应用正从云端向端侧加速渗透。 作为全球领先的物联网整体解决方案供应商,移远通信凭借深厚的技术积累与前瞻性的战略布局,在
    发表于 03-27 11:26 444次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>端侧部署正当时:移远端侧<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    AI模型端侧部署正当时:移远端侧AI模型解决方案,激活场景智能新范式

    AI技术飞速发展的当下,AI模型的应用正从云端向端侧加速渗透。作为全球领先的物联网整体解决方案供应商,移远通信凭借深厚的技术积累与前瞻性的战略布局,在
    的头像 发表于 03-26 19:05 1036次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>端侧部署正当时:移远端侧<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    训练好的ai模型导入cubemx不成功怎么处理?

    训练好的ai模型导入cubemx不成功咋办,试了好几个模型压缩了也不行,ram占用过大,有无解决方案?
    发表于 03-11 07:18

    AI模型在汽车应用中的推理、降本与可解释性研究

    佐思汽研发布《2024-2025年AI模型及其在汽车领域的应用研究报告》。 推理能力成为模型性能提升的驱动引擎
    的头像 发表于 02-18 15:02 1878次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>在汽车应用中的推理、降本与可解释性研究

    2024AI开发者中间件工具生态全面总结

    最近,开源中国 OSCHINA、Gitee 与 Gitee AI 联合发布了《2024 中国开源开发者报告》。 报告聚焦 AI模型领域,对过去一年的技术演进动态、技术趋势、以及开源
    的头像 发表于 02-14 09:45 1087次阅读

    2024AI编程技术与工具发展总结

    最近,开源中国 OSCHINA、Gitee 与 Gitee AI  联合发布了《2024 中国开源开发者报告》 。 报告聚焦 AI模型领域,对过去一年的技术演进动态、技术趋势、以及
    的头像 发表于 02-13 09:11 1532次阅读
    <b class='flag-5'>2024</b>年<b class='flag-5'>AI</b>编程技术与工具发展总结

    科技云报到:从大模型云端,“AI+云计算”还能讲出什么新故事

    科技云报到:从大模型云端,“AI+云计算”还能讲出什么新故事
    的头像 发表于 01-07 13:27 623次阅读

    探索智慧实践,洞见AI未来!星宸科技2024开发者大会暨产品发布会成功举办

    在人工智能技术飞速发展的当下,多模态大模型加速向行业深耕,为更大范围满足AI产业创新融合需求,12月20日,星宸科技以“Leading AI Everywhere”为主题的“
    的头像 发表于 12-23 14:34 1460次阅读
    探索智慧实践,洞见<b class='flag-5'>AI</b>未来!星宸科技<b class='flag-5'>2024</b>开发者大会暨产品发布<b class='flag-5'>会成</b>功举办