0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新火种AI | AI发展何去何从?李开复:中美大模型只能存活五六家

新火种 来源:新火种 作者:新火种 2023-12-21 09:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:小岩

编辑:小迪

如果把时间回拨5年,我们会发现,全世界范围内能够进行AI大模型研发的团体,屈指可数。要知道,能够训练大模型的算力设备基本是近3年发布的,而现象级产品ChatGPT的诞生,不过是最近一年的事情。

毕竟,大模型的发展需要极高的门槛,不仅需要强大的算力资源,更需要丰富的数据资源给予支持。大模型时代,离不开大算力,也离不开大数据。

但也就在一年的时间,各式各样,专供大模型的公司和机构如雨后春笋般冒出头。大家开始角力,继而陷入白热化的竞争状态。就连著名AI科学家李开复都表示,未来中美的大模型公司中,能存活下去的只有5、6家。

我们不禁感叹,大模型赛道从“高处不胜寒”到挤兑严重,竟然只需要如此短的时间。

“除了大厂,中美加起来应该可以支撑5、 6家左右”。

12月14日,在一场与AI相关的对话中,零一万物的CEO李开复被问到了一个问题:大模型赛道最终能有几家活下来?对此,李开复也算是知无不言,他认为,除了大厂,中美加起来应该可以支撑五六家左右。

李开复表示,如今来看,做巨大预训练模型的机会正在变少。这个通道不能说是完全关闭了,但势必会越来越难。未来只有在需要新技术的时候,才会出现更多的机会。与此同时,李开复还给出了AI未来的发展方向:AI Infra(人工智能基础框架技术)和AI应用等方面

李开复解释,“做AI应用的机会就是现在,正如10多年前移动互联网所面临的时代一样。较早抓到机会的微信就成功了。当然,后续也有抖音,拼多多等陆续崛起。但一定是越早入局,机会越大。真正有梦想有野心的开发者,应该是要做AI-First(AI优先) ,AI-Native(AI原生)的应用,这些应用才可能成为AI 2.0时代最伟大或是最赚钱的应用”。

事实的确如此。专业性大模型AI的开发竞争激烈,各大公司在训练自家大模型时,还不得不面临巨大的挑战和限制。一方面,大模型的训练需要庞大的计算资源和时间,如果不是大厂或者拥有雄厚的资本支持独角兽,这势必会成为一个难以逾越的壁垒。另一方面,大模型的训练数据需要大量的人工标注和清洗,这个过程专业性极高,复杂而耗时。更重要的是,大模型的应用面临着数据隐私和安全方面的挑战,“如何保护用户数据和防止滥用”是每个大模型开发者都需要考虑清楚,亟待解决的问题。稍有不慎,就会陷入泥潭。

李开复领衔零一万物,发布首款开源中英双语大模型“Yi”。

虽然强调AI大模型即将发展成“红海赛道”,但李开复本人却是赛道里卷的最凶的那个。

作为创新工场的董事长兼CEO,他成立了自己的AI公司“零一万物”。就在上个月,零一万物发布了首款开源中英双语大模型“Yi”。

此次开源发布的Yi系列模型,包含34B和6B两个版本,11月2日,零一万物在Hugging Face上传了这两个参数。据悉,Hugging Face是全球最受欢迎的大模型,数据集开源社区,被认为是大模型领域的GitHub,在大模型英文能力测试中具有相当权威性。

根据Hugging Face英文开源社区平台和C-Eval中文评测所提供的最新榜单,Yi-34B分别在预训练大语言模型和中文大模型榜单C-Eval排行榜爬升到第1位。这也是迄今为止唯一成功登顶 Hugging Face全球开源模型排行榜的国产模型。

wKgZomWDkrGAc5yPAAvii0CaamE383.jpg

与此同时,零一万物新一轮的融资十分顺利,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。李开复在2023年3月创建了零一万物团队,6月开始运营。也就是说,在短短8个月的时间里,零一万物不仅推出了核心产品,更跻身成为估值超10亿美元的“独角兽”。

行业内尽是大厂和“独角兽”,也难怪李开复要感叹大模型赛道竞争激烈了。

大模型Yi全球领跑,旨在打造打造更多的To C Super App。

据了解,Yi-6B和Yi-3B分别代表数据参数量为60亿和340亿,按照李开复的说法,“34B是一个黄金尺寸”。

34B的最大优势在于一方面它不会小到没有涌现或者涌现不够,甚至已经完全达到了涌现的门槛;另一方面,它又没有太大,允许高效率的单卡推理。Yi-34B模型在多项评测基准中全球领跑,基于超强Infra下模型训练成本实测下降40%,模拟千亿规模训练成本则可以下降多达50%。

所谓AI Infra,全称为AI Infrastructure ,即人工智能基础架构技术,主要涵盖大模型训练和部署提供各种底层技术设施,包括处理器操作系统,存储系统,网络基础设施,云计算平台等,是模型训练背后极其关键的“保障技术”。

wKgaomWDkrGAa0poAAYw2ICOwx0728.jpg

​AI Infra是大模型行业发展至今较少被关注到的硬技术领域,但也是十分关键的领域。用李开复的话说,“做过大模型Infra的人比做算法的人才更稀缺”。

对于零一万物而言,因为有了Yi做基础,更多To C端的超级应用才有可能出现。Yi的定位是通用底座,已在 Hugging Face,ModelScope,GitHub 3大全球开源社区平台正式上线。与此同时,Yi系列量化版本,对话模型,数学模型,代码模型,多模态模型等都将很快亮相。

按照李开复的逻辑,AI的技术壁垒终将会被一个个的攻破,对于AI公司来说,可持续,可增长的盈利才是要紧事,无法商业化的公司终将被淘汰。在AI 2.0时代,最大的商机一定是来自超级应用,而且是消费者级别的,诸如抖音,微信一样的超级应用。

目前,零一万物已经启动100B以上参数规模的模型训练,而多模态大模型团队也已经集结了10多个人,说明零一万物将朝着“消费级应用”的方向努力。而这些,恰恰与李开复所说的“AI Infra和AI应用才是未来”的理念,不谋而合。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38120

    浏览量

    296661
  • 大模型
    +关注

    关注

    2

    文章

    3442

    浏览量

    4967
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、现阶段更智能、更接近AGI的6中算法与模型 1、MoE模型 MoE模型作为Transfomer模型的后继者,代表着AI技术的一项重大创新和
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    流体芯片 ⑤AI计算平台 ⑥基于AI的自主决策系统 ⑦基于AI的自主学习系统 2、面临的挑战 ①需要造就一个跨学科、全面性覆盖的知识库和科学基础模型 ②需要解决信息不准确和认知偏差问题
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升算力还是智力

    本章节作者分析了下AI的未来在哪里,就目前而言有来那个两种思想:①继续增加大模型②将大模型改为小模型,并将之优化使之与大模型性能不不相上下。
    发表于 09-14 14:04

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    当今社会,AI已经发展很迅速了,但是你了解AI发展历程吗?本章作者将为我们打开AI发展历程以
    发表于 09-12 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑在本质上就是一台湿润的软组织
    发表于 09-06 19:12

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    是展望未来的AGI芯片,并探讨相关的发展和伦理话题。 各章的目录名称如下: 第1章 大模型浪潮下,AI芯片的需求与挑战免费 第2章 实现深度学习AI芯片的创新方法与架构 第3章
    发表于 09-05 15:10

    ai_cube训练模型最后部署失败是什么原因?

    ai_cube训练模型最后部署失败是什么原因?文件保存路径里也没有中文 查看AICube/AI_Cube.log,看看报什么错?
    发表于 07-30 08:15

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    计算、神经符号计算,终身学习与迁移学习。 此外,书中提出“小模型替代大模型”的思路,通过强化学习、指令调整、合成数据等技术,在降低算力消耗的同时保持智能水平,为AI算法的可持续发展提供
    发表于 07-28 13:54

    Nordic收购 Neuton.AI 关于产品技术的分析

    Nordic Semiconductor 于 2025 年收购了 Neuton.AI,这是一专注于超小型机器学习(TinyML)解决方案的公司。 Neuton 开发了一种独特的神经网络框架,能够
    发表于 06-28 14:18

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    模型库的限制,联发科还首发了开源弹性架构。区别于过往的开放接口,只能部署特定架构模型,开放弹性架构允许开发者直接调整平台源代码,无需等待芯片厂商的支持,即可完成目标或其他自研大模型轻松
    发表于 04-13 19:52

    训练好的ai模型导入cubemx不成功怎么处理?

    训练好的ai模型导入cubemx不成功咋办,试了好几个模型压缩了也不行,ram占用过大,有无解决方案?
    发表于 03-11 07:18

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    开发一个视频内容生成Agent。 访问语聚AI平台官网 ,进行注册或登录。 在平台首页,了解语聚AI的功能和应用场景,特别是其支持的视频生成相关的AI模型和工具。 在语聚
    发表于 03-05 19:52

    霍尔电流传感器的原边端如何接入AI模型

    霍尔电流传感器的原边端如何接入AI模型,以便AI分析问题解决问题?话题会不会太超前?现在正式AI风口啊,猪都要起飞了
    发表于 03-03 15:18

    AI赋能边缘网关:开启智能时代的新蓝海

    。这一变革不仅带来了技术架构的革新,更为产业发展开辟了新的增长空间。 传统边缘网关受限于计算能力和算法支持,往往只能完成数据采集和简单处理,大量原始数据需要回传云端处理,导致响应延迟和带宽压力。AI技术
    发表于 02-15 11:41