0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型卷价格,向量数据库“卷”什么?

脑极体 来源:脑极体 作者:脑极体 2024-05-23 09:24 次阅读

“不是我不明白,这世界变化快”,崔健在20世纪写下的这句歌词,放在公有云市场也同样适用。技术风向的变化之快,让不少人感到惊讶。

2023年初大模型、生成式 AI的起飞,也带来了向量数据库的爆火。投融资项目爆发式增长,头部公有云厂商都推出了AI向量数据库的相关产品

然而一年狂飙之后,市场逐渐退潮,全球最著名的 AI 项目之一AutoGPT在2024年初宣布,不再使用向量数据库。因此有人质疑,向量数据库又凉了?

不过,随着5月份公有云厂商们掀起价格战,接连调低大模型API的价格,高性价比的大模型+向量数据库,在行业应用、企业市场又显现出了一定的商业价值。

向量数据库这一年的潮起潮落,究竟是火了还是凉了?大模型正在卷价格,向量数据库又该卷什么?公有云厂商又在这一市场发挥了什么作用?今天我们就来聊聊这些问题。

向量数据库,刚刚开始

新技术的火爆,必然会伴随炒作和泡沫,但向量作为大模型理解世界的数据形式,向量数据库作为AI革命重要基建的位置,长期来看是不会动摇的。

为什么这么说?

向量数据库并不是一种特别新的数据库技术,在AI领域已经应用了七八年,谷歌在2015年就宣布使用RankBrain语义检索来处理搜索任务。如果说数据库是数据的“硬盘”,那么,向量数据库就是更适合AI体质的“硬盘”。

其“AI原生”的体质,具体表现在几个方面:

1.更高的效率。AI算法,要从图像、音频和文本等海量的非结构化数据中学习,提取出以向量为表示形式的“特征”,以便模型能够理解和处理。因此,向量数据库比传统基于索引的数据库有明显优势。

2.更低的成本。大模型要从一种新技术转化为产业价值,必须达到合理的投入产出比,而向量数据库可以有效减少存储和计算成本。一个公开数据是,通过腾讯云向量数据库,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%,就在于检索效率、运行稳定性、运营效率、推荐算法等,有了较大的提升。

3.更强的数据安全。有企业直言:“沉淀了几十年的内部数据是我的核心竞争力,让我无偿去公开给大模型做训练,我肯定不愿意。”想做大模型,还要确保数据的隐私安全,就必须与数据库产品做好配合,这给向量数据库的本地部署带来了广阔的需求。

4.更大的扩展性。随着大模型走向行业应用,垂直领域的AI用例不断增多,汹涌的数据洪潮和存算任务,会带来大量向量搜索的需求。而向量数据库嵌入向量的长度不受限制,具有良好的扩展性,可以根据AI用例和模型而变化,更好地处理大规模数据集。

从大模型技术标杆的OpenAI发布的GPT-4o和即将发布的GPT-5消息来看,以及国内外商业化大模型的进展来看,大模型的技术路线还没有发生颠覆性的变革,因此落地应用还是需要向量检索和向量数据库。

由此可以肯定,向量数据库市场必然还会迎来一轮增长。趋于冷静,只是2023年热情过度高涨的适当回调。

两大新势力,云是方向

据东北证券预测,到2030年,全球向量数据库市场规模有望达到 500 亿美元,国内向量数据库市场规模有望超过600亿人民币。向量数据库市场吸引了“群雄逐鹿”,从引爆到饱和,进展迅猛,

传统数据库厂商不必多说,既有相应的能力建设,也有一定的客户基础,推出相关产品是必然。一些在AI领域积淀已久的科技大厂,如谷歌、微软、Meta、百度等大厂,都有向量数据库的技术积累,也都可以向外输出相关能力和产品。

除了这些常规面孔,向量数据库市场也吸引了新的参与者。

作为这一轮大模型投资热和创业热的主要目标之一,向量数据库领域诞生了不少创新创业公司。比如AI创业新秀Pinecone就是闭源的领跑者,凭借良好的开箱即用的产品体验,获得了非常大的增长,B轮估值达到7.5亿美元。其他竞争者大多建立在开源项目的基础上。

wKgaomZN6zqASh3_AAEdKosVPYA445.jpg

不过,作为创业公司,长期盈利能力还有待验证。一个主要原因,是客户大多是尝鲜、实验性质。

企业需要先将非结构化的私密数据,进行一个小的模型,进行向量化,产生一个向量的矩阵,再存储到向量数据库里,来供大模型学习和检索。这个过程涉及大量的工程化,会耗费企业许多开发人员、时间成本,一开始可能会因为AI大模型很火而对向量数据库产生兴趣,但能否真正在业务中落地还是个未知数。因此,长期付费意愿还有较大的不确定性。

另一股积极参与的新势力,就是公有云厂商。

不是所有企业都有能力自建大模型所需要的基础设施,通过MaaS(模型即服务)业务来训练应用大模型,是更灵活的选择。此外,很多政企客户往往会选择公有云或行业云来满足其业务需求,对云数据库的关注度和接受度上升,而这些用户在探索大模型时,会倾向于以整体解决方案的形式来交付,这就给了云厂商参与游戏的机会,同时也要求云厂商提供向量数据库的全栈支持。

如今头部云厂商基本建立了全生命周期AI化的向量数据库。有数据显示,企业原先接入一个大模型需要花1个月左右时间,使用某公有云的向量数据库后,3天时间即可完成,极大降低了企业的接入成本。

更何况,前不久火山引擎、阿里云、百度智能云等都围绕大模型API价格,打起了互相抄底的“价格战”,意味着AI创新门槛的降低,而AI应用市场的用户规模扩大,也会带动向量数据库的使用需求。

综上,整个云AI市场的格局还在快速变化之中,风物长宜放眼量,AI Native的向量数据库,前景仍然值得期待。

接下来,向量数据库卷什么?

有人可能会问了,大模型开始卷价格,那向量数据库市场正在卷什么?

需要注意的是,大模型降价是以云厂商为主,而零一万物等创业公司已经明确表示会以技术创新为竞争力,而不会(与云厂商)对标价格。云厂商在AI基础设施、商业生态、市场规模效应上的既定优势,确实也会表现在向量数据库市场。

目前来看,公有云厂商有几重特殊优势,或许会让向量数据库加速走向商业成功:

  1. 多元化部署。垂直行业大模型,数据都是私有机密的,客户一般不愿意放到公有云上,这对一部分支持混合多云的云厂商是一大利好,通过私有部署、分布式、混合云等多种方案,打消行业客户将数据放到云端的现实疑虑。

2.一体化AI能力。向量数据库的火爆,本质是由AI驱动的,而AI Native时代的数据工程,还有许多复杂问题尚待解决,比如检索效率,在处理大规模数据的并行任务时,保持快速响应时间是一个挑战,需要优化索引结构和搜索算法;高负载下的系统稳定性,需要确保数据库系统具备高可用性和容错能力,防止服务中断;存储海量的向量数据,成本效益比要进一步优化……目前来看,云厂商具备从底层算力集群、Maas模型平台到全栈工具链的AI能力,有望通过技术协同创新,持续优化向量数据库的性能和成本。

3.产业服务能力。各行业对AI与业务的结合热情高涨,但大多还处于尝试探索期,需要结合自身场景、AI应用、IT设施等多种因素试错并迭代。这个过程中,随叫随到、帮助客户及时解决问题的ToB服务能力,也是非常看重的。深耕产业的公有云,有望降低很多企业在AI技术革命中的机会成本。

有人说,AI云市场越来越卷了,随着大模型性能边际效益不断走低,云厂商不得不用低价换规模。但有句话:“东方不亮西方亮,黑了南方有北方。”只要公有云厂商在AI领域的产品阵营足够庞大,用多元化综合优势锁定用户,那么即使大模型收益下降,在商业回报上也不愁没有回旋的余地。

从这个角度看,或许公有云市场下一个卷起来的,就是向量大模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3627

    浏览量

    63672
  • 向量
    +关注

    关注

    0

    文章

    55

    浏览量

    11605
  • 大模型
    +关注

    关注

    2

    文章

    1822

    浏览量

    1414
收藏 人收藏

    评论

    相关推荐

    通过Modbus读写数据库中的数据

    本文是将数据库数据转为Modbus服务端/从站,实现数据库内的数据也可以走Modbus协议通过网口或串口读写的案例,下图是通过智能网关的参数软件(在附件中)配置的参数: 上图中的配置
    发表于 03-14 13:44

    腾讯云把向量数据库“卷”到哪一步了?

    被大模型“带飞”这一年,向量数据库才刚刚写下序言
    的头像 发表于 01-15 09:49 1374次阅读
    腾讯云把<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>“卷”到哪一步了?

    诚邀报名 | AI 向量、云原生、开源,今年的数据库热点技术都在这里

    2023 开放原子开发者大会 OPEN ATOM DEVELOPERS CONFERENCE AI 时代数据库存储管理新挑战分论坛 2023.12.16 随着 AI 大模型的广泛应用和普及,其模型
    的头像 发表于 12-20 20:48 223次阅读
    诚邀报名 | AI <b class='flag-5'>向量</b>、云原生、开源,今年的<b class='flag-5'>数据库</b>热点技术都在这里

    诚邀报名 | AI 向量、云原生、开源,今年的数据库热点技术都在这里

    2023开放原子开发者大会 . OPENATOM DEVELOPERS CONFERENCE AI时代数据库存储管理新挑战分论坛 2023.12.16 随着AI大模型的广泛应用和普及,其模型训练
    的头像 发表于 12-13 16:05 183次阅读

    一文解析向量数据库的大模型之路

    数据在 MaaS 时代很重要,市场的火热映射到具体的企业行为上,表现为大批量垂直模型的推出、数据库企业融资数量增加、数据库使用量陡然增长等。
    发表于 11-17 11:37 320次阅读
    一文解析<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>的大<b class='flag-5'>模型</b>之路

    元件数据库

    软件可以识别设备的元件数据库就好了,我们公司的机器数据都是用物料编码建立的
    发表于 11-16 14:39

    探寻向量数据库爆火的真相,Zilliz 技术合伙人带你解惑

    模型时代的到来将向量数据库的热度推向了高点,在此氛围下,有人发出了哲学家般的一问:究竟是大模型选择了向量
    的头像 发表于 09-28 11:40 378次阅读
    探寻<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>爆火的真相,Zilliz 技术合伙人带你解惑

    什么是向量数据库?关系数据库向量数据库之间的区别是什么?

    向量数据库是一种以向量嵌入(高维向量)方式存储和管理非结构化数据(如文本、图像或音频)的数据库
    的头像 发表于 08-16 10:13 1458次阅读
    什么是<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>?关系<b class='flag-5'>数据库</b>和<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>之间的区别是什么?

    向量数据库:AI时代的下一个热点

    AI大模型带火了向量数据库
    的头像 发表于 08-08 22:45 304次阅读

    数据库的概念模型设计(2)#数据库

    数据库
    未来加油dz
    发布于 :2023年07月18日 17:55:32

    数据库的概念模型设计(1)#数据库

    数据库
    未来加油dz
    发布于 :2023年07月18日 17:55:07

    数据库数据模型设计(2)#数据库

    数据库
    未来加油dz
    发布于 :2023年07月18日 17:54:39

    数据库数据模型设计(1)#数据库

    数据库
    未来加油dz
    发布于 :2023年07月18日 17:53:59

    开源铸剑,五载匠心!Zilliz Cloud云服务盛装登场,引领向量数据库云时代!

    2023 年注定是属于大模型向量数据库的巅峰时刻。国内大模型的发展也迎来前所未有之机遇,“百模”激战正酣。在刚闭幕的世界人工智能大会上,国内外科技公司全线加入,三十余款大
    的头像 发表于 07-13 10:44 218次阅读

    向量数据库是如何工作的?

    向量数据库和 Embedding 是当前 AI 领域的热门话题。
    的头像 发表于 06-18 11:06 631次阅读
    <b class='flag-5'>向量</b><b class='flag-5'>数据库</b>是如何工作的?