0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zilliz携手大模型生态企业玩转GDC 2024,向量数据库和RAG成行业焦点

焦点讯 来源:焦点讯 作者:焦点讯 2024-03-26 11:14 次阅读

3 月 23 日-24 日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的 2024 全球开发者先锋大会(2024 GDC)在上海举办。Zilliz 作为向量数据库赛道的领军者,受邀参与了此次活动,不仅在不同形式的活动中进行了 3 场主题分享,还与百川智能、Dify.AI、Moonshot AI 等公司一同在「大模型展示及研讨专区」的产品互动展台,与来自各地的开发者进行互动。

wKgaomYCPY6AHc8YAAMZpAKZvbM072.png

据悉,本次大会由世界人工智能大会组委会、上海市经济和信息化委员会、上海市徐汇区人民政府、中国(上海)自由贸易试验区临港新片区管理委员会共同指导,上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会共同主办。

全球开发者先锋大会(GDC)缘起总.理在达沃斯世界经济论坛打 CALL 的世界人工智能大会(WAIC),作为 WAIC 聚焦科技和人才力量的重要板块,GDC 已发展成为全球开发者的盛大节日、顶尖技术趋势的风向标。向量数据库赛道正是 AIGC 时代的重要技术风向标,Zilliz 在现场向全球的开发者展示了其在顶尖向量数据库技术的多重探索。

wKgZomYCPY-AaaWkAAPdw8NrQMQ787.png

Zilliz 资深解决方案架构师沈亮以《百亿级向量数据库架构创新与优化之路》的主题进行了分享。他表示,向量数据库最早诞生于 2019 年,由 Zilliz 公司推出并开源了全球首款向量数据库 Milvus。在那个时期,向量数据库的功能相对比较简单,主要是基于向量检索库 Faiss 的基础上,封装了远程过程调用(RPC)接口,并支持了基于 Write-Ahead Logging(WAL)的持久化能力。相比于传统的向量检索方法,Milvus 1.0 的最大意义在于解耦了业务逻辑、模型和数据存储这三者之间的紧密关联。这意味着应用开发者不再需要关注底层基础设施的维护工作,这些工作包括但不限于集群的部署、数据的持久化和数据的迁移等。因此,Milvus 1.0 为许多用户提供了从传统烟囱式的人工智能开发模式向大模型时代。

随着大模型技术的蓬勃发展,向量数据库开始进入 2.0 时代,更多的个人开发者涌入赛道,对向量数据库的关注也逐渐迁移到开发效率、部署简单以及面向大模型加强场景的功能需求。向量数据库绝不仅仅是用来进行简单的向量检索,要想真正提升开发者的开发效率和使用成本,需要系统开发者深入理解硬件、存储、数据库、AI、高性能计算、分布式系统、编译原理、云原生等,以确保其稳定性、性能和易用性。在此基础上,Zilliz 推出了Zilliz Cloud,可提供全托管的 SaaS 及 BYOC 向量数据库服务,具备深度优化、开箱即用的 Milvus 体验。使用 Zilliz Cloud 可以轻松构建百亿级向量数据库,分钟级部署和扩展向量搜索服务,并由全球最专业的向量数据库团队提供运维、优化、及综合支持。

wKgaomYCPZCAbLk4AAHDzlWM3oY956.png

Zilliz 开发者生态及市场运营负责人 Jerry 首先进行了主题为《走进向量数据库和 RAG ——让 LLMs 停止幻觉》的分享。Jerry 表示,过去一年,RAG 在技术层面发展迅速,为向量数据库赛道添了一把火。RAG 和向量数据库的结合,能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题。

具体来看,大模型的局限性包括:其一,缺乏领域特定信息:LLM 仅基于公开数据集训练;缺乏领域特定信息或专有信息等非公开数据。其二,容易产生幻觉:LLM 只能根据其现有数据提供信息和答案;如果超过该范围,LLM 会提供错误或捏造的信息。其三,无法获取最新信息:LLM 训练成本十分高昂,无法及时更新其知识库。其四,不变的预训练数据:LLM 使用的预训练数据可能包含过时或不正确的信息,且这些数据无法更正或删除。

向量数据库可有效针对解决上述问题,例如针对缺乏领域特定信息的问题,可利用向量数据库建立知识库,拓展认知边界;针对无法获取最新信息的问题,可以利用向量数据库为大模型建立记忆、及时更新。

在此基础上,RAG 技术栈应运而生,通过 LLM、向量数据库和提示词的相互配合,让 LLM 停止幻觉。此外,Jerry 还介绍了向量数据库的其他应用场景,包括图片搜索、视频搜索、文本搜索、数据去重、跨模态搜索、推荐系统、问答系统、版权保护、网络安全、AI 制药等。

wKgZomYCPZGAHV1IAACJgAApsvA693.png

在《2024 年,重新再来说说关于向量数据库的那些事儿》主题分享中,Jerry 回顾了向量数据库从小众赛道到爆火的全过程,并提及了外界对于向量数据库和 RAG 的疑问。他表示,大模型技术正在改变世界,但无法改变世界的运行规律。对于大模型而言,长期记忆的重要性也将持续存在。AI 应用的开发者一直在追求查询质量和成本之间的完美平衡。当大型企业将生成式人工智能投入生产时,需要在控制成本的同时保持最佳的响应质量。在此情况下,RAG 技术和向量数据库依然是实现这一目标的重要工具。

最后,Jerry 提到,Zilliz 最近面向 AI 初创企业推出了一项扶持计划,预计提供总计 1000 万元的 Zilliz Cloud 抵扣金,致力于帮助 AI 开发者构建高效的非结构化数据管理系统,助力打造高质量 AI 服务与运用,加速产业落地。届时将为全球的 AI 初创团队提供资源、技术、市场推广、销售等全方位的支持,符合要求的团队可获得独家资源与支持。欢迎各位开发者访问 Zilliz 中文官网首页点击 Zilliz AI 初创计划,与 Zilliz 一起共建 AI 生态!

审核编辑 黄宇


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3591

    浏览量

    63369
  • 大模型
    +关注

    关注

    2

    文章

    1516

    浏览量

    1102
收藏 人收藏

    评论

    相关推荐

    什么是RAGRAG学习和实践经验

    高级的RAG能很大程度优化原始RAG的问题,在索引、检索和生成上都有更多精细的优化,主要的优化点会集中在索引、向量模型优化、检索后处理等模块进行优化
    的头像 发表于 04-24 09:17 81次阅读
    什么是<b class='flag-5'>RAG</b>,<b class='flag-5'>RAG</b>学习和实践经验

    搭载英伟达GPU,全球领先的向量数据库公司Zilliz发布Milvus2.4向量数据库

    在美国硅谷圣何塞召开的 NVIDIA GTC 大会上,全球领先的向量数据库公司 Zilliz 发布了 Milvus 2.4 版本。这是一款革命性的向量
    的头像 发表于 04-01 14:33 124次阅读
    搭载英伟达GPU,全球领先的<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>公司<b class='flag-5'>Zilliz</b>发布Milvus2.4<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>

    与NVIDIA深度参与GTC,向量数据库大厂Zilliz与全球顶尖开发者共迎AI变革时刻

    近日,备受关注的 NVIDIA GTC 已拉开序幕。来自世界各地的顶尖 AI 开发者齐聚美国加州圣何塞会议中心,共同探索行业未来,全球领先的向量数据库公司 Zilliz 也不例外。作为
    的头像 发表于 03-26 11:01 145次阅读

    一文解析向量数据库的大模型之路

    数据在 MaaS 时代很重要,市场的火热映射到具体的企业行为上,表现为大批量垂直模型的推出、数据库企业融资数量增加、
    发表于 11-17 11:37 256次阅读
    一文解析<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>的大<b class='flag-5'>模型</b>之路

    吸引数万名开发者参会!2023云栖大会现场,向量数据库公司Zilliz成关注焦点

    大会的主题为“计算,为了无法计算的价值”,共吸引了全球 44 个国家和地区的 8 万多人参加,可谓 AI 时代最受关注的盛会之一。 作为全球最受欢迎的开源向量数据库 Milvus 背后的商业公司,Zilliz 在本次云栖大会上受
    的头像 发表于 11-13 14:57 439次阅读
    吸引数万名开发者参会!2023云栖大会现场,<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>公司<b class='flag-5'>Zilliz</b>成关注<b class='flag-5'>焦点</b>

    英特尔携手星环科技联合发布AIGC向量数据库解决方案

    近日,英特尔与星环科技在2023中国国际进口博览会上,联合发布了AIGC向量数据库解决方案,旨在支持多样化机器学习模型生成的海量向量数据,满
    的头像 发表于 11-11 15:24 579次阅读

    全球首款支持 8K(8192)输入长度的开源向量模型发布

    在大模型时代,向量模型的重要性进一步增强。尤其是在检索增强生成(RAG)场景中,它成为了一个核心组件,用于解决大模型的上下文长度限制、幻觉问
    的头像 发表于 11-02 14:53 393次阅读
    全球首款支持 8K(8192)输入长度的开源<b class='flag-5'>向量</b><b class='flag-5'>模型</b>发布

    探寻向量数据库爆火的真相,Zilliz 技术合伙人带你解惑

    模型时代的到来将向量数据库的热度推向了高点,在此氛围下,有人发出了哲学家般的一问:究竟是大模型选择了向量
    的头像 发表于 09-28 11:40 324次阅读
    探寻<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>爆火的真相,<b class='flag-5'>Zilliz</b> 技术合伙人带你解惑

    什么是向量数据库?关系数据库向量数据库之间的区别是什么?

    向量数据库是一种以向量嵌入(高维向量)方式存储和管理非结构化数据(如文本、图像或音频)的数据库
    的头像 发表于 08-16 10:13 1295次阅读
    什么是<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>?关系<b class='flag-5'>数据库</b>和<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>之间的区别是什么?

    向量数据库:AI时代的下一个热点

    AI大模型带火了向量数据库
    的头像 发表于 08-08 22:45 273次阅读

    开源铸剑,五载匠心!Zilliz Cloud云服务盛装登场,引领向量数据库云时代!

    2023 年注定是属于大模型向量数据库的巅峰时刻。国内大模型的发展也迎来前所未有之机遇,“百模”激战正酣。在刚闭幕的世界人工智能大会上,国内外科技公司全线加入,三十余款大
    的头像 发表于 07-13 10:44 192次阅读

    北美有的,中国也有了!Zilliz Cloud向量数据库云服务重磅登场

    Milvus自2019年正式开源以来,已经成长为全球最大、最活跃的向量数据库开源项目与开发者社区。作为Milvus背后的开发者与运营者,Zilliz一直走在向量
    的头像 发表于 07-12 16:30 540次阅读
    北美有的,中国也有了!<b class='flag-5'>Zilliz</b> Cloud<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>云服务重磅登场

    行业 DBA 走进华为,共建数据库生态

    ,旨在分享华为自身 GaussDB 数据库经验,帮助客户用好数据库,与伙伴建立深度合作,共同打造数据库生态,推动数据库在更多
    的头像 发表于 06-30 09:50 316次阅读
    <b class='flag-5'>行业</b> DBA 走进华为,共建<b class='flag-5'>数据库</b><b class='flag-5'>生态</b>

    向量数据库是如何工作的?

    向量数据库和 Embedding 是当前 AI 领域的热门话题。
    的头像 发表于 06-18 11:06 568次阅读
    <b class='flag-5'>向量</b><b class='flag-5'>数据库</b>是如何工作的?

    行业 DBA 走进华为,共建数据库生态

    积极参与,旨在分享华为自身 GaussDB 数据库经验,帮助客户用好数据库,与伙伴建立深度合作,共同打造数据库生态,推动国产数据库
    的头像 发表于 06-05 10:32 668次阅读
    <b class='flag-5'>行业</b> DBA 走进华为,共建<b class='flag-5'>数据库</b><b class='flag-5'>生态</b>