0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zilliz携手大模型生态企业玩转GDC 2024,向量数据库和RAG成行业焦点

焦点讯 来源:焦点讯 作者:焦点讯 2024-03-26 11:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

3 月 23 日-24 日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的 2024 全球开发者先锋大会(2024 GDC)在上海举办。Zilliz 作为向量数据库赛道的领军者,受邀参与了此次活动,不仅在不同形式的活动中进行了 3 场主题分享,还与百川智能、Dify.AI、Moonshot AI 等公司一同在「大模型展示及研讨专区」的产品互动展台,与来自各地的开发者进行互动。

wKgaomYCPY6AHc8YAAMZpAKZvbM072.png

据悉,本次大会由世界人工智能大会组委会、上海市经济和信息化委员会、上海市徐汇区人民政府、中国(上海)自由贸易试验区临港新片区管理委员会共同指导,上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会共同主办。

全球开发者先锋大会(GDC)缘起总.理在达沃斯世界经济论坛打 CALL 的世界人工智能大会(WAIC),作为 WAIC 聚焦科技和人才力量的重要板块,GDC 已发展成为全球开发者的盛大节日、顶尖技术趋势的风向标。向量数据库赛道正是 AIGC 时代的重要技术风向标,Zilliz 在现场向全球的开发者展示了其在顶尖向量数据库技术的多重探索。

wKgZomYCPY-AaaWkAAPdw8NrQMQ787.png

Zilliz 资深解决方案架构师沈亮以《百亿级向量数据库架构创新与优化之路》的主题进行了分享。他表示,向量数据库最早诞生于 2019 年,由 Zilliz 公司推出并开源了全球首款向量数据库 Milvus。在那个时期,向量数据库的功能相对比较简单,主要是基于向量检索库 Faiss 的基础上,封装了远程过程调用(RPC)接口,并支持了基于 Write-Ahead Logging(WAL)的持久化能力。相比于传统的向量检索方法,Milvus 1.0 的最大意义在于解耦了业务逻辑、模型和数据存储这三者之间的紧密关联。这意味着应用开发者不再需要关注底层基础设施的维护工作,这些工作包括但不限于集群的部署、数据的持久化和数据的迁移等。因此,Milvus 1.0 为许多用户提供了从传统烟囱式的人工智能开发模式向大模型时代。

随着大模型技术的蓬勃发展,向量数据库开始进入 2.0 时代,更多的个人开发者涌入赛道,对向量数据库的关注也逐渐迁移到开发效率、部署简单以及面向大模型加强场景的功能需求。向量数据库绝不仅仅是用来进行简单的向量检索,要想真正提升开发者的开发效率和使用成本,需要系统开发者深入理解硬件、存储、数据库、AI、高性能计算、分布式系统、编译原理、云原生等,以确保其稳定性、性能和易用性。在此基础上,Zilliz 推出了Zilliz Cloud,可提供全托管的 SaaS 及 BYOC 向量数据库服务,具备深度优化、开箱即用的 Milvus 体验。使用 Zilliz Cloud 可以轻松构建百亿级向量数据库,分钟级部署和扩展向量搜索服务,并由全球最专业的向量数据库团队提供运维、优化、及综合支持。

wKgaomYCPZCAbLk4AAHDzlWM3oY956.png

Zilliz 开发者生态及市场运营负责人 Jerry 首先进行了主题为《走进向量数据库和 RAG ——让 LLMs 停止幻觉》的分享。Jerry 表示,过去一年,RAG 在技术层面发展迅速,为向量数据库赛道添了一把火。RAG 和向量数据库的结合,能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题。

具体来看,大模型的局限性包括:其一,缺乏领域特定信息:LLM 仅基于公开数据集训练;缺乏领域特定信息或专有信息等非公开数据。其二,容易产生幻觉:LLM 只能根据其现有数据提供信息和答案;如果超过该范围,LLM 会提供错误或捏造的信息。其三,无法获取最新信息:LLM 训练成本十分高昂,无法及时更新其知识库。其四,不变的预训练数据:LLM 使用的预训练数据可能包含过时或不正确的信息,且这些数据无法更正或删除。

向量数据库可有效针对解决上述问题,例如针对缺乏领域特定信息的问题,可利用向量数据库建立知识库,拓展认知边界;针对无法获取最新信息的问题,可以利用向量数据库为大模型建立记忆、及时更新。

在此基础上,RAG 技术栈应运而生,通过 LLM、向量数据库和提示词的相互配合,让 LLM 停止幻觉。此外,Jerry 还介绍了向量数据库的其他应用场景,包括图片搜索、视频搜索、文本搜索、数据去重、跨模态搜索、推荐系统、问答系统、版权保护、网络安全、AI 制药等。

wKgZomYCPZGAHV1IAACJgAApsvA693.png

在《2024 年,重新再来说说关于向量数据库的那些事儿》主题分享中,Jerry 回顾了向量数据库从小众赛道到爆火的全过程,并提及了外界对于向量数据库和 RAG 的疑问。他表示,大模型技术正在改变世界,但无法改变世界的运行规律。对于大模型而言,长期记忆的重要性也将持续存在。AI 应用的开发者一直在追求查询质量和成本之间的完美平衡。当大型企业将生成式人工智能投入生产时,需要在控制成本的同时保持最佳的响应质量。在此情况下,RAG 技术和向量数据库依然是实现这一目标的重要工具。

最后,Jerry 提到,Zilliz 最近面向 AI 初创企业推出了一项扶持计划,预计提供总计 1000 万元的 Zilliz Cloud 抵扣金,致力于帮助 AI 开发者构建高效的非结构化数据管理系统,助力打造高质量 AI 服务与运用,加速产业落地。届时将为全球的 AI 初创团队提供资源、技术、市场推广、销售等全方位的支持,符合要求的团队可获得独家资源与支持。欢迎各位开发者访问 Zilliz 中文官网首页点击 Zilliz AI 初创计划,与 Zilliz 一起共建 AI 生态!

审核编辑 黄宇


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3993

    浏览量

    67745
  • 大模型
    +关注

    关注

    2

    文章

    3455

    浏览量

    4974
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025构建高性能AI应用

    在 Microsoft Ignite 2025 大会上,随着 Microsoft SQL Server 2025 的发布,AI 就绪型企业数据库愿景成为现实,为开发者提供强大的新工具,例如内置向量
    的头像 发表于 12-01 09:31 380次阅读
    使用NVIDIA Nemotron <b class='flag-5'>RAG</b>和Microsoft SQL Server 2025构建高性能AI应用

    RAG实践:一文掌握大模型RAG过程

    RAG(Retrieval-Augmented Generation,检索增强生成), 一种AI框架,将传统的信息检索系统(例如数据库)的优势与生成式大语言模型(LLM)的功能结合在一起。不再
    的头像 发表于 10-27 18:23 1172次阅读
    <b class='flag-5'>RAG</b>实践:一文掌握大<b class='flag-5'>模型</b><b class='flag-5'>RAG</b>过程

    企业级MySQL数据库管理指南

    在当今数字化时代,MySQL作为全球最受欢迎的开源关系型数据库,承载着企业核心业务数据的存储与处理。作为数据库管理员(DBA),掌握MySQL的企业
    的头像 发表于 07-09 09:50 523次阅读

    milvus向量数据库的主要特性和应用场景

    Milvus 是一个开源的向量数据库,专门为处理和分析大规模向量数据而设计。它适用于需要高效存储、检索和管理向量
    的头像 发表于 07-04 11:36 753次阅读
    milvus<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>的主要特性和应用场景

    数据库数据恢复—SQL Server数据库被加密如何恢复数据

    SQL Server数据库故障: SQL Server数据库被加密,无法使用。 数据库MDF、LDF、log日志文件名字被篡改。
    的头像 发表于 06-25 13:54 515次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server<b class='flag-5'>数据库</b>被加密如何恢复<b class='flag-5'>数据</b>?

    MySQL数据库是什么

    开发、企业应用和大数据场景。以下是其核心特性和应用场景的详细说明: 核心特性 关系型数据库模型 数据以 表(Table) 形式组织,表由行(
    的头像 发表于 05-23 09:18 924次阅读

    《AI Agent 应用与项目实战》阅读心得3——RAG架构与部署本地知识

    RAG技术建立在向量数据库的基础上,通过高维向量空间中的相似度计算来实现语义层面的匹配,这比传统的关键词搜索更能捕捉文本的深层语义关联。 第七章通过一个本地知识
    发表于 03-07 19:49

    Labview Access数据库 查询日期范围

    Labview Access数据库 查询日期范围 where date1 >#2024-12-12# AND date1 <#2025-1-12#
    发表于 02-20 08:57

    【「基于大模型RAG应用开发与优化」阅读体验】RAG基本概念

    RAG应用架构具备清晰的分层设计。知识构建层,着重于将各类非结构化数据进行有效处理,转化为计算机能够理解的形式,通过向量化编码技术为数据
    发表于 02-08 00:22

    【「基于大模型RAG应用开发与优化」阅读体验】+第一章初体验

    3降低幻觉风险:通过引入权威数据源(如学术论文、企业文档),RAG为生成过程提供“事实锚点”,减少模型虚构内容的可能性。 4轻量化部署:开发者无需频繁微调大
    发表于 02-07 10:42

    【「基于大模型RAG应用开发与优化」阅读体验】+Embedding技术解读

    今天学习大模型RAG 检索增强生成技术Embedding,即嵌入,是一种将离散数据(如文字、图像、音频等)转换为连续的密集向量表示的技术。这些向量
    发表于 01-17 19:53

    数据库是哪种数据库类型?

    数据库是一种部署在虚拟计算环境中的数据库,它融合了云计算的弹性和可扩展性,为用户提供高效、灵活的数据库服务。云数据库主要分为两大类:关系型数据库
    的头像 发表于 01-07 10:22 813次阅读

    数据库加密办法

    企业对于数据的重视程度不言而喻,也衍生出了数据=资产的概念。但是数据泄漏的事件频繁发生,为了保护数据资产,
    的头像 发表于 12-24 09:47 1016次阅读

    金仓数据库四项成果入选2024星河案例

    、新疆电信、河南移动联合申报的四个实践案例全部入围,分别荣获数据库专项典型案例和潜力案例,成为本届入围案例数量最多的数据库厂商,充分彰显出电科金仓的科技实力与行业领先性。 大数据“星河
    的头像 发表于 12-23 09:16 740次阅读

    数据库数据恢复—Mysql数据库表记录丢失的数据恢复流程

    Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分
    的头像 发表于 12-16 11:05 1003次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—Mysql<b class='flag-5'>数据库</b>表记录丢失的<b class='flag-5'>数据</b>恢复流程