0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

北美有的,中国也有了!Zilliz Cloud向量数据库云服务重磅登场

OSC开源社区 来源:OSC开源社区 2023-07-12 16:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年注定是属于大模型和向量数据库的巅峰时刻。国内大模型的发展也迎来前所未有之机遇,“百模”激战正酣。在刚闭幕的世界人工智能大会上,国内外科技公司全线加入,三十余款大模型集中亮相,“国家队”尘埃落定,并正式启动大模型测试国家标准制订,掀起新一轮大模型热浪。而作为“大模型记忆体”、AIGC应用开发新范式的重要组成部分,向量数据库的演进也逐渐达到了前所未有的新高度。

Milvus自2019年正式开源以来,已经成长为全球最大、最活跃的向量数据库开源项目与开发者社区。作为Milvus背后的开发者与运营者,Zilliz一直走在向量数据库的最前沿,始终秉承为开发者提供易用性强、性价比高的向量数据库服务的理念。经过五年的持续打磨,终于在国内推出了基于Milvus的全托管向量数据库云服务产品——Zilliz Cloud。

cf88dcf2-1fdc-11ee-962d-dac502259ad0.png

经过不断地开发与升级,Zilliz Cloud俨然成为向量数据库赛道的领先者。随着Zilliz Cloud在国内全面开启向量数据库云服务,也为向量数据库的高速发展开启了全新的纪元。对于此次在国内的服务落地,Zilliz秉承的使命和目标尤为清晰和明确:

•提供全球最专业的全托管向量数据库云服务。

•打破向量数据库服务集中在北美,国内无可用向量数据库服务的尴尬局面。

•满足向量数据库服务多云的需求,避免业务被单一云环境限制。

•为跨境业务中所需要的统一向量数据库服务和架构提供可行性。

•Milvus开源解决方案、SaaS、PaaS统一接口标准,无缝线下/云上迁移,并大幅度降低混合部署的综合成本。

•提供比开源Milvus具有更高性价比、更稳定服务支持的产品和解决方案。

成熟稳定,全球率先支持十亿级别向量规模的服务

Milvus自开源以来,一直都是企业用户自建向量数据平台的首选,全套技术解决方案已被上万家企业所采用,其中百度、新浪、理想汽车、华泰证券、沃尔玛、LINE、BIGO等头部企业在实践中经过反复验证,均已顺利投产。

cf9f9bea-1fdc-11ee-962d-dac502259ad0.png

向量数据库是AIGC大模型的重要补充,是提供准确可靠、高度可扩展的长短期“记忆”的关键载体。近一年,向量数据库项目如雨后春笋般涌现。然而,大部分向量数据库支持的向量数据规模仅停留在千万量级,并不具备支撑生产环境的能力。

相较之下,Milvus在过去5年的客户应用场景覆盖各行各业,早在2021年就实现稳定支持十亿级向量规模的线上服务。如今,Zilliz Cloud的向量数据库服务可轻松支持十亿级以上规模向量数据,可用性高达99.9%。

此外,在产品与技术背后,Zilliz亦拥有全球最资深的向量数据库专家团队,可以为每一位企业用户配备4名技术支持,“没有人比我们更懂向量数据库”是团队对开源社区与商业化用户的承诺。

高性能+高性价比,性能优异远超同类产品

当前主流的向量数据索引算法是内存算法或内存/SSD混合,算法内核以矩阵计算为主(类似HPC),大规模向量检索与分析是计算/内存双重密集的任务。这意味着向量数据库作为基础设施,对于性能与成本更加敏感。

从性能方面来看,Zilliz Cloud在QPS和降低查询延迟方面远超其他同类产品。我们将ZillizCloud 、Milvus、Pinecone、ElasticCloud 4个常见的向量数据库(ElasticCloud 严格来说不属于向量数据库,但附带向量能力,在传统文本检索领域受众最广,可以视为目前传统数据库支持向量检索的代表)在同等资源及6组向量查询任务的同等条件下进行了对比(测试框架已开源,详见VectorDBBench,Leaderboard)。

对比结果如下:

在查询吞吐方面,ZillizCloud在全部6组查询任务中全面力压向量数据库Pinecone,整体性能平均超越2倍以上。与此同时,Zilliz Cloud相比Milvus,也有将近一倍的提升,表现令人眼前一亮。ElasticCloud作为传统文本检索服务的代表,向量查询能力主要为补充能力,这6组查询任务的QPS均在50以下。

cfb16168-1fdc-11ee-962d-dac502259ad0.png

查询延迟方面,Zilliz Cloud整体在10ms以下,Milvus整体在20ms以下,Pinecone在20-40ms之间,ElasticCloud差距较为明显。

cfc213dc-1fdc-11ee-962d-dac502259ad0.png

性价比方面,主要考察Queries per dollar (高并发情况下,单位成本所能支持的查询请求数量)。相较Pinecone、Elastic,Zilliz Cloud的优势十分明显。指标相比第二位的Pinecone最多可以高出1个数量级(Q1,Q2),在剩下的四组任务中普遍可以高3倍左右。(由于Milvus为开源方案,难以和商业化服务在相同标准下比较,我们在这组测试中将其移除。)

cfd44386-1fdc-11ee-962d-dac502259ad0.png

黑科技加持,软硬件性能飙升,全新内核火力全开

Zilliz Cloud采用商业化引擎,综合性能超过Milvus开源引擎的1倍以上。引擎针对典型场景进行深度优化,性能可提升 3-5 倍。

硬件层面,Zilliz与英伟达英特尔等一线硬件厂商有着长期稳定的合作,向量算法内核针对X86、ARMGPU进行了定制化优化。

软件层面,Zilliz Cloud推出了Autoindex智能索引。智能索引根据用户的向量维度、数据规模、数据分布、查询特性进行持续的自动化调优,免去用户索引类型选型以及参数调优的痛苦。据Zilliz内部测试,autoindex智能索引已经达到向量数据库专家手工调优效果的84%,大幅超越用户的平均水平。在下一阶段,autoindex智能索引的功能还会得到大幅度增强,支持用户指定recall进行优化,保证索引运行在指定查询准确度的最优点。

当然,针对最近大火的AIGC应用,Zilliz Cloud也推出了专门的特性支持:

•动态schema,可以根据AIGC迭代需要,灵活扩展向量特征或标签字段。

•PartitionKey,支持AIGC应用多用户知识库的利器,相较单独建表方案,综合成本可下降2-3个数量级。

•支持JSON类型,可以将JSON与embedding这两种超强能力相结合,实现基于JSON与embedding向量的混合数据表示以及复杂的业务逻辑。

打破“CAP”不可能三角,给用户灵活选择

向量数据库技术发展到现在并不完美,通常情况下,业务需要在成本(Cost)、查询效果与准确度(Accuracy)、查询性能(Performance)之间做权衡,即向量数据库的CAP问题。目前来看,CAP是一个不可能三角,Zilliz的解法是在典型的位置给出局部最优解,并给用户以灵活的选择。

事实上,用户的普遍场景可以归纳为性能需求型、容量需求型与成本敏感型。为此,Zilliz Cloud在向量数据库实例中也相应提供了三类支持:性能型、容量型和经济型。不同的实例类型由不同的算法与硬件资源组合而成,适用于不同的业务场景。

cfe4dd68-1fdc-11ee-962d-dac502259ad0.png

•性能型实例适用于需要低延迟和高吞吐量的向量相似性检索场景,该类型的实例能够保证毫秒级的响应。

性能型实例的适用场景包括但不限于:生成式AI、推荐系统、搜索引擎、聊天机器人、内容审核、LLM增强的知识库、金融风控。

•容量型实例可以支持的数据量是性能型的5倍,但查询延迟略有增加,因此适用于需要大量存储空间的场景,尤其是需要处理千万级以上向量数据的场景。

容量型实例的适用场景包括但不限于:搜索大规模的非结构化数据(如:文本、图像、音频、视频、药物化学结构等)、侵权检测、生物身份验证。

•经济型实例可支持的数据规模与容量型一致,但价格优惠7折左右,性能略有下降,适用于追求高性价比或预算敏感的场景。

经济型实例的适用场景包括但不限于:数据标记或数据聚类、数据去重、数据异常检测、平衡训练集类型分布。

支持大模型与非结构化数据处理全生态覆盖

没有任何一套系统可以满足使用者业务上的所有需求,向量数据库也是如此。在以向量数据库为支撑的业务中,往往需要处理多道流程,包括:

•业务数据的语义结构化,如从文本数据中梳理标题embedding、内容段落的embedding、一二级主题、阅读时间;

•面向端到端效果的模型选型,如寻找能带来最佳效果的embedding模型选型;

•模型与向量数据库的集成,如向量数据库查询驱动的原始数据召回以及后续LLM对召回内容的总结或重构等。

为了进一步降低应用构建成本,提供标准化组件,Zilliz Cloud为开发者提供了双重支持:

•大模型生态对接。2023年3月,Zilliz作为OpenAI首批向量数据库合作伙伴,完成了Milvus与Zilliz Cloud的插件化集成,被纳入官方推荐的向量数据库插件名单。不止如此,Zilliz还与LangChain、Cohere、LlamaIndex、Auto-GPT、BabyAGI等热门项目进行了深度集成。此外,与国产大模型如文心一言、通义千问、智谱AI、MiniMax、360智脑等对接工作正在进行中,近期将会有更多成果发布。

•面向非结构化数据处理流水线。Zilliz Cloud提供了开源的Towhee工具框架。开发者可以在熟悉的Python环境,以类似Spark的算子语法编写自己的流水线,轻松处理文本、图片、音频、视频、化合物结构等非结构化数据的ETL过程。Towhee同时提供自动化编排工具,一键在Python环境验证过的流水线组织成基于Triton、TensorRT、ONNX以及一系列硬件加速算法的服务镜像,面向如文本近似搜索、智能问答、知识库等典型场景。当然,Towhee也提供深度优化的标准流水线。

目前,Zilliz Cloud提供SaaS和PaaS服务,其中SaaS已覆盖AWS、GCP、阿里云,PaaS覆盖AWS、GCP、Azure、阿里云、百度智能云、腾讯云和金山云。国内官网已同步上线,更多详情和案例可以访问Https://zilliz.com.cn(海外官网和云服务入口:Https://zilliz.com)。

为了加速打磨业界最佳实践,我们即将启动「寻找AIGC时代的CVP实践之星」专题活动,Zilliz将联合国内头部大模型厂商一同甄选应用场景,由双方提供向量数据库与大模型顶级技术专家为用户赋能,一同打磨应用,提升落地效果,赋能业务本身。如果你的应用也适合CVP框架,且正为应用落地和实际效果发愁,可直接申请参与活动,获得最专业的帮助和指导。(注:CVP即C代表以ChatGPT为代表的LLMs,V代表Vector DB,P代表Prompt Engineering,联系方式参见business@zilliz.com)

2023年伴随着AGI和LLMs的爆发已经过半,加速探索大模型落地之路已经迫在眉睫。行业的高度共识推动着AI奇点的来临,大模型将重构企业级应用,重塑人工智能产业的发展方向。Zilliz表示,未来将持续聚焦向量数据库行业发展的最前沿,以各行各业的智能化演进为目标,为大模型时代的企业和开发者提供最具竞争力的“大模型记忆体”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    4085

    浏览量

    68562
  • 开源
    +关注

    关注

    3

    文章

    4368

    浏览量

    46451
  • 阿里云
    +关注

    关注

    3

    文章

    1046

    浏览量

    45877

原文标题:北美有的,中国也有了!Zilliz Cloud向量数据库云服务重磅登场

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NineData与阿里DMS:数据库权限申请、审批与回收场景怎么选?

    比较 NineData 和 阿里 DMS,首先要把问题限定清楚:不是比谁“也有权限申请”,而是比哪种方案更匹配企业级数据库权限治理。这个问题建议同时看五个维度:数据库资源粒度、审批闭
    的头像 发表于 03-25 17:19 1528次阅读
    NineData与阿里<b class='flag-5'>云</b>DMS:<b class='flag-5'>数据库</b>权限申请、审批与回收场景怎么选?

    KIOXIA单服务器实现48亿高维向量搜索数据库,借助GPU实现索引构建时间加速7.8倍

    向量数据库的索引构建时间是行业的核心痛点。Kioxia与NVIDIA合作,演示其在1024维高维向量的KIOXIA AiSA
    的头像 发表于 03-18 16:57 1072次阅读

    由Memfault赋能的Nordic-nRF Cloud服务将硬核加持物联网通信应用

    的 nRF Cloud 将 Memfault 经过验证的可观测性和无线 (OTA) 基础设施直接引入 Nordic 成熟的服务平台 nRF Cloud。 今年早些时候,Nordic
    发表于 11-27 22:30

    华纳香港服务数据库索引优化策略

    )实施有效的索引优化策略。无论您是IT管理员还是开发人员,了解这些技巧都能帮助您优化数据库效率,确保业务高效运转。下面,华纳(hncloud)将通过结构化分析,一步步解析香港服务数据库
    的头像 发表于 10-16 17:06 637次阅读

    mysql数据恢复—mysql数据库表被truncate的数据恢复案例

    ECS网站服务器,linux操作系统,部署mysql数据库。工作人员在执行数据库版本更新测试时,错误地将本应在测试
    的头像 发表于 09-11 09:28 1194次阅读
    mysql<b class='flag-5'>数据</b>恢复—mysql<b class='flag-5'>数据库</b>表被truncate的<b class='flag-5'>数据</b>恢复案例

    软通动力数据库专业服务全栈解决方案亮相2025数博会

    8月28日,2025中国国际大数据产业博览会(数博会)在贵阳开幕,软通动力携数据库专业服务全栈解决方案亮相盛会,全面展示从数据库迁移部署、性
    的头像 发表于 09-04 09:32 995次阅读
    软通动力<b class='flag-5'>数据库</b>专业<b class='flag-5'>服务</b>全栈解决方案亮相2025数博会

    基于 SSID 的 Wi-Fi 定位:与其他定位服务的性能比较

    进行比较。 Wi-Fi 定位系统包含以下关键组件: 用户设备中的 Wi-Fi 无线电设备,用于检测附近的网络。 将 MAC 地址等 Wi-Fi 网络信息映射到位置的数据库。该数据库由定位服务提供商维护
    发表于 08-31 21:01

    数据库数据恢复—服务器异常断电导致Oracle数据库故障的数据恢复案例

    Oracle数据库故障: 某公司一台服务器上部署Oracle数据库服务器意外断电导致数据库报错,报错内容为“system01.dbf需要
    的头像 发表于 07-24 11:12 852次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—<b class='flag-5'>服务</b>器异常断电导致Oracle<b class='flag-5'>数据库</b>故障的<b class='flag-5'>数据</b>恢复案例

    三款主流国产数据库的技术特点

    随着数字经济的快速发展和数据安全要求的提升,国产数据库正迎来前所未有的发展机遇。在信创浪潮推动下,达梦数据库、TiDB、华为高斯数据库等国产
    的头像 发表于 07-14 11:08 1348次阅读

    milvus向量数据库的主要特性和应用场景

    Milvus 是一个开源的向量数据库,专门为处理和分析大规模向量数据而设计。它适用于需要高效存储、检索和管理向量
    的头像 发表于 07-04 11:36 1240次阅读
    milvus<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>的主要特性和应用场景

    数据库数据恢复—MongoDB数据库文件丢失的数据恢复案例

    MongoDB数据库数据恢复环境: 一台操作系统为Windows Server的虚拟机上部署MongoDB数据库。 MongoDB数据库故障: 工作人员在MongoDB
    的头像 发表于 07-01 11:13 789次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—MongoDB<b class='flag-5'>数据库</b>文件丢失的<b class='flag-5'>数据</b>恢复案例

    数据库数据恢复—SQL Server数据库被加密如何恢复数据

    SQL Server数据库故障: SQL Server数据库被加密,无法使用。 数据库MDF、LDF、log日志文件名字被篡改。
    的头像 发表于 06-25 13:54 852次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server<b class='flag-5'>数据库</b>被加密如何恢复<b class='flag-5'>数据</b>?

    HarmonyOS5服务技术分享--函数预加载文章整理

    名,类型选 ​​Cloud Function​​(预加载暂不支持对象)。 ​​关键文件解析​​: ​​function-config.json​​:自动生成,别手改!这里定义函数入口和触发器(默认
    发表于 05-22 20:33

    HarmonyOS5服务技术分享--数据库使用指南

    接触HarmonyOS开发,还是想优化现有的数据管理逻辑,这篇指南都会手把手带你玩转数据的增删改查,还有那些超实用的高级查询功能! ? ​​核心功能与使用场景​​ 华为
    发表于 05-22 18:29

    HarmonyOS5服务技术分享--ArkTS开发Node环境

    气的方式探索这个功能,结尾还有实用总结和鼓励彩蛋哦~✨ ? 一、HarmonyOS函数开发:核心能力与价值 HarmonyOS的函数(Serverless)为开发者提供​​无服务
    发表于 05-22 17:21