0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

KIOXIA单服务器实现48亿高维向量搜索数据库,借助GPU实现索引构建时间加速7.8倍

文传商讯 来源:文传商讯 作者:文传商讯 2026-03-18 16:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Kioxia Corporation今日宣布,凭借其开源的KIOXIA AiSAQ™近似最近邻搜索(ANNS)技术,成功演示在单台服务器上实现48亿向量的高维向量搜索扩展。此外,Kioxia还展示了通过NVIDIA cuVS利用GPU加速,显著缩短索引构建时间的成果。这两项成果标志着检索增强生成(RAG)搜索解决方案取得了重大进展。目前公司正持续开发,以支持超过48亿向量的更大规模部署。

大规模向量数据库的索引构建时间是行业的核心痛点。Kioxia与NVIDIA合作,演示了其在1024维高维向量的KIOXIA AiSAQ索引构建时间上最多20倍的改进,以及端到端构建时间上最多7.8倍的改进。这20倍的改进意味着,构建索引的时间从使用CPU的28.4天缩短至使用4块NVIDIAHopperGPU的1.4天,端到端测试时间从31天缩短至4天。

如今,AI应用可依赖存储在固态硬盘上的更大规模向量化信息(可达数百亿向量及以上),而仅靠DRAM即便在十亿级规模下也已不再适用。Kioxia借助KIOXIA AiSAQ技术,实现了十亿级搜索的高可扩展存储架构,在Milvus向量数据库环境中,使用单台查询服务器即可满足RAG应用的延迟要求。其索引构建依托GPU加速,让大规模部署变得切实可行。

NVIDIA存储技术副总裁Jason Hardy表示:“向量数据库是那些需要在海量非结构化数据集中实时理解意图、上下文和相似度的应用的核心支撑。通过借助NVIDIA cuVS库实现GPU加速索引,Kioxia支持高维向量数据库实现扩展,并以前所未有的效率构建索引。”

KIOXIA AiSAQ开源软件技术于去年首次发布,通过支持直接从固态硬盘进行向量搜索并降低DRAM用量,解决了RAG技术的可扩展性挑战。KIOXIA AiSAQ技术具备高可扩展性,非常适合多租户环境和大规模单体索引部署。该技术采用创新的全局索引(Global Index)算法,结合混合聚类和图搜索,在超大规模下实现高效向量搜索。KIOXIA AiSAQ软件提供灵活的调优选项,可在性能与大规模向量可扩展性之间取得平衡,让大规模部署更易实现和扩展。

Kioxia Corporation常务执行董事、固态硬盘事业部副总裁Masashi Yokotsuka表示:“将向量数据库扩展至十亿级规模,需要重新思考内存和计算方案。通过将基于KIOXIA AiSAQ固态硬盘的向量搜索与NVIDIA用于索引构建的GPU加速相结合,我们实现了大规模部署下切实可行的索引构建。作为行业创新者,我们将继续利用闪存技术突破AI的边界。”

Kioxia始终致力于推进由存储驱动的AI解决方案,以支持大规模智能数据处理,并持续推动KIOXIA AiSAQ向万亿向量级部署迈进。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5259

    浏览量

    136039
  • 服务器
    +关注

    关注

    14

    文章

    10344

    浏览量

    91737
  • 数据库
    +关注

    关注

    7

    文章

    4078

    浏览量

    68524
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Oracle和NVIDIA合作加速向量搜索和企业数据处理

    Oracle 和 NVIDIA 正在与客户合作,将 GPU 加速向量索引构建应用于实际工作负载。Oracle Private AI Ser
    的头像 发表于 03-23 15:26 400次阅读

    不用编程不用联网,快速实现PLC与数据库双向数据通讯的案例

    智能网关IGT-DSER实现S7-1200/1500系列的PLC与数据库服务器双向通讯,网关支持MySQL和SQLServer、PostgreSQL,以及Oracle、达梦数据库等。这
    发表于 01-14 10:51

    恒讯科技解析:如何在日本服务器上安装和配置数据库(如MySQL)?

    为您的业务部署日本服务器后,下一个关键步骤就是安装和配置数据库。无论是用于网站、应用程序还是数据分析,一个稳定高效的数据库是业务的核心。恒讯科技将以最流行的MySQL为例,提供一份在日
    的头像 发表于 11-04 11:07 789次阅读

    华纳云香港服务器数据库索引优化策略

    在香港服务器环境中,数据库索引优化是提升整体性能的关键因素。随着企业数据量的不断增长,高效的索引管理能显著提高查询速度并降低
    的头像 发表于 10-16 17:06 617次阅读

    不用编程不用联网,实现福(BECKHOFF)PLC对接SQL数据库,上报和查询数据的案例

    、SQLServer、PostgreSQL,以及Oracle。 网关安装在设备侧,与设备同时起停,不担心数据丢失;在断网、服务器维护上报数据有异常时,网关主动将数据缓存,待故障解除后自
    发表于 10-10 11:14

    多达 48 个计算节点!Firefly 推出 CSC2-N48 AI 算力服务器

    和分析数据,具有小型化、低延迟、可靠等特点。内置48个计算节点服务器内置48个分布式计算节点,算力处理
    的头像 发表于 08-20 16:37 1780次阅读
    多达 <b class='flag-5'>48</b> 个计算节点!Firefly 推出 CSC2-N<b class='flag-5'>48</b> AI 算力<b class='flag-5'>服务器</b>

    不用编程序无需联外网,将Rockwell罗克韦尔(AB)PLC的标签数据存入SQL数据库

    、SQLServer、PostgreSQL,以及Oracle。 网关安装在设备侧,与设备同时起停,不担心数据丢失;在断网、服务器维护上报数据有异常时,网关主动将数据缓存,待故障解除后
    发表于 07-31 10:33

    数据库数据恢复—服务器异常断电导致Oracle数据库故障的数据恢复案例

    Oracle数据库故障: 某公司一台服务器上部署Oracle数据库服务器意外断电导致数据库报错,报错内容为“system01.dbf需要
    的头像 发表于 07-24 11:12 827次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—<b class='flag-5'>服务器</b>异常断电导致Oracle<b class='flag-5'>数据库</b>故障的<b class='flag-5'>数据</b>恢复案例

    milvus向量数据库的主要特性和应用场景

    Milvus 是一个开源的向量数据库,专门为处理和分析大规模向量数据而设计。它适用于需要高效存储、检索和管理向量
    的头像 发表于 07-04 11:36 1222次阅读
    milvus<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>的主要特性和应用场景

    硅谷GPU服务器是什么意思?使用指南详解

    硅谷GPU服务器本质上是一种IaaS(基础设施即服务)产品,它将物理服务器上的GPU资源通过虚拟化技术分割成可弹性调配的云
    的头像 发表于 06-16 09:41 708次阅读

    通SoC阵列服务器

    通SoC阵列服务器是基于通系统级芯片(SoC)构建的高密度计算解决方案,核心特点为低功耗、算力集成与模块化设计,主要应用于边缘计算和云
    的头像 发表于 06-03 07:37 1412次阅读

    服务器数据恢复—Linux系统服务器崩溃的数据恢复案例

    服务器数据恢复环境: linux操作系统服务器中有一组由4块SAS接口硬盘组建的raid5阵列。 服务器故障: 服务器工作过程中突
    的头像 发表于 05-20 15:46 986次阅读

    Redis 8 向量搜索实测:轻松扩展至 10 亿向量

    艾体宝Redis 8 向量搜索实测轻松支持 10 亿向量,仍保持低延迟与吞吐。中位延迟仅200毫秒,90%精确度;处理50并发
    的头像 发表于 05-13 14:00 889次阅读
    Redis 8 <b class='flag-5'>向量</b><b class='flag-5'>搜索</b>实测:轻松扩展至 10 <b class='flag-5'>亿</b><b class='flag-5'>向量</b>

    数据采集到MYSQL和SQLSERVER数据库可以实现哪些功能

    将工业设备数据采集到MySQL和SQLServer数据库后,可实现生产管理、设备运、决策支持等多维度功能。对此,数之能提供多种工业设备数据
    的头像 发表于 05-07 15:32 670次阅读

    RAKsmart服务器SEO优化优势分析

    在RAKsmart服务器上搭建SEO网站,可以借助其基础设施和服务特性,从技术层面优化搜索引擎排名。以下是具体优势及分析,主机推荐小编为您整理发布RAKsmart
    的头像 发表于 04-22 10:12 773次阅读