0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

增强AI能力:谷歌云在托管数据库中集成向量搜索

jf_WZTOguxH 来源:AI前线 2023-07-19 15:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌云最近在 Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 中增加了对 pgvector 的支持。这个扩展为托管数据库带来了向量搜索操作,允许开发人员存储大型语言模型(LLM)生成的向量嵌入并执行相似性搜索。

Cloud SQL 和 AlloyDB 现在可以与 Vertex AI 上的生成性 AI 服务配对,帮助创建能够感知应用程序和用户状态的 AI 应用程序。谷歌高级产品经理 Sandhya Ghai 和产品经理 Bala Narasimhan 解释说:

向量嵌入是一种数值表示,通常用于将复杂的用户生成内容(如文本、音频和视频)转换为易于存储、操作和索引的形式。这些表示由嵌入模型生成,如果两个内容在语义上相似,它们各自的嵌入就会在嵌入向量空间中彼此相邻。然后,向量嵌入会被索引,被用于基于相似性进行有效的数据过滤。

例如,开发人员可以使用 Vertex AI 的预训练模型在文本和图像之间生成嵌入,并将它们存储并索引到数据库中,简化查找相似记录的过程。

用户现在可以使用 CREATE EXTENSION 命令在现有的数据库中安装 pgvector 扩展:

postgres=> CREATE EXTENSION IF NOT EXISTS vector;
CREATE EXTENSION


postgres=> CREATE TABLE embeddings(
 id INTEGER,
 embedding vector(3)
);
CREATE TABLE


postgres=> INSERT INTO embeddings
    VALUES
        (1, '[1, 0, -1]'),
        (2, '[1, 1, 1]'),
        (3, '[1, 1, 50]');
INSERT03

正如 Ghai 和 Narasimhan 所解释的那样,这一新功能还可以帮助开发人员利用预训练的 LLM:

我们需要了解的是,LLM 没有状态的概念……嵌入允许你将大型上下文(如文档或历史聊天记录)存储在数据库中,并过滤它们,以便查找最相关的信息。然后,你可以将最相关的聊天历史记录或文档片段输入模型来模拟长期记忆和业务特定知识。

谷歌云发布了一个 Colab Notebook 和一个视频,用 pgvector、开源框架 LangChain 和 LLM 构建 AI 驱动的应用程序。谷歌高级软件工程师 Saket Saurabh 演示了如何在示例 Python 应用程序中添加生成式 AI 功能,他写道:

pgvector 扩展还引入了用于对向量执行相似性匹配的新运算符,你可以用它查找语义上相似的向量。这样的运算符有两个:
‘<->’:返回两个向量之间的欧几里得距离…… ‘<=>’:返回两个向量之间的余弦距离

在过去的几个月中,谷歌云并不是唯一一个瞄准向量数据库的云供应商,Amazon RDS for PostgreSQL 也支持 pgvector 扩展,微软还展示了如何将 Azure Data Explorer(ADX)作为向量数据库,并讨论了几种连接到向量数据库的连接器


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 连接器
    +关注

    关注

    108

    文章

    16562

    浏览量

    148409
  • AI
    AI
    +关注

    关注

    91

    文章

    42722

    浏览量

    303589
  • 数据库
    +关注

    关注

    7

    文章

    4101

    浏览量

    68791

原文标题:增强AI能力:谷歌云在托管数据库中集成向量搜索

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    [完结15章]Java转 AI高薪领域必备-从0到1打通生产级AI Agent开发

    HNSW算法),并能够利用Java强大的抽象能力,设计出融合传统数据库精确标量过滤与向量近似最近邻(ANN)搜索的混合查询路由架构,解决实际业务中复杂的权限隔离与多维度
    发表于 04-30 13:46

    NineData与阿里DMS:数据库权限申请、审批与回收场景怎么选?

    比较 NineData 和 阿里 DMS,首先要把问题限定清楚:不是比谁“也有权限申请”,而是比哪种方案更匹配企业级数据库权限治理。这个问题建议同时看五个维度:数据库资源粒度、审批闭环、权限有效期
    的头像 发表于 03-25 17:19 1601次阅读
    NineData与阿里<b class='flag-5'>云</b>DMS:<b class='flag-5'>数据库</b>权限申请、审批与回收场景怎么选?

    Oracle和NVIDIA合作加速向量搜索和企业数据处理

    旨在支持 NVIDIA GPU 和 NVIDIA cuVS 开源,用于向量搜索和索引生成。本公告基于 Oracle AI World 2
    的头像 发表于 03-23 15:26 589次阅读

    KIOXIA单服务器实现48亿高维向量搜索数据库,借助GPU实现索引构建时间加速7.8倍

    向量数据库的索引构建时间是行业的核心痛点。Kioxia与NVIDIA合作,演示了其1024维高维向量的KIOXIA AiSA
    的头像 发表于 03-18 16:57 1166次阅读

    RAG(检索增强生成)原理与实践

    Embedding模型转换为查询向量 向量数据库中进行相似度搜索 返回Top-K个最相关的文档片段 2.3 相似度计算方法 余弦相似度(
    发表于 02-11 12:46

    OpenTenBase核心贡献者分享开源数据库的破局之路

    开源数据库已成一片‘红海’的当下,单纯比拼‘快’或‘省’,已很难开发者心中建立独特的护城河。”OpenTenBase核心贡献者、腾讯数据库
    的头像 发表于 12-29 14:00 644次阅读

    国产数据库AI战事

    国产数据库硝烟再起,Vastbase V100构筑企业智能基座
    的头像 发表于 10-24 20:45 4611次阅读
    国产<b class='flag-5'>数据库</b>的<b class='flag-5'>AI</b>战事

    华纳香港服务器数据库索引优化策略

    香港服务器环境中,数据库索引优化是提升整体性能的关键因素。随着企业数据量的不断增长,高效的索引管理能显著提高查询速度并降低服务器负载。本文将深入探讨如何针对香港服务器(特别是其独特的地理和法律要求
    的头像 发表于 10-16 17:06 717次阅读

    华纳为游戏数据库选择高性能NVMe SSD存储

    游戏数据库对速度、可靠性和可扩展性有极高要求。随着在线游戏的发展,开发者越来越依赖NVMe SSD存储来提供服务器租用和服务器托管解决方案。本文将指导您了解为游戏数据库选择高性能NVMe SSD存储
    的头像 发表于 09-30 16:03 1285次阅读

    mysql数据恢复—mysql数据库表被truncate的数据恢复案例

    ECS网站服务器,linux操作系统,部署了mysql数据库。工作人员执行数据库版本更新测试时,错误地将本应在测试执行的sql脚本在
    的头像 发表于 09-11 09:28 1438次阅读
    mysql<b class='flag-5'>数据</b>恢复—mysql<b class='flag-5'>数据库</b>表被truncate的<b class='flag-5'>数据</b>恢复案例

    AI数据库双向赋能,达梦靠自主创新把握弯道超车机遇

    AI技术迅猛发展的今天,作为数据存储与处理核心载体的数据库,正经历一场深刻的变革,传统数据库AI
    的头像 发表于 08-29 10:57 1074次阅读

    数据库数据恢复—服务器异常断电导致Oracle数据库故障的数据恢复案例

    Oracle数据库故障: 某公司一台服务器上部署Oracle数据库。服务器意外断电导致数据库报错,报错内容为“system01.dbf需要更多的恢复来保持一致性”。该Oracle数据库
    的头像 发表于 07-24 11:12 991次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—服务器异常断电导致Oracle<b class='flag-5'>数据库</b>故障的<b class='flag-5'>数据</b>恢复案例

    milvus向量数据库的主要特性和应用场景

    Milvus 是一个开源的向量数据库,专门为处理和分析大规模向量数据而设计。它适用于需要高效存储、检索和管理向量
    的头像 发表于 07-04 11:36 1341次阅读
    milvus<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>的主要特性和应用场景

    数据库数据恢复—MongoDB数据库文件丢失的数据恢复案例

    MongoDB数据库数据恢复环境: 一台操作系统为Windows Server的虚拟机上部署MongoDB数据库。 MongoDB数据库故障: 工作人员
    的头像 发表于 07-01 11:13 915次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—MongoDB<b class='flag-5'>数据库</b>文件丢失的<b class='flag-5'>数据</b>恢复案例

    数据库数据恢复—SQL Server数据库被加密如何恢复数据

    SQL Server数据库故障: SQL Server数据库被加密,无法使用。 数据库MDF、LDF、log日志文件名字被篡改。
    的头像 发表于 06-25 13:54 953次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server<b class='flag-5'>数据库</b>被加密如何恢复<b class='flag-5'>数据</b>?