0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用Keras构建基于关键字和图像的搜索引擎

汽车玩家 来源:人工智能遇见磐创 作者:人工智能遇见磐创 2020-05-05 08:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

动机

想象一下,如果有数十万到数百万张图像的数据集,却没有描述每张图像内容的元数据。我们如何建立一个系统,能够找到这些图像的子集来更好地回答用户的搜索查询?

我们基本上需要的是一个搜索引擎,它能够根据图像与搜索查询的对应程度对图像结果进行排序,可以用一种自然语言表示,,也可以用其他查询图像表示。

我们将在本文中解决问题的方法是训练一个深度神经模型,该模型学习任何输入图像和文本的固定长度表示形式(或嵌入形式),使得如果文本-图像或图像-图像是“相似的”,则他们在欧氏空间中接近,。

数据集

我找不到足够大的搜索结果排名数据集,但我能够得到这个数据集:http://jmcauley.ucsd.edu/data/amazon/它将电子商务项目的图像链接到它们的标题和描述。我们将使用这些元数据作为监督源来学习有意义的联合文本-图像表示。为了管理计算和存储成本,这些实验仅限于时尚(服装、鞋子和珠宝)物品和50万张图像。

问题设置

我们的数据集将每个图像与用自然语言编写的描述链接起来。因此,我们定义了一个任务,在该任务中,我们要学习图像和文本的固定长度的联合表示,以便每个图像表示都接近其描述的表示。

模型

该模型有3个输入:图像(即锚点)、图像标题与描述(即正例)和第三个输入是一些随机采样的文本(即负例)。

然后定义两个子模型:

图像编码器:Resnet50预训练的ImageNet+GlobalMaxpooling2D

文本编码器:GRU+GlobalMaxpooling1D

图像子模型产生锚点E_a的嵌入,文本子模型输出正标题和描述E_p的嵌入和负例文本E_n的嵌入。

然后,我们通过优化以下损失函数进行训练:

L = max( d(Ea, Ep)-d(Ea, En)+alpha, 0)

其中d为欧氏距离,alpha为超参数,在本实验中为0.4。

基本上,这种损失允许做的是使d(E_a,E_p)变小,使d(E_a,E_n)变大,这样每个图像的嵌入就接近于它的描述的嵌入,而远离随机文本的嵌入。

可视化结果

一旦我们学习了图像嵌入模型和文本嵌入模型,我们就可以通过使用tsne (https://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.html)将它们投影到二维空间中来实现可视化。测试图像及其对应的文本描述用绿线连接

从图中可以看出,通常在嵌入空间中,图像及其对应的描述是接近的。考虑到使用的训练损失,这是我们期望的。

文字图片搜索

在这里,我们使用几个文本查询示例来在一组70,000张图像中搜索最佳匹配。我们计算查询的文本嵌入,然后计算集合中每个图像的嵌入。我们最终在嵌入空间中选择最接近查询的前9张图像。

这些例子表明,嵌入模型能够学习图像的有用表示形式和简单单词组成的嵌入。

图像搜索

在这里,我们将使用图像作为查询,然后在包含70,000张图像的数据库中搜索与之最相似的示例。排序是由每对图像在嵌入空间内的欧氏距离决定的。

结果表明,生成的嵌入是图像的高级表示,它捕获了所表示对象的最重要特征,而不受方向、光照或局部细节的过度影响,也没有经过明确的训练。

结论:在这个项目中,我们研究了机器学习模块,它允许我们构建一个基于关键字和图像的搜索引擎,应用于图像集合。其基本思想是学习一个有意义的文本和图像的联合嵌入函数,然后利用嵌入空间中项之间的距离对搜索结果进行排序。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4692

    浏览量

    89543
  • keras
    +关注

    关注

    2

    文章

    20

    浏览量

    6283
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Temu跨境电商按关键字搜索Temu商品API的应用及接口请求示例

    Temu跨境电商按关键字搜索Temu商品API的应用及接口请求示例 Temu跨境电商按关键字搜索Temu商品API的应用场景 Temu跨境电商平台按
    的头像 发表于 11-29 15:08 68次阅读

    哪些场合会用到volatile关键字?

    当你理解 volatile关键字的含义之后,你就能明白,其实很多场合都能用到 volatile关键字。 1.全局变量单片机开发,难免会用到全局变量。一些初级工程师,更是全局变量满天飞。这种情况下
    发表于 11-25 08:19

    天眼查平台关键字搜索企业数据API接口技术指南

    ​ 一、接口概述 天眼查提供的企业搜索API接口,支持通过关键字查询企业工商信息、经营状态等核心数据。该接口采用RESTful架构,返回JSON格式数据。 二、接口认证 调用需使用API密钥认证
    的头像 发表于 11-21 11:48 373次阅读
    天眼查平台<b class='flag-5'>关键字</b><b class='flag-5'>搜索</b>企业数据API接口技术指南

    item_search-按关键字搜索商品列表API接口

    一、引言 淘宝是中国最大的电商平台之一,拥有数亿的商品和用户。为了方便开发者进行应用开发,淘宝提供了丰富的API接口,其中之一就是关键搜索接口。通过该接口,开发者可以轻松地获取淘宝上的商品信息,为
    的头像 发表于 11-16 17:13 83次阅读

    1688平台关键字搜索商品API接口技术实践指南

    /com.alibaba.product/alibaba.product.search/ 必备参数: { "keyword": "手机", // 搜索关键字 "pageNo": 1, // 页码 "pageSize": 20, // 每页数量 "access_token"
    的头像 发表于 11-11 14:22 240次阅读
    1688平台<b class='flag-5'>关键字</b><b class='flag-5'>搜索</b>商品API接口技术实践指南

    亚马逊平台根据关键字搜索商品API接口

    ​  在电商开发中,集成亚马逊平台的商品搜索功能是常见需求。通过亚马逊的Product Advertising API(PAAPI),开发者可以根据关键字高效检索商品信息。本技术帖将逐步介绍如何调用
    的头像 发表于 11-05 15:00 117次阅读
    亚马逊平台根据<b class='flag-5'>关键字</b><b class='flag-5'>搜索</b>商品API接口

    亚马逊 SP-API 深度开发:关键字搜索接口的购物意图挖掘与合规竞品分析

    本文深度解析亚马逊SP-API关键字搜索接口的合规调用与商业应用,涵盖意图识别、竞品分析、性能优化全链路。通过COSMO算法解析用户购物意图,结合合规技术方案提升关键词转化率,助力卖家实现数据驱动决策,安全高效优化运营。
    的头像 发表于 10-17 14:59 336次阅读

    阿里巴巴国际站关键字搜索 API 实战:从多条件筛选到商品列表高效获客

    ​​在跨境电商数据采集场景中,通过关键字精准搜索商品列表是基础且核心的需求。本文将聚焦阿里巴巴国际站的关键字搜索接口,详细介绍如何构建多条件
    的头像 发表于 08-20 09:22 676次阅读
    阿里巴巴国际站<b class='flag-5'>关键字</b><b class='flag-5'>搜索</b> API 实战:从多条件筛选到商品列表高效获客

    micro 关键字搜索全覆盖商品,并通过 API 接口提供实时数据

    micro 关键字搜索全覆盖商品”并通过 API 接口提供实时数据
    的头像 发表于 07-13 10:13 655次阅读

    单片机编程关键字之volatile

    volatile 修饰的变量是说这变量可能会被意想不到地改变。通常对于程序员而言,单片机 中用的就算常见了volatile 是易变的,不稳定的意思。其实对于很多人来说,根本没见过这个关键字,不 知道
    发表于 04-02 13:47 2次下载

    微软面临法国反垄断机构调查

    据媒体报道,微软目前正在接受法国反垄断机构的深入调查。此次调查的核心关注点在于,微软是否在搜索引擎联盟市场中滥用其市场支配地位。 知情人士透露,法国监管机构正在仔细评估微软的行为,特别是其是否向那些
    的头像 发表于 02-11 10:57 881次阅读

    LZO Data Compression,高性能LZO无损数据压缩加速器介绍,FPGA&amp;ASIC

    无损数据压缩2.可配置的数据块分段和搜索窗口大小[8KB,16KB,32KB]3.可配置的并行处理等级[搜索引擎的数量,1~32]4.可配置的字典深度[8K,16KB],字典RAM类型[BRAM
    发表于 01-24 23:53

    javascript:void(0) 是否影响SEO优化

    使用 javascript:void(0) 确实可能对SEO优化产生负面影响 。以下是关于 javascript:void(0) 对SEO影响的具体分析: 搜索引擎爬虫的理解问题 搜索引擎爬虫(如
    的头像 发表于 12-31 16:08 976次阅读

    HTTP 协议对于SEO优化的影响

    搜索引擎优化(SEO)是提高网站在搜索引擎中的可见性和排名的过程。HTTP协议作为互联网通信的基础,对SEO有着深远的影响。 1. HTTP状态码 HTTP状态码是服务器响应客户端请求的结果。这些
    的头像 发表于 12-30 09:29 976次阅读

    苹果为谷歌支付数十亿美元辩护,参与搜索案反垄断审判

    近日,苹果公司已正式要求参与谷歌即将在美国举行的在线搜索反垄断审判,此举旨在为其与谷歌之间的收入分成协议进行辩护。该协议使得谷歌成为Safari浏览器的默认搜索引擎,而谷歌每年因此向苹果支付数十
    的头像 发表于 12-26 10:41 714次阅读