0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ElasticSearch是什么?应用场景是什么?

电子工程师 来源:Xlucas 作者:Xlucas 2022-10-09 18:38 次阅读

1、什么是搜索

2、如果用数据库做搜索会怎么样

3、什么是全文检索、倒排索引和Lucene

4、ElasticSearch是什么

ElasticSearch的功能

ElasticSearch的应用场景

ElasticSearch的特点

ElasticSearch是一个分布式,高性能、高可用、可伸缩的搜索和分析系统

看了上面这段话,估计很多人都懵了,这个是啥。我们先从搜索说起,先介绍下面几点

1、什么是搜索

百度、Google :我们想寻找一个我们喜欢的电影或者书籍就会去百度或者Google搜索一下。

互联网搜索 :电商搜索商品,招聘网站搜索简历或者岗位

IT系统的搜索 :员工管理搜索,会议管理搜索

2、如果用数据库做搜索会怎么样

在软件开发里面,数据都是存储在数据库里面的,比如电商网站的商品信息,员工的信息等等,如果从员工角度去做搜索功能,我们会这么设计

dc5017f0-30e2-11ed-ba43-dac502259ad0.png

以上会存在几个问题:

如果表记录上千万上亿了这个性能问题,另外一个如果有一个本文字段要在里面模糊配置,这个就会出现严重的性能问题

还不能将搜索词拆分开来,比如上面这个只能搜索名字是“张三”开头的员工,如果想搜出“张小三”那是搜索不出来的。

总体来说,用数据库来实现搜索,是不太靠谱的,通常性能也会很差

3、什么是全文检索、倒排索引和Lucene

举个简单的例子:比如最近上映的热剧(碟中谍6:全面瓦解),我们想搜索一下全面瓦解这个电视剧,可是在输入的过程,不小心输入了”全瓦解”,我们看看百度这个返回了什么,百度返回的结果确实是我想要找到的内容,现在我们介绍一下全文检索和倒排索引是什么

dc6620c2-30e2-11ed-ba43-dac502259ad0.png

我们看看下面这个图,假如我们有很多数据”全面瓦解电影,全面瓦解海报,全面瓦解评论,全面瓦解文章”等等信息,从数据到构建倒排索引的过程我们图中标记为“1”,通俗一点讲就是,倒排索引就是讲数据中的词拆分构建一个大表,将关键字拆出来,后面带上这个文章的documentid号,例如中间这个就是倒排索引了。

全文检索就比较好理解的,就是当我们输入“全瓦解”,会被拆分成”全”,“瓦解”2个此,用2个词去倒排索引里面去检索数据,检索到的数据返回。整个过程就叫做全文检索

dc70c770-30e2-11ed-ba43-dac502259ad0.png

如果这个用数据库的思维来做的话,假如一共100W的记录,按照之前的思路就是扫描100W次,而且每次扫描,都需要匹配那个文本所有的字符,确认是否包含搜索的关键词,而且还不能将搜索词拆解来进行检索

如果是利用倒排索引的话,假设还是100W,拆分出来的词语,假设有1000W个词语,那么在倒排索引中,就有1000W行。我们可能不需要检索1000W词,有可能检索1次,就能找到我们需要的数据,也有可能是100W次,也有可能是1000W次

lucene:就是一个jar包,里面包含了封装好的各种建立倒排索引,以及进行搜索的代码,包括各种算法。我们就用java开发的时候

4、ElasticSearch是什么

Lucene是单机的模式,如果你的数据量超过了一台物理机的容量,你需要扩容,将数据拆分成2份放在不同的集群,这个就是典型的分布式计算了。需要拷贝容错,机器宕机,数据一致性等复杂的场景,这个实现就比较复杂了。

ES解决了这些问题

自动维护数据的分布到多个节点的索引的建立,还有搜索请求分布到多个节点的执行

自动维护数据的冗余副本,保证了一旦机器宕机,不会丢失数据

封装了更多高级的功能,例如聚合分析的功能,基于地理位置的搜索

dc7e764a-30e2-11ed-ba43-dac502259ad0.png

ElasticSearch的功能

1、分布式的搜索引擎和数据分析引擎

搜索:网站的站内搜索,IT系统的检索

数据分析:电商网站,统计销售排名前10的商家

2、全文检索,结构化检索,数据分析

全文检索:我想搜索商品名称包含某个关键字的商品

结构化检索:我想搜索商品分类为日化用品的商品都有哪些

数据分析:我们分析每一个商品分类下有多少个商品

3、对海量数据进行近实时的处理

分布式:ES自动可以将海量数据分散到多台服务器上去存储和检索

海联数据的处理:分布式以后,就可以采用大量的服务器去存储和检索数据,自然而然就可以实现海量数据的处理了

近实时:检索数据要花费1小时(这就不要近实时,离线批处理,batch-processing);在秒级别对数据进行搜索和分析

ElasticSearch的应用场景

维基百科

The Guardian(国外新闻网站)

Stack Overflow(国外的程序异常讨论论坛

GitHub(开源代码管理)

电商网站

日志数据分析

商品价格监控网站

BI系统

站内搜索

ElasticSearch的特点

可以作为一个大型分布式集群(数百台服务器)技术,处理PB级数据,服务大公司;也可以运行在单机上,服务小公司

Elasticsearch不是什么新技术,主要是将全文检索、数据分析以及分布式技术,合并在了一起

对用户而言,是开箱即用的,非常简单,作为中小型的应用,直接3分钟部署一下ES

Elasticsearch作为传统数据库的一个补充,比如全文检索,同义词处理,相关度排名,复杂数据分析,海量数据的近实时处理;

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • JAVA
    +关注

    关注

    19

    文章

    2904

    浏览量

    102994
  • 数据库
    +关注

    关注

    7

    文章

    3591

    浏览量

    63369
  • Elasticsearch
    +关注

    关注

    0

    文章

    25

    浏览量

    2788

原文标题:ElasticSearch是什么?应用场景是什么?

文章出处:【微信号:芋道源码,微信公众号:芋道源码】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AG32VF-MIPI应用场景

    MIPI接口技术在图像和视频传输中的应用越来越广泛,应用场景也在不断拓展,而不仅限于移动设备。MIPI接口在物联网、智能家居、智能监控、智能电视、智能汽车等领域也得到广泛应用。 MIPI还可
    发表于 01-22 08:56

    NanoEdge AI的技术原理、应用场景及优势

    能耗并提高数据安全性。本文将对 NanoEdge AI 的技术原理、应用场景以及优势进行综述。 1、技术原理 NanoEdge AI 的核心技术包括边缘计算、神经网络压缩和低功耗硬件设计。边缘计算
    发表于 03-12 08:09

    MOS管的应用场景

    mos管的应用场景,你了解么?低压MOS管可称为金属氧化物半导体场效应管,因为低压MOS管具有良好的开关特性,广泛应用在电子开关的电路中。如开关电源,电动马达、照明调光等!下面银联宝科技就跟大家一起
    发表于 11-14 09:24

    this的使用场景及与C,Java中的this的区别

    【JS】this有哪些使用场景?跟C,Java中的this有什么区别?如何改变this的值?
    发表于 03-11 10:17

    CP-OFMD调制波形应用场景

    图1、5G的应用场景5G使用5G多载波波形来为智能手机,办公室,工厂自动化,智能电网,智慧城市,物联网,M2M,M2X等多种设备提供应用平台。5G新无线电(5G NR)根据应用场景可分为三大类服务
    发表于 06-18 06:51

    =>的使用场景有哪些

    使用场景
    发表于 10-27 13:25

    运放电路有哪些应用场景?

    运放电路的七大应用场景
    发表于 03-11 07:49

    蓝牙低功耗常见的应用场景及架构

    浅谈蓝牙低功耗(BLE)的几种常见的应用场景及架构
    发表于 06-15 09:51

    FPGA的应用场景

    目录文章目录目录FPGAFPGA 的应用场景FPGA 的技术难点FPGA 的工作原理FPGA 的体系结构FPGA 的开发FPGA 的使用FPGA 的优缺点参考文档FPGAFPGA(Field
    发表于 07-28 08:43

    volatile关键字应用场景及示例

    volatile关键字1.应用场景2.示例1.应用场景volatile关键字分析,往往应用在三种场合1)多线程编程共享全局变量的时候,该全局变量要加上volatile进行修饰,让编译器不要优化该变量
    发表于 08-24 07:21

    ARM的技术特征是什么?应用场景有哪些?

    ARM的技术特征是什么?应用场景有哪些?
    发表于 11-05 07:32

    MS9331的应用场景是什么?

    MS9331的应用场景是什么?
    发表于 02-11 06:41

    RK3308的特点及应用场景是什么?

    RK3308的特点及应用场景是什么?
    发表于 03-09 08:04

    SMT组装工艺流程的应用场景

    工艺流程的应用场景。 01单面纯贴片工艺 应用场景: 仅在一面有需要焊接的贴片器件。 02双面纯贴片工艺 应用场景: A/B面均为贴片元件。 03单面混装工艺 应用场景: A面有贴
    发表于 10-20 10:31

    labview 和 wincc 的区别 使用场景

    labview 和 wincc 的区别 使用场景 都是上位机软件,都可以做监控软件 wincc的名气也比较大 对比的资料较少 写这些文章的人,从自己的从事的行业出发,带有自己的思维 使用的场景 肯定
    发表于 10-27 18:01