README.md

视觉设计

软件工程

3D图形学

C语言

C++语言基础

C语言基础

LinuxC编程

Windows编程

Go语言

GORM框架

Gin框架

Go语言基础

Go语言标准库

Go语言网络编程

开发工具链

Java

JavaEE

JavaFX

JavaSE

Java企业级应用框架

Activiti

Hibernate

MyBatis

Netty

Quartz

ShardingSphere

Shiro

Spring

SpringBoot

SpringCloud

SpringCloudAlibaba

SpringData

SpringFramework

SpringSecurity

SpringSession

Struts2

Java构建和开发工具链

Java虚拟机

Java语言基础

BigDecimal

CLASSPATH详解

Java8新特性

Java并发程序设计

Java网络和IO程序设计

Linux下Java环境搭建

反射机制

异常机制详解

弱引用

模块化

类初始化块的执行顺序

迭代器

第三方库

JUnit5-单元测试框架

Jasypt-配置文件加密

Lettuce-Redis客户端

Logback-日志模块

Lombok-简化冗余代码

Lucene-全文检索引擎

OpenFeign-声明式HTTP客户端

POI-读写Excel文档

RxJava响应式编程

SpringDoc-接口文档管理

commons-beanutils-对象属性处理

commons-codec-编解码库

commons-collections4-集合操作

commons-compress-压缩文件处理

commons-io-输入输出处理

commons-lang3-基础工具类

groovy-整合脚本引擎

httpclient5-通用HTTP客户端

jackson-json解析库

jodconverter-文档转换

redisson-分布式内存数据网格

velocity-模板引擎

Linux

BashShell

Linux操作系统基础

RaspberryPi

命令行工具

服务配置管理

系统配置管理

NodeJS

PHP

Laravel

PHP网络应用开发

PHP语言基础

开发工具

扩展库

Python

Django

FastAPI

LangChain

Python语言基础

Scrapy爬虫框架

内置库

开发相关工具

第三方库

Web前端

Web客户端编程

EcmaScript6

Electron

HTML5

JQuery

JavaScript客户端编程

JavaScript语言精粹

NextJS

React

TypeScript

UmiJS

Vue

WebExtension

常用功能实现

常用库

开发工具链

Web网页设计

Bootstrap4

CSS

Less

TailwindCSS

常用库

常见问题

Windows

dotNet

Csharp语言基础

Winform编程

dotNet运行时库

开发工具链

信息安全

应用架构和中间件

Docker

Istio

Kafka

Kubernetes

Nginx

OpenResty

Prometheus

RabbitMQ

Tomcat

ZooKeeper

gRPC

操作系统

数据库系统

ElasticSearch

01-ElasticSearch简介

02-ElasticSearch集群环境搭建

03-索引创建与内容检索

03-索引创建与内容检索.md

04-使用Java客户端

Kettle开源ETL工具

MongoDB

MySQL

Oracle

Redis

关系型数据库基础理论

数据结构和算法

游戏引擎

LibGDX

Unity

2D游戏开发

GUI系统

Unity编辑器

Unity脚本编程

实例

移动端应用开发

Android开发基础

Cordova

Flutter开发框架

常见问题总结

开发工具

微信小程序开发

高级控件

编译原理

计算机网络

软件工程学

软件开发相关工具

Eclipse-集成开发环境

Firefox-浏览器

Git-版本控制

GitLab-开源代码仓库管理工具

Jenkins-持续集成

Nexus-私有包管理仓库

SVN-版本控制

VSCode-代码编辑器

其他工具软件

知识管理

软件测试

软件开发相关知识

索引创建与内容检索

我们知道Lucene检索的原理是创建倒排索引，ES的使用步骤也是类似的，我们需要先导入数据创建索引，如果数据发生变化也需要进行对应索引的增删改查操作，具体检索时则需要调用相应接口从索引中进行搜索。这些操作ES提供了RestfulAPI，我们可以使用Postman工具或Kibana进行测试，这篇笔记我们简单了解学习。

基本概念

index：ES中的index（索引）定义包含若干数据的字段，以及相关设置，具体数据会关联索引来创建，ES会自动创建倒排索引，检索时可以在指定索引字段中实现。

document：document（文档）可以理解为具体的数据，我们以包含若干字段的JSON格式上传给ES。

shard：ES是分布式的检索系统，一个分布式节点的存储空间是有限的，但ES支持shard（数据分片），可以将一组巨大的数据分割存储到多个分布式节点上。

replica：replica（副本集）指数据的副本，数据副本必须分布在不同节点上以保证可用性，如果创建索引时指定了超出可用节点数的副本集，索引是无法创建成功的。

RestfulAPI命令格式

ES的API设计遵循了统一的格式，这里以curl命令为例：

curl ‐X <VERB> '<PROTOCOL>://<HOST>:<PORT>/<PATH>?<QUERY_STRING>' ‐d '<BODY>'

参数	说明
	HTTP请求方法，包括GET、POST、PUT、DELETE
	协议，http或https
	请求主机
	请求端口，默认为9200
	API端点
	查询参数
	JSON请求体

索引管理

创建索引

下面例子中，我们创建了一个名为idx_article的索引。

PUT http://localhost:9200/idx_article

请求体：

{
    "settings": {
        "number_of_shards": 1,
        "number_of_replicas": 1
    },
    "mappings": {
        "properties": {
            "title": {
                "type": "text",
                "analyzer": "ik_max_word",
                "search_analyzer": "ik_max_word"
            },
            "content": {
                "type": "text",
                "analyzer": "ik_max_word",
                "search_analyzer": "ik_max_word"
            }
        }
    }
}

settings字段设置了索引的分片和副本数，mappings字段设置了具体的索引字段等信息。

删除索引

DELETE http://localhost:9200/idx_article

查询索引

查询所有索引：

GET http://localhost:9200/_all

查询索引详情：

http://localhost:9200/idx_article

文档管理

更新文档

这里我们创建了一条主键为1的数据：

POST http://localhost:9200/idx_article/_doc/1

{
    "title": "测试标题1",
    "content": "这是一段字符串测试内容。"
}

如果对应主键文档已经存在，会自动执行更新。

批量更新文档

POST http://localhost:9200/idx_article/_bulk

API中使用bulk命令进行批量更新，但这里注意该命令的格式定义比较奇葩，它并非标准JSON格式，为如下形式：

{"index":{"_id":"1"}}
{"title": "测试标题1","content": "这是一段字符串测试内容。"}

{"index":{"_id":"2"}}
{"title": "测试标题2","content": "这也是一段字符串测试内容。"}

每条批量操作为两行，第一行包括操作类型、主键等信息，第二行是具体的数据字段，操作之间必须插入空行作为分隔。

删除文档

DELETE http://localhost:9200/idx_article/_doc/1

批量删除文档

POST http://localhost:9200/idx_article/_bulk

{"delete":{"_id":"1"}}

{"delete":{"_id":"2"}}

查询索引下所有文档

GET http://localhost:9200/idx_article/_search

内容检索

全文查询

ES的检索RestfulAPI设计的极为怪异，它是带有请求体的GET请求，这可能造成有些语言HTTP客户端库的不兼容。请求路径如下：

GET http://localhost:9200/idx_article/_search

match：对查询关键字分词，再按分词搜索。

{
    "query": {
        "match": {
            "content": "内容"
        }
    }
}

multi_match：同match，但在多个字段中搜索。

{
    "query": {
        "multi_match": {
            "query": "一段",
            "fields": [
                "title",
                "content"
            ]
        }
    }
}

match_phrase：对关键字整体（不分词）进行搜索。

{
    "query": {
        "match_phrase": {
            "content": "一段内容"
        }
    }
}

查询结果高亮显示

ES支持为搜索结果中的关键词分词加上HTML标签，这样便于我们实现搜索关键字高亮。

{
    "query": {
        "match": {
            "content": "一段内容"
        }
    },
    "highlight": {
        "pre_tags": "<span color='red'>",
        "post_tags": "</span>",
        "fields": {
            "content": {}
        }
    }
}

作者：Gacfox

Build with NextJS | Sitemap