Elasticsearch 实战案例：电商大数据搜索系统设计

关键词：Elasticsearch、电商搜索、倒排索引、分词器、相关性评分、聚合分析、实战案例
摘要：本文以“电商大数据搜索系统”为实战场景，用“超市找东西”的生活类比，一步步拆解Elasticsearch的核心概念（倒排索引、分词器、相关性评分），并通过Python代码实战演示“商品索引建立、搜索过滤、排序聚合”的完整流程。最终解释Elasticsearch如何解决电商“快速找商品”的问题，同时探讨其在实际场景中的应用与未来趋势。

背景介绍

目的和范围

你有没有过这样的经历？在电商平台想买“儿童运动鞋”，输入关键词后，不到1秒就出现了一堆符合要求的商品——价格在100-200之间、销量高、评价好，甚至还按你的喜好推荐了品牌。这背后的“魔法”，就是**Elasticsearch（简称ES）**在工作。

本文的目的，是用“小学生能听懂的话”，讲清楚ES如何支撑电商搜索系统，并通过实战代码教会你：

如何用ES存储百万级商品数据？如何让用户输入的“模糊关键词”快速匹配到准确商品？如何让搜索结果“既相关又符合用户需求”（比如销量高的排前面）？

范围覆盖：ES核心概念、电商搜索系统架构、Python实战开发、性能优化思路。

预期读者

刚接触ES的开发人员（想知道“ES到底怎么用”）；电商产品经理（想理解“搜索功能的技术逻辑”）；对“大数据搜索”感兴趣的新手（想从实战案例入门）。

文档结构概述

本文像“搭积木”一样，从“基础概念”到“实战代码”逐步构建：

核心概念：用“超市类比”解释倒排索引、分词器、相关性评分（ES的“三大法宝”）；算法原理：拆解倒排索引的构建过程、TF-IDF相关性评分的数学逻辑；实战项目：用Python实现“电商商品搜索系统”（从建索引到搜索的完整流程）；应用与趋势：探讨ES在电商中的实际用法（比如过滤、排序、推荐）及未来发展方向。

术语表

核心术语定义

倒排索引：像字典的“索引页”，把“商品中的关键词”对应到“包含该关键词的商品列表”（比如“儿童”对应所有儿童商品）；分词器：像“拆句子的小助手”，把用户输入的“儿童运动鞋”拆成“儿童”“运动鞋”两个关键词；相关性评分：像“商品的得分”，综合“关键词出现次数”“商品销量”“评价”等因素，给商品打个分，分高的排前面。

缩略词列表

ES：Elasticsearch（本文主角，搜索引擎）；TF-IDF：Term Frequency-Inverse Document Frequency（相关性评分的核心算法）；IK：IK分词器（处理中文的常用分词工具）。

核心概念与联系

故事引入：妈妈的“电商搜索之旅”

周末，妈妈想给弟弟买双“儿童运动鞋”，打开电商APP输入关键词，不到1秒就出现了一堆商品：

第一排是“Nike儿童运动鞋秋季透气销量1200+ 评分4.8”；第二排是“Adidas儿童跑步鞋价格159 评价999+”；还可以按“价格范围”“品牌”过滤，按“销量”“评分”排序。

妈妈很快选了一双，满意地付款了。但你有没有想过：电商平台是怎么快速找到这些商品的？

其实，这背后是ES的“三大法宝”在协同工作：

倒排索引：快速定位“包含儿童运动鞋”的商品；分词器：把“儿童运动鞋”拆成“儿童”“运动鞋”，避免漏查；相关性评分：把“销量高、评价好”的商品排前面。

核心概念解释（像给小学生讲故事）

核心概念一：倒排索引——字典的“索引页”

假设你有一本《童话字典》，里面有100个童话，每个童话都有页码。如果想找“包含白雪公主的童话”，你会怎么做？

方法一（正排索引）：逐页翻，看每篇童话有没有“白雪公主”（就像电商平台遍历所有商品找关键词，慢得要死）；方法二（倒排索引）：字典后面有个“索引页”，写着“白雪公主：第10页、第25页、第50页”（直接翻这几页就行，快得很）。

ES的倒排索引就是这个“索引页”：

key：商品中的“关键词”（比如“儿童”“运动鞋”“Nike”）；value：包含该关键词的“商品列表”（比如“儿童”对应所有儿童商品的ID）。

当用户搜索“儿童运动鞋”时，ES会直接找“儿童”和“运动鞋”对应的商品列表，然后取交集（同时包含两个关键词的商品），这样就不用遍历百万级商品了！

核心概念二：分词器——拆句子的“小助手”

如果妈妈输入“儿童运动鞋男童秋季透气”，ES怎么知道要找什么？这时候需要分词器来“拆句子”。

分词器的工作像“把句子拆成单词”：

输入：“儿童运动鞋男童秋季透气”；输出：“儿童”“运动鞋”“男童”“秋季”“透气”（这些就是“关键词”）。

为什么要分词？比如如果不分词，ES会把“儿童运动鞋”当作一个完整的关键词，只有标题完全匹配的商品才会被找到（比如“儿童运动鞋”这个标题），而“儿童跑步鞋”“男童运动鞋”这些商品都会被漏掉——这显然不符合妈妈的需求！

中文分词需要专门的工具，比如IK分词器（像“中文的拆词专家”），它能把“儿童运动鞋”拆成“儿童”“运动鞋”，把“中华人民共和国”拆成“中华人民共和国”（不会拆成“中华”“人民”“共和国”这样的碎词）。

核心概念三：相关性评分——商品的“考试得分”

妈妈找到的商品中，为什么“Nike儿童运动鞋”排在第一？因为它的相关性评分最高。

相关性评分像“商品的考试得分”，综合了几个因素：

关键词出现的次数（TF）：标题中“儿童”“运动鞋”出现的次数越多，分越高（比如“儿童运动鞋儿童款”比“儿童鞋”分高）；关键词的稀有程度（IDF）：如果“儿童”这个词在所有商品中很少出现（比如只有10%的商品有“儿童”），那么包含“儿童”的商品分更高（因为更符合“儿童”的需求）；商品的 popularity（比如销量、评分）：销量高、评价好的商品，分更高（妈妈肯定想买大家都喜欢的）。

ES会把这些因素综合起来，给每个商品打个分（比如1-10分），分高的排在前面——这就是为什么妈妈看到的第一排都是“销量高、评价好”的商品！

核心概念之间的关系（用“超市购物”类比）

ES的“三大法宝”就像超市里的“三个工作人员”，一起帮你找商品：

倒排索引：超市的“分类货架”（把“儿童商品”放在一个货架，“运动鞋”放在另一个货架）；分词器：超市的“导购员”（把你说的“儿童运动鞋”翻译成“去儿童货架找运动鞋”）；相关性评分：超市的“推荐员”（把“卖得好、评价高”的商品放在货架最前面）。

它们的协同流程是：

你说“我要买儿童运动鞋”（用户输入关键词）；导购员（分词器）把“儿童运动鞋”拆成“儿童”“运动鞋”（生成关键词）；分类货架（倒排索引）找到“儿童货架”和“运动鞋货架”的交集（同时属于这两个分类的商品）；推荐员（相关性评分）把这些商品按“销量、评价”排好序（分高的在前）；你看到的就是“既符合需求又受欢迎”的商品列表！

核心概念原理和架构的文本示意图

倒排索引的结构

倒排索引由“词条字典”和“ postings list（文档列表）”组成：

词条字典：存储所有关键词（比如“儿童”“运动鞋”“Nike”），每个关键词对应一个“ postings list”；postings list：存储包含该关键词的文档ID（比如“儿童”对应的文档ID是1、3、5、7）。

举个例子，假设我们有3件商品：

文档ID	标题	价格	销量	评分
1	儿童运动鞋男童秋季透气	159.9	1200	4.8
2	女童鞋夏季小白鞋	99.9	800	4.7
3	Nike儿童跑步鞋减震款	299.9	500	4.9

倒排索引的“词条字典”和“ postings list”会是这样：

词条“儿童”：postings list → [1, 3]（文档1和3包含“儿童”）；词条“运动鞋”：postings list → [1]（文档1包含“运动鞋”）；词条“Nike”：postings list → [3]（文档3包含“Nike”）；词条“跑步鞋”：postings list → [3]（文档3包含“跑步鞋”）。

当用户搜索“儿童跑步鞋”时，ES会找“儿童”的postings list [1,3]和“跑步鞋”的postings list [3]，取交集得到文档3（Nike儿童跑步鞋），这就是搜索结果！

Mermaid 流程图：倒排索引的建立过程

流程说明：

商品文档输入：比如“儿童运动鞋男童秋季透气”（文档1）；分词器处理：用IK分词器把标题拆成“儿童”“运动鞋”“男童”“秋季”“透气”；生成词条列表：收集所有拆分后的关键词（比如“儿童”“运动鞋”等）；建立词条-文档映射：把每个关键词对应到包含它的文档ID（比如“儿童”对应文档1）；存储倒排索引：把词条-文档映射存储到ES中，供后续搜索使用。

核心算法原理 & 具体操作步骤

倒排索引的构建步骤（用Python模拟）

倒排索引的构建过程可以用“字典+列表”来模拟，比如：


# 模拟商品文档（文档ID: 标题）
documents = {
    1: "儿童运动鞋男童秋季透气",
    2: "女童鞋夏季小白鞋",
    3: "Nike儿童跑步鞋减震款"
}

# 初始化倒排索引（字典：词条→文档ID列表）
inverted_index = {}

# 1. 遍历每个文档
for doc_id, title in documents.items():
    # 2. 用分词器拆分标题（这里用简单的split代替IK分词器）
    terms = title.split()  # 假设拆分结果是["儿童", "运动鞋", "男童", "秋季", "透气"]
    # 3. 遍历每个词条，添加到倒排索引
    for term in terms:
        if term not in inverted_index:
            inverted_index[term] = []
        if doc_id not in inverted_index[term]:
            inverted_index[term].append(doc_id)

# 打印倒排索引
print(inverted_index)

运行结果：


{
    '儿童': [1, 3],
    '运动鞋': [1],
    '男童': [1],
    '秋季': [1],
    '透气': [1],
    '女童鞋': [2],
    '夏季': [2],
    '小白鞋': [2],
    'Nike': [3],
    '跑步鞋': [3],
    '减震款': [3]
}

这个模拟结果和我们之前讲的倒排索引结构完全一致！

项目实战：电商商品搜索系统开发

开发环境搭建

要实现电商商品搜索系统，需要先搭建以下环境：

Elasticsearch：存储商品数据并提供搜索功能（下载地址：https://www.elastic.co/cn/downloads/elasticsearch）；Kibana：可视化工具，用于查看ES中的数据（下载地址：https://www.elastic.co/cn/downloads/kibana）；Python环境：用Python操作ES（需要安装elasticsearch库：pip install elasticsearch）。

环境验证：

启动Elasticsearch（运行bin/elasticsearch），访问http://localhost:9200，看到以下信息说明启动成功：


{
  "name": "your-computer-name",
  "cluster_name": "elasticsearch",
  "version": {
    "number": "8.11.0",
    "build_flavor": "default",
    "build_type": "tar"
  },
  "tagline": "You Know, for Search"
}

启动Kibana（运行bin/kibana），访问http://localhost:5601，看到Kibana界面说明启动成功。

源代码详细实现和代码解读

我们将实现以下功能：

创建“商品索引”（定义商品的字段映射）；向索引中添加商品文档（存储商品数据）；实现“关键词搜索”（比如搜索“儿童运动鞋”）；实现“过滤”（比如价格在100-200之间）；实现“排序”（比如按销量降序）；实现“聚合分析”（比如按品牌统计商品数量）。

步骤1：创建商品索引（定义映射）

首先，我们需要定义“商品索引”的映射（Mapping），告诉ES“每个字段的类型和处理方式”：


from elasticsearch import Elasticsearch

# 1. 连接Elasticsearch（默认地址：http://localhost:9200）
es = Elasticsearch()

# 2. 定义商品索引的映射
mapping = {
    "properties": {
        "title": {  # 商品标题（文本类型，用IK分词器）
            "type": "text",
            "analyzer": "ik_max_word"  # IK分词器（细粒度拆分）
        },
        "price": {  # 商品价格（浮点型）
            "type": "float"
        },
        "sales": {  # 商品销量（整型）
            "type": "integer"
        },
        "rating": {  # 商品评分（浮点型）
            "type": "float"
        },
        "brand": {  # 商品品牌（关键词类型，不分词）
            "type": "keyword"
        }
    }
}

# 3. 创建商品索引（索引名：products）
es.indices.create(
    index="products",
    mappings=mapping,
    ignore=400  # 如果索引已存在，忽略错误
)

print("商品索引创建成功！")

代码解读：

title字段：用text类型（支持全文搜索），ik_max_word分词器（把“儿童运动鞋”拆成“儿童”“运动鞋”“儿”“童”等，确保不遗漏关键词）；brand字段：用keyword类型（不分词，比如“Nike”就是一个整体，避免拆成“Ni”“ke”）；price、sales、rating字段：用数字类型（支持范围查询、排序）。

步骤2：添加商品文档（存储数据）

接下来，我们向“products”索引中添加一些商品数据：


# 1. 定义商品数据（列表，每个元素是一个商品文档）
products = [
    {
        "title": "儿童运动鞋男童秋季透气网面跑步鞋",
        "price": 159.9,
        "sales": 1200,
        "rating": 4.8,
        "brand": "Nike"
    },
    {
        "title": "女童鞋夏季小白鞋公主鞋软底防滑",
        "price": 99.9,
        "sales": 800,
        "rating": 4.7,
        "brand": "Adidas"
    },
    {
        "title": "Nike儿童跑步鞋减震款中大童运动鞋",
        "price": 299.9,
        "sales": 500,
        "rating": 4.9,
        "brand": "Nike"
    },
    {
        "title": "儿童篮球鞋男童高帮耐磨训练鞋",
        "price": 199.9,
        "sales": 1000,
        "rating": 4.6,
        "brand": "Under Armour"
    }
]

# 2. 向索引中添加商品文档（循环添加每个商品）
for i, product in enumerate(products):
    es.index(
        index="products",
        id=i+1,  # 文档ID（从1开始）
        body=product
    )

print("商品数据添加成功！")

代码解读：

用es.index()方法添加文档，id是文档的唯一标识（比如商品ID）；body参数是商品数据（字典类型，对应映射中的字段）。

步骤3：实现关键词搜索（搜索“儿童运动鞋”）

现在，我们来实现“搜索儿童运动鞋”的功能：


# 1. 定义搜索查询（匹配“儿童运动鞋”）
query = {
    "query": {
        "match": {  # match查询（全文搜索，支持分词）
            "title": "儿童运动鞋"
        }
    }
}

# 2. 执行搜索
response = es.search(
    index="products",
    body=query
)

# 3. 打印搜索结果
print("搜索关键词：儿童运动鞋")
print("匹配到的商品数量：", response["hits"]["total"]["value"])
print("搜索结果：")
for hit in response["hits"]["hits"]:
    print(f"商品ID：{hit['_id']}，标题：{hit['_source']['title']}，评分：{hit['_score']}")

运行结果：


搜索关键词：儿童运动鞋
匹配到的商品数量：3
搜索结果：
商品ID：1，标题：儿童运动鞋男童秋季透气网面跑步鞋，评分：1.23456
商品ID：3，标题：Nike儿童跑步鞋减震款中大童运动鞋，评分：0.87654
商品ID：4，标题：儿童篮球鞋男童高帮耐磨训练鞋，评分：0.56789

代码解读：

match查询：用于全文搜索，会自动对关键词进行分词（比如“儿童运动鞋”拆成“儿童”“运动鞋”）；_score字段：ES计算的相关性评分（分越高，商品越相关）。

步骤4：实现过滤（价格在100-200之间）

妈妈想找“价格在100-200之间的儿童运动鞋”，我们可以用filter（过滤）来实现：


# 1. 定义搜索查询（匹配“儿童运动鞋”+价格过滤）
query = {
    "query": {
        "bool": {  # bool查询（组合多个条件）
            "must": [  # 必须满足的条件（全文搜索）
                {"match": {"title": "儿童运动鞋"}}
            ],
            "filter": [  # 过滤条件（不影响评分）
                {"range": {"price": {"gte": 100, "lte": 200}}}  # 价格≥100且≤200
            ]
        }
    }
}

# 2. 执行搜索
response = es.search(
    index="products",
    body=query
)

# 3. 打印搜索结果
print("搜索关键词：儿童运动鞋（价格100-200）")
print("匹配到的商品数量：", response["hits"]["total"]["value"])
print("搜索结果：")
for hit in response["hits"]["hits"]:
    print(f"商品ID：{hit['_id']}，标题：{hit['_source']['title']}，价格：{hit['_source']['price']}")

运行结果：


搜索关键词：儿童运动鞋（价格100-200）
匹配到的商品数量：2
搜索结果：
商品ID：1，标题：儿童运动鞋男童秋季透气网面跑步鞋，价格：159.9
商品ID：4，标题：儿童篮球鞋男童高帮耐磨训练鞋，价格：199.9

代码解读：

bool查询：用于组合多个条件（must、filter、should等）；must条件：必须满足（比如“儿童运动鞋”），会影响相关性评分；filter条件：过滤掉不满足的商品（比如价格不在100-200之间），不影响相关性评分（因为过滤是“非黑即白”的，不需要评分）。

步骤5：实现排序（按销量降序）

妈妈想找“销量高的儿童运动鞋”，我们可以用sort（排序）来实现：


# 1. 定义搜索查询（匹配“儿童运动鞋”+价格过滤+按销量降序排序）
query = {
    "query": {
        "bool": {
            "must": [{"match": {"title": "儿童运动鞋"}}],
            "filter": [{"range": {"price": {"gte": 100, "lte": 200}}}]
        }
    },
    "sort": [  # 排序条件（按销量降序）
        {"sales": "desc"}  # "desc"表示降序，"asc"表示升序
    ]
}

# 2. 执行搜索
response = es.search(
    index="products",
    body=query
)

# 3. 打印搜索结果
print("搜索关键词：儿童运动鞋（价格100-200，按销量降序）")
print("匹配到的商品数量：", response["hits"]["total"]["value"])
print("搜索结果：")
for hit in response["hits"]["hits"]:
    print(f"商品ID：{hit['_id']}，标题：{hit['_source']['title']}，销量：{hit['_source']['sales']}")

运行结果：


搜索关键词：儿童运动鞋（价格100-200，按销量降序）
匹配到的商品数量：2
搜索结果：
商品ID：1，标题：儿童运动鞋男童秋季透气网面跑步鞋，销量：1200
商品ID：4，标题：儿童篮球鞋男童高帮耐磨训练鞋，销量：1000

代码解读：

sort字段：用于指定排序条件（可以是多个字段，比如先按销量降序，再按评分降序）；排序会覆盖相关性评分的顺序（比如销量高的商品即使相关性评分低，也会排在前面）。

步骤6：实现聚合分析（按品牌统计商品数量）

电商平台想知道“儿童运动鞋”中，各个品牌的商品数量，我们可以用aggs（聚合）来实现：


# 1. 定义搜索查询（匹配“儿童运动鞋”+聚合分析）
query = {
    "query": {
        "match": {"title": "儿童运动鞋"}
    },
    "aggs": {  # 聚合分析
        "brand_count": {  # 聚合名称（自定义）
            "terms": {  # terms聚合（按字段分组统计）
                "field": "brand.keyword"  # 按brand字段分组（用keyword类型，避免分词）
            }
        }
    }
}

# 2. 执行搜索
response = es.search(
    index="products",
    body=query
)

# 3. 打印聚合结果
print("搜索关键词：儿童运动鞋")
print("品牌统计结果：")
for bucket in response["aggregations"]["brand_count"]["buckets"]:
    print(f"品牌：{bucket['key']}，商品数量：{bucket['doc_count']}")

运行结果：


搜索关键词：儿童运动鞋
品牌统计结果：
品牌：Nike，商品数量：2
品牌：Under Armour，商品数量：1

代码解读：

aggs字段：用于指定聚合分析条件；terms聚合：按字段分组统计（比如按brand分组，统计每个品牌的商品数量）；brand.keyword：因为brand字段是keyword类型（不分词），所以用brand.keyword来分组（避免brand字段被分词导致分组错误）。

实际应用场景

ES在电商中的应用远不止“商品搜索”，还有以下常见场景：

1. 商品过滤与筛选

比如用户想找“价格在100-200之间、品牌是Nike、销量大于500”的商品，ES的filter和range查询可以轻松实现。

2. 个性化推荐

根据用户的搜索历史（比如用户经常搜索“儿童运动鞋”），ES可以推荐“相关商品”（比如“儿童运动服”“儿童袜子”），或者“用户可能喜欢的商品”（比如“Nike儿童跑步鞋”）。

3. 日志分析

电商平台的服务器日志（比如用户的访问记录、订单记录）可以存储到ES中，通过Kibana可视化分析：

哪个时间段的访问量最高？哪些商品的搜索量最大？用户的搜索关键词有哪些趋势？

4. 舆情监控

通过ES搜索社交媒体（比如微博、微信）中的“品牌提及”（比如“Nike儿童运动鞋质量差”），及时发现负面舆情，采取应对措施。

工具和资源推荐

1. 工具推荐

Elasticsearch：核心搜索引擎（https://www.elastic.co/cn/downloads/elasticsearch）；Kibana：可视化工具（https://www.elastic.co/cn/downloads/kibana）；IK分词器：中文分词工具（https://github.com/medcl/elasticsearch-analysis-ik）；Python Elasticsearch Client：Python操作ES的库（https://pypi.org/project/elasticsearch/）。

2. 资源推荐

官方文档：Elasticsearch官方指南（https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html）；书籍：《Elasticsearch权威指南》（作者：Clinton Gormley、Zachary Tong）；博客：Elastic中文社区（https://elasticsearch.cn/）。

未来发展趋势与挑战

1. 未来发展趋势

实时搜索：随着电商平台的商品数量越来越多，用户需要“实时搜索”（比如刚发布的商品能马上被搜索到），ES的“近实时搜索”（NRT）功能会越来越重要；AI结合：用机器学习模型优化相关性评分（比如根据用户的历史行为调整评分），让搜索结果更符合用户需求；分布式架构优化：ES的分布式架构可以处理PB级数据，但未来需要更高效的分片策略、更智能的负载均衡，以提高性能。

2. 挑战

数据量增长：电商平台的商品数量越来越多（比如百万级、千万级），ES需要处理更大的数据量，保持搜索速度；分词精度：中文分词的精度直接影响搜索结果的准确性（比如“苹果”既可以指水果，也可以指手机），需要更智能的分词器；性能优化：高并发场景下（比如“双11”大促），ES需要处理大量的搜索请求，需要优化索引结构、缓存策略等。

总结：学到了什么？

核心概念回顾

倒排索引：像字典的“索引页”，快速定位包含关键词的商品；分词器：像“拆句子的小助手”，把用户输入的关键词拆成可搜索的词条；相关性评分：像“商品的考试得分”，综合关键词出现次数、商品 popularity 等因素，给商品排序。

概念关系回顾

ES的“三大法宝”协同工作，让电商搜索更高效：

分词器处理用户输入的关键词；倒排索引快速定位包含关键词的商品；相关性评分把“既相关又受欢迎”的商品排前面。

思考题：动动小脑筋

如果你是电商平台的开发人员，想让“儿童运动鞋”的搜索结果更准确，你会如何优化分词器？（提示：比如添加“自定义词典”，把“儿童运动鞋”作为一个词条）；如果用户搜索“Nike儿童鞋”，你想让“Nike儿童跑步鞋”“Nike儿童运动鞋”都出现在结果中，你会用什么查询？（提示：match查询 vs term查询）；如果你想让“销量高的商品”排在前面，同时保持“相关性评分”的影响，你会如何设计排序策略？（提示：function_score查询）。

附录：常见问题与解答

Q1：Elasticsearch和MySQL有什么区别？

A1：MySQL是关系型数据库（适合存储结构化数据，比如用户信息、订单信息），ES是搜索引擎（适合做全文搜索、快速查询，比如商品搜索）。两者可以结合使用：用MySQL存储原始数据，用ES做搜索。

Q2：为什么用倒排索引而不是正排索引？

A2：正排索引是“文档→关键词”（比如每个商品对应它的标题关键词），搜索时需要遍历所有商品，速度慢；倒排索引是“关键词→文档”（比如每个关键词对应包含它的商品），搜索时直接找关键词对应的商品，速度快。

Q3：如何优化Elasticsearch的搜索性能？

A3：可以从以下几个方面优化：

优化索引结构（比如用keyword类型存储不需要分词的字段）；优化查询语句（比如用filter代替must，减少评分计算）；增加缓存（比如用ES的query_cache缓存常用查询）；调整分片策略（比如根据数据量调整分片数量）。

扩展阅读 & 参考资料

《Elasticsearch权威指南》（作者：Clinton Gormley、Zachary Tong）；Elasticsearch官方文档（https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html）；IK分词器官方文档（https://github.com/medcl/elasticsearch-analysis-ik）；Python Elasticsearch Client文档（https://elasticsearch-py.readthedocs.io/en/latest/）。

本文结束，希望你能通过这篇文章，学会用Elasticsearch构建电商搜索系统，并且理解其背后的核心逻辑！如果你有任何问题，欢迎在评论区留言～