从 01 开始 从 01 开始
首页
  • 📚 计算机基础

    • 计算机简史
    • 数字电路
    • 计算机组成原理
    • 操作系统
    • Linux
    • 计算机网络
    • 数据库
    • 编程工具
    • 装机
  • 🎨 前端

    • Node
  • JavaSE
  • Java 高级
  • JavaEE

    • 构建、依赖管理
    • Ant
    • Maven
    • 日志框架
    • Junit
    • JDBC
    • XML-JSON
  • JavaWeb

    • 服务器软件
    • 环境管理和配置管理-科普篇
    • Servlet
  • Spring

    • Spring基础
  • 主流框架

    • Redis
    • Mybatis
    • Lucene
    • Elasticsearch
    • RabbitMQ
    • MyCat
    • Lombok
  • SpringMVC

    • SpringMVC 基础
  • SpringBoot

    • SpringBoot 基础
  • Windows 使用技巧
  • 手机
  • 最全面的输入法教程
  • 最全面的浏览器教程
  • Office
  • 图片类工具
  • 效率类工具
  • RSS
  • 码字工具
  • 各大平台
  • 校招
  • 五险一金等
  • 职场规划
  • 关于离职
  • 杂谈
  • 📖 读书

    • 读书工具
    • 读书笔记
  • 🌍 英语

    • 从零开始学英语
    • 英语兔的相关视频
    • Larry 想做技术大佬的相关视频
  • 🏛️ 政治

    • 反腐
    • GFW
    • 404 内容
    • 审查与自我审查
    • 互联网
    • 战争
  • 💰 经济

    • 关于税
    • 理财
  • 💪 健身

    • 睡眠
    • 皮肤
    • 口腔健康
    • 学会呼吸
    • 健身日志
  • 🏠 其他

    • 驾驶技能
    • 租房与买房
    • 厨艺
  • 电影

    • 电影推荐
  • 电视剧
  • 漫画

    • 漫画软件
    • 漫画推荐
  • 游戏

    • Steam
    • 三国杀
    • 求生之路
  • 小说
  • 关于本站
  • 关于博主
  • 打赏
  • 网站动态
  • 友人帐
  • 从零开始搭建博客
  • 搭建邮件服务器
  • 本站分享
  • 🌈 生活

    • 2022
    • 2023
    • 2024
    • 2025
  • 📇 文章索引

    • 文章分类
    • 文章归档

晓林

程序猿,自由职业者,博主,英语爱好者,健身达人
首页
  • 📚 计算机基础

    • 计算机简史
    • 数字电路
    • 计算机组成原理
    • 操作系统
    • Linux
    • 计算机网络
    • 数据库
    • 编程工具
    • 装机
  • 🎨 前端

    • Node
  • JavaSE
  • Java 高级
  • JavaEE

    • 构建、依赖管理
    • Ant
    • Maven
    • 日志框架
    • Junit
    • JDBC
    • XML-JSON
  • JavaWeb

    • 服务器软件
    • 环境管理和配置管理-科普篇
    • Servlet
  • Spring

    • Spring基础
  • 主流框架

    • Redis
    • Mybatis
    • Lucene
    • Elasticsearch
    • RabbitMQ
    • MyCat
    • Lombok
  • SpringMVC

    • SpringMVC 基础
  • SpringBoot

    • SpringBoot 基础
  • Windows 使用技巧
  • 手机
  • 最全面的输入法教程
  • 最全面的浏览器教程
  • Office
  • 图片类工具
  • 效率类工具
  • RSS
  • 码字工具
  • 各大平台
  • 校招
  • 五险一金等
  • 职场规划
  • 关于离职
  • 杂谈
  • 📖 读书

    • 读书工具
    • 读书笔记
  • 🌍 英语

    • 从零开始学英语
    • 英语兔的相关视频
    • Larry 想做技术大佬的相关视频
  • 🏛️ 政治

    • 反腐
    • GFW
    • 404 内容
    • 审查与自我审查
    • 互联网
    • 战争
  • 💰 经济

    • 关于税
    • 理财
  • 💪 健身

    • 睡眠
    • 皮肤
    • 口腔健康
    • 学会呼吸
    • 健身日志
  • 🏠 其他

    • 驾驶技能
    • 租房与买房
    • 厨艺
  • 电影

    • 电影推荐
  • 电视剧
  • 漫画

    • 漫画软件
    • 漫画推荐
  • 游戏

    • Steam
    • 三国杀
    • 求生之路
  • 小说
  • 关于本站
  • 关于博主
  • 打赏
  • 网站动态
  • 友人帐
  • 从零开始搭建博客
  • 搭建邮件服务器
  • 本站分享
  • 🌈 生活

    • 2022
    • 2023
    • 2024
    • 2025
  • 📇 文章索引

    • 文章分类
    • 文章归档
  • JavaSE

  • JavaSenior

  • JavaEE

  • JavaWeb

  • Spring

  • 主流框架

    • Redis

    • Mybatis

    • Lucene

      • 全文检索的概念
      • Lucene 概述
      • Lucene 入门案例
      • 分析器
      • 常见的 Field
      • 索引库的维护
        • 索引库的添加
        • 索引库删除
        • 索引库的修改
        • 源码
      • Lucene 索引库查询
    • Elasticsearch

    • MQ

    • MyCat

    • Lombok

  • SpringMVC

  • SpringBoot

  • Java
  • 主流框架
  • Lucene
2023-05-16
目录

索引库的维护

# 40.索引库的维护

索引库并不是一成不变的,需要维护,例如增删改查 ‍

# 索引库的添加

‍ 有时候我们的原始文档增加了,此时就需要增加索引。过程和索引库的创建是一样的,只不过创建索引库是添加一堆文档。 ‍ 我们新建一个类:IndexManager,添加一个测试方法:

public class IndexManager {
    @Test
    public void addDocument() throws Exception {
        // 创建一个IndexWriter对象,需要使用IKAnalyzer作为分析器
        Directory directory = FSDirectory.open(new File("D:\\temp\\index").toPath());
        IndexWriter indexWriter = new IndexWriter(directory, new IndexWriterConfig(new IKAnalyzer()));

        // 创建一个Document对象
        Document document = new Document();

        // 向document对象中添加域,不同的document可以有不同的域,同一个document可以有相同的域。
        document.add(new TextField("fileName", "新添加的文档", Field.Store.YES));
        document.add(new TextField("fileContent", "新添加的文档的内容", Field.Store.NO));
        document.add(new StoredField("filePath", "d:/temp/1.txt"));

        // 把文档对象写入索引库
        indexWriter.addDocument(document);

        // 关闭IndexWriter对象
        indexWriter.close();
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

‍ 然后我们可以在 Luke 中刷新下:

‍

并且可以看到第 14 个文档的 Field,注意内容是空的:

虽然内容是空的,但是搜索还是能搜到的:

# 索引库删除

‍

# 删除全部

//删除全部索引
@Test
public void deleteAllDocument() throws Exception {
    IndexWriter indexWriter = new IndexWriter(FSDirectory.open(new File("D:\\temp\\index").toPath()), new IndexWriterConfig(new IKAnalyzer()));
    indexWriter.deleteAll();
    indexWriter.close();
}
1
2
3
4
5
6
7

说明:将索引目录的索引信息全部删除,直接彻底删除,无法恢复。 此方法慎用!!

删除后,虽然 index 文件夹中还有几个文件,但是使用 Luke 可以看到是空的了:

‍

# 指定查询条件删除

除了删除全部,还可以指定条件。我们先重新创建索引

演示指定条件删除:例如删除文件名中包含 apache 的文档。

我们可以用 searchIndex 方法来查询符合条件的文档有多少个:

public void searchIndex() throws Exception {
        // 省略其他代码
        // 4. 第四步:创建一个TermQuery对象,指定查询的域和查询的关键词。
        Query query = new TermQuery(new Term("name", "apache"));
        // 省略其他代码
}
1
2
3
4
5
6

‍ 运行结果:

查询出来的总记录数:2
name: apache lucene.txt
path: D:\temp\searchsource\apache lucene.txt
size: 725
-------------分割线-----------------
name: Welcome to the Apache Solr project.txt
path: D:\temp\searchsource\Welcome to the Apache Solr project.txt
size: 5465
-------------分割线-----------------
1
2
3
4
5
6
7
8
9

‍ 或使用 luke 看到是包含 2 个的

‍

然后我们写方法删除:

//根据查询条件删除索引
@Test
public void deleteDocumentByQuery() throws Exception {
    IndexWriter indexWriter = new IndexWriter(FSDirectory.open(new File("D:\\temp\\index").toPath()), new IndexWriterConfig(new IKAnalyzer()));

    // 删除文件名中包含apache的文档
    indexWriter.deleteDocuments(new Term("name", "apache"));
    indexWriter.close();
}
1
2
3
4
5
6
7
8
9

‍ 刷新下 Luke,可以看到删除前后,document 的数量是不一样的。

# 索引库的修改

假设我们要修改 name 中包含 spring 的文档。老规矩,先重建索引(这里我们使用 IKAnalyzer 的方法来重建) ‍ 我们可以用 searchIndex 方法来查询符合条件的文档有多少个:

public void searchIndex() throws Exception {
        // 省略其他代码
        // 4. 第四步:创建一个TermQuery对象,指定查询的域和查询的关键词。
        Query query = new TermQuery(new Term("name", "spring"));
        // 省略其他代码
}
1
2
3
4
5
6

运行结果:

查询出来的总记录数:2
name: spring.txt
path: D:\temp\searchsource\spring.txt
size: 82
-------------分割线-----------------
name: spring_README.txt
path: D:\temp\searchsource\spring_README.txt
size: 3257
-------------分割线-----------------
1
2
3
4
5
6
7
8
9

然后写方法更新。更新的原理:先删除后添加

@Test
public void updateDocument() throws Exception {
    IndexWriter indexWriter = new IndexWriter(FSDirectory.open(new File("D:\\temp\\index").toPath()), new IndexWriterConfig(new IKAnalyzer()));

    Document document = new Document();
    document.add(new TextField("name", "更新之后的文档", Field.Store.YES));
    document.add(new TextField("name1", "更新之后的文档1", Field.Store.YES));
    document.add(new TextField("name2", "更新之后的文档2", Field.Store.YES));
    indexWriter.updateDocument(new Term("name", "spring"), document);

    indexWriter.close();
}
1
2
3
4
5
6
7
8
9
10
11
12

‍ 运行结果:先删除 2 个文档,然后添加一个,因此是 13 个文档

‍

并且此时查询名称带 spring 的文档,就没有了

# 源码

已将源码上传到 Gitee (opens new window) 或 GitHub (opens new window) 上。并且创建了分支 demo4,读者可以通过切换分支来查看本文的示例代码

上次更新: 2025/5/17 12:26:09
常见的 Field
Lucene 索引库查询

← 常见的 Field Lucene 索引库查询→

最近更新
01
吐槽一下《僵尸校园》
05-15
02
2025 年 4 月记
04-30
03
山西大同 “订婚强奸案” 将会给整个社会带来的影响有多严重? - 知乎 转载
04-26
更多文章>
Theme by Vdoing | Copyright © 2022-2025 | 粤 ICP 备 2022067627 号 -1 | 粤公网安备 44011302003646 号 | 点击查看十年之约
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式