Lucene - 索引类


索引过程是Lucene提供的核心功能之一。下图说明了索引过程和类的使用。IndexWriter是索引过程中最重要、也是最核心的组件。

索引过程

我们将包含字段的文档添加到 IndexWriter,它使用分析器分析文档,然后根据需要创建/打开/编辑索引,并将它们存储/更新到 Directory。IndexWriter 用于更新或创建索引。它不用于读取索引。

索引类

以下是索引过程中常用的类的列表。

编号 类别和描述
1 索引编写器

此类充当在索引过程中创建/更新索引的核心组件。

2 目录

该类表示索引的存储位置。

3 分析仪

此类负责分析文档并从要索引的文本中获取标记/单词。如果没有完成分析,IndexWriter 就无法创建索引。

4 文档

此类表示带有字段的虚拟文档,其中字段是一个对象,可以包含物理文档的内容、元数据等。分析器只能理解文档。

5 场地

这是索引过程的最低单元或起点。它表示键值对关系,其中键用于标识要索引的值。让我们假设用于表示文档内容的字段将具有作为“内容”的键,并且该值可以包含文档的部分或全部文本或数字内容。Lucene 只能索引文本或数字内容。