Apache Solr - 术语


在本章中,我们将尝试理解在 Solr 工作中经常使用的一些术语的真正含义。

通用术语

以下是所有类型的 Solr 设置中使用的通用术语列表 -

  • 实例- 就像tomcat 实例jetty 实例一样,该术语指的是在 JVM 内运行的应用程序服务器。Solr 的主目录提供对每个 Solr 实例的引用,其中可以配置一个或多个核心在每个实例中运行。

  • 核心- 在应用程序中运行多个索引时,您可以在每个实例中拥有多个核心,而不是多个实例每个实例都有一个核心。

  • Home - 术语 $SOLR_HOME 指的是主目录,其中包含有关核心及其索引、配置和依赖项的所有信息。

  • 分片- 在分布式环境中,数据在多个 Solr 实例之间分区,其中每个数据块可以称为分。它包含整个索引的子集。

SolrCloud 术语

在前面的章节中,我们讨论了如何以独立模式安装 Apache Solr。请注意,我们还可以以分布式模式(云环境)安装 Solr,其中 Solr 以主从模式安装。在分布式模式下,索引在主服务器上创建,并将其复制到一台或多台从服务器。

与 Solr Cloud 相关的关键术语如下:

  • 节点- 在 Solr 云中,Solr 的每个实例都被视为一个节点

  • 集群- 环境中的所有节点组合在一起形成一个集群

  • 集合- 集群具有称为集合的逻辑索引。

  • 分片- 分片是具有一个或多个索引副本的集合的一部分。

  • 副本- 在 Solr Core 中,在节点中运行的分片副本称为副本

  • Leader - 它也是分片的副本,它将 Solr Cloud 的请求分发到其余副本。

  • Zookeeper - 这是 Solr Cloud 用于集中配置和协调、管理集群并选举领导者的 Apache 项目。

配置文件

Apache Solr 中的主要配置文件如下:

  • Solr.xml - 它是 $SOLR_HOME 目录中的文件,包含 Solr Cloud 相关信息。为了加载核心,Solr 会引用此文件,这有助于识别它们。

  • Solrconfig.xml - 该文件包含与请求处理和响应格式化相关的定义和特定于核心的配置,以及索引、配置、管理内存和提交。

  • Schema.xml - 该文件包含整个架构以及字段和字段类型。

  • Core.properties - 该文件包含特定于核心的配置。它被称为核心发现,因为它包含核心的名称和数据目录的路径。它可以在任何目录中使用,该目录将被视为核心目录