- Apache Solr 教程
- Apache Solr - 主页
- Apache Solr - 概述
- Apache Solr - 搜索引擎基础知识
- Apache Solr - Windows 环境
- Apache Solr - 在 Hadoop 上
- Apache Solr - 架构
- Apache Solr - 术语
- Apache Solr - 基本命令
- Apache Solr - 核心
- Apache Solr - 索引数据
- Apache Solr - 添加文档 (XML)
- Apache Solr - 更新数据
- Apache Solr - 删除文档
- Apache Solr - 检索数据
- Apache Solr - 查询数据
- Apache Solr - 分面
- Apache Solr 有用资源
- Apache Solr - 快速指南
- Apache Solr - 有用的资源
- Apache Solr - 讨论
Apache Solr - 概述
Solr是一个开源搜索平台,用于构建搜索应用程序。它构建在Lucene(全文搜索引擎)之上。Solr 是企业级的、快速且高度可扩展的。使用 Solr 构建的应用程序非常复杂并且具有高性能。
Yonik Seely在 2004 年创建了 Solr,以便为 CNET Networks 公司网站添加搜索功能。2006年1月,它成为Apache软件基金会下的开源项目。其最新版本 Solr 6.0 于 2016 年发布,支持执行并行 SQL 查询。
Solr 可以与 Hadoop 一起使用。由于 Hadoop 处理大量数据,Solr 帮助我们从如此大的来源中找到所需的信息。Solr不仅可以用于搜索,还可以用于存储目的。与其他NoSQL数据库一样,它是一种非关系型数据存储和处理技术。
简而言之,Solr 是一个可扩展、易于部署的搜索/存储引擎,经过优化,可搜索大量以文本为中心的数据。
Apache Solr 的特点
Solr 是 Lucene 的 Java API 的包装。因此,使用 Solr,您可以利用 Lucene 的所有功能。让我们看一下 Solr 的一些最突出的功能 -
Restful APIs - 要与 Solr 通信,并不强制要求具备 Java 编程技能。相反,您可以使用 Restful 服务与其进行通信。我们以 XML、JSON 和 .CSV 等文件格式在 Solr 中输入文档,并以相同的文件格式获取结果。
全文搜索- Solr 提供全文搜索所需的所有功能,例如标记、短语、拼写检查、通配符和自动完成。
企业就绪- 根据组织的需要,Solr 可以部署在任何类型的系统(无论大小)中,例如独立系统、分布式系统、云系统等。
灵活且可扩展- 通过扩展Java类并进行相应配置,我们可以轻松定制Solr的组件。
NoSQL 数据库- Solr 也可以用作大数据规模的 NOSQL 数据库,我们可以在集群中分配搜索任务。
管理界面- Solr 提供了一个易于使用、用户友好、功能强大的用户界面,使用它我们可以执行所有可能的任务,例如管理日志、添加、删除、更新和搜索文档。
高度可扩展- 在将 Solr 与 Hadoop 结合使用时,我们可以通过添加副本来扩展其容量。
以文本为中心并按相关性排序- Solr 主要用于搜索文本文档,并根据与用户查询的相关性按顺序传递结果。
与 Lucene 不同,使用 Apache Solr 时您不需要具备 Java 编程技能。它提供了一个出色的可立即部署的服务来构建一个具有自动完成功能的搜索框,而 Lucene 不提供这一功能。使用 Solr,我们可以针对大规模(大数据)应用程序扩展、分发和管理索引。
搜索应用中的 Lucene
Lucene 是简单但功能强大的基于 Java 的搜索库。它可用于任何应用程序以添加搜索功能。Lucene 是一个可扩展的高性能库,用于索引和搜索几乎任何类型的文本。Lucene 库提供任何搜索应用程序所需的核心操作,例如索引和搜索。
如果我们有一个包含大量数据的门户网站,那么我们很可能需要在门户中使用搜索引擎来从庞大的数据池中提取相关信息。Lucene 是任何搜索应用程序的核心,提供与索引和搜索相关的重要操作。