- Apache Solr 教程
- Apache Solr - 主页
- Apache Solr - 概述
- Apache Solr - 搜索引擎基础知识
- Apache Solr - Windows 环境
- Apache Solr - 在 Hadoop 上
- Apache Solr - 架构
- Apache Solr - 术语
- Apache Solr - 基本命令
- Apache Solr - 核心
- Apache Solr - 索引数据
- Apache Solr - 添加文档 (XML)
- Apache Solr - 更新数据
- Apache Solr - 删除文档
- Apache Solr - 检索数据
- Apache Solr - 查询数据
- Apache Solr - 分面
- Apache Solr 有用资源
- Apache Solr - 快速指南
- Apache Solr - 有用的资源
- Apache Solr - 讨论
Apache Solr - 删除文档
删除文档
要从 Apache Solr 的索引中删除文档,我们需要在 <delete></delete> 标记之间指定要删除的文档的 ID。
<delete> <id>003</id> <id>005</id> <id>004</id> <id>002</id> </delete>
此处,此 XML 代码用于删除 ID 为003和005的文档。将此代码保存在名为delete.xml的文件中。
如果你想从属于名为my_core的核心的索引中删除文档,那么你可以使用post工具发布delete.xml文件,如下所示。
[Hadoop@localhost bin]$ ./post -c my_core delete.xml
执行上述命令后,您将得到以下输出。
/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-core 6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files org.apache.Solr.util.SimplePostTool delete.xml SimplePostTool version 5.0.0 Posting files to [base] url http://localhost:8983/Solr/my_core/update... Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots, rtf,htm,html,txt,log POSTing file delete.xml (application/xml) to [base] 1 files indexed. COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update... Time spent: 0:00:00.179
确认
访问 Apache Solr Web 界面的主页并选择 core 作为my_core。尝试通过在文本区域q中传递查询“:”来检索所有文档并执行查询。执行时,您可以观察到指定的文档被删除。
删除字段
有时我们需要根据ID以外的字段来删除文档。例如,我们可能必须删除城市为 Chennai 的文档。
在这种情况下,您需要在 <query></query> 标记对中指定字段的名称和值。
<delete> <query>city:Chennai</query> </delete>
保存为delete_field.xml ,并使用Solr的post工具对名为my_core的core进行删除操作。
[Hadoop@localhost bin]$ ./post -c my_core delete_field.xml
执行上述命令时,它会产生以下输出。
/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-core 6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files org.apache.Solr.util.SimplePostTool delete_field.xml SimplePostTool version 5.0.0 Posting files to [base] url http://localhost:8983/Solr/my_core/update... Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots, rtf,htm,html,txt,log POSTing file delete_field.xml (application/xml) to [base] 1 files indexed. COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update... Time spent: 0:00:00.084
确认
访问 Apache Solr Web 界面的主页并选择 core 作为my_core。尝试通过在文本区域q中传递查询“:”来检索所有文档并执行查询。执行时,您可以观察到包含指定字段值对的文档被删除。
删除所有文档
就像删除特定字段一样,如果要删除索引中的所有文档,只需在标签 <query></query> 之间传递符号“:”即可,如下所示。
<delete> <query>*:*</query> </delete>
保存为delete_all.xml ,使用Solr的post工具对名为my_core的core进行删除操作。
[Hadoop@localhost bin]$ ./post -c my_core delete_all.xml
执行上述命令时,它会产生以下输出。
/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-core 6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files org.apache.Solr.util.SimplePostTool deleteAll.xml SimplePostTool version 5.0.0 Posting files to [base] url http://localhost:8983/Solr/my_core/update... Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf, htm,html,txt,log POSTing file deleteAll.xml (application/xml) to [base] 1 files indexed. COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update... Time spent: 0:00:00.138
确认
访问 Apache Solr Web 界面的主页并选择 core 作为my_core。尝试通过在文本区域q中传递查询“:”来检索所有文档并执行查询。执行时,您可以观察到包含指定字段值对的文档被删除。
使用Java(客户端API)删除所有文档
以下是将文档添加到 Apache Solr 索引的 Java 程序。将此代码保存在名为UpdatingDocument.java 的文件中。
import java.io.IOException; import org.apache.Solr.client.Solrj.SolrClient; import org.apache.Solr.client.Solrj.SolrServerException; import org.apache.Solr.client.Solrj.impl.HttpSolrClient; import org.apache.Solr.common.SolrInputDocument; public class DeletingAllDocuments { public static void main(String args[]) throws SolrServerException, IOException { //Preparing the Solr client String urlString = "http://localhost:8983/Solr/my_core"; SolrClient Solr = new HttpSolrClient.Builder(urlString).build(); //Preparing the Solr document SolrInputDocument doc = new SolrInputDocument(); //Deleting the documents from Solr Solr.deleteByQuery("*"); //Saving the document Solr.commit(); System.out.println("Documents deleted"); } }
通过在终端中执行以下命令来编译上述代码 -
[Hadoop@localhost bin]$ javac DeletingAllDocuments [Hadoop@localhost bin]$ java DeletingAllDocuments
执行上述命令后,您将得到以下输出。
Documents deleted