Apache Xerces - DOM 解析器概述


文档对象模型是万维网联盟 (W3C) 的官方推荐。它定义了一个接口,使程序能够访问和更新 XML 文档的样式、结构和内容。支持 DOM 的 XML 解析器实现该接口。

什么时候使用?

您应该在以下情况下使用 DOM 解析器:

  • 您需要了解很多有关文档结构的信息。

  • 您需要移动文档的某些部分(例如,您可能想要对某些元素进行排序)。

  • 您需要多次使用文档中的信息。

你得到什么?

当您使用 DOM 解析器解析 XML 文档时,您会得到一个包含文档所有元素的树结构。DOM 提供了多种可用于检查文档内容和结构的函数。

优点

DOM 是操作文档结构的通用接口。其设计目标之一是为一个 DOM 兼容解析器编写的 Java 代码应该可以在任何其他 DOM 兼容解析器上运行而无需更改。

DOM接口

DOM 定义了多个 Java 接口。以下是最常见的接口 -

  • Node - DOM 的基本数据类型。

  • 元素- 您将处理的绝大多数对象都是元素。

  • Attr - 表示元素的属性。

  • 文本- 元素或属性的实际内容。

  • 文档- 代表整个 XML 文档。Document 对象通常称为 DOM 树。

常见的 DOM 方法

当您使用 DOM 时,有几种经常使用的方法 -

  • Document.getDocumentElement() - 返回文档的根元素。

  • Node.getFirstChild() - 返回给定节点的第一个子节点。

  • Node.getLastChild() - 返回给定节点的最后一个子节点。

  • Node.getNextSibling() - 这些方法返回给定节点的下一个兄弟节点。

  • Node.getPreviousSibling() - 这些方法返回给定节点的前一个兄弟节点。

  • Node.getAttribute(attrName) - 对于给定的节点,返回具有请求名称的属性。