XHTML 与 HTML


由于 XHTML 是一种 XML 应用程序,因此必须更改在基于 SGML 的 HTML 4 中完全合法的某些做法。您已经在前面的章节中了解了 XHTML 语法,因此 XHTML 和 HTML 之间的差异非常明显。以下是 XHTML 和 HTML 之间的比较。

XHTML 文档必须格式正确

格式良好是 XML 引入的一个新概念。本质上,这意味着所有元素都必须有结束标签,并且您必须正确嵌套它们。

正确:嵌套元素

<p>Here is an emphasized <em>paragraph</em>.</p>

错误:元素重叠

<p>Here is an emphasized <em>paragraph.</p></em>

元素和属性必须为小写

XHTML 文档的所有 HTML 元素和属性名称必须使用小写。这种差异是必要的,因为 XHTML 文档被假定为 XML 文档,并且 XML 区分大小写。例如,<li> 和 <LI> 是不同的标签。

所有元素都需要结束标签

在 HTML 中,某些元素允许省略结束标记。但 XML 不允许省略结束标记。

正确:终止的元素

<p>Here is a paragraph.</p><p>here is another paragraph.</p>
<br><hr/>

错误:未终止的元素

<p>Here is a paragraph.<p>here is another paragraph.
<br><hr>

属性值必须始终加引号

所有属性值(包括数值)都必须加引号。

正确:引用的属性值

<td rowspan="3">

不正确:未加引号的属性值

<td rowspan=3>

属性最小化

XML 不支持属性最小化。属性值对必须完整书写。如果没有指定属性名称的值,诸如“compact”和“checked”之类的属性名称就不能出现在元素中。

正确:非最小化属性

<dl compact="compact">

错误:最小化属性

<dl compact>

属性值中的空格处理

当浏览器处理属性时,它会执行以下操作 -

  • 去除前导和尾随空白。

  • 将一个或多个空白字符(包括换行符)的序列映射到单个字间空间。

脚本和样式元素

在 XHTML 中,脚本和样式元素不应直接包含“<”和“&”字符(如果存在);然后它们被视为标记的开始。诸如“<”和“&”之类的实体被XML处理器识别为实体引用,用于分别显示“<”和“&”字符。

将脚本或样式元素的内容包装在 CDATA 标记部分内可以避免这些实体的扩展。

<script type="text/JavaScript">
   <![CDATA[
      ... unescaped VB or Java Script here... ...
   ]]>
</script>

另一种方法是使用外部脚本和样式文档。

具有idname属性的元素

XHTML 建议用id属性替换name属性。请注意,在 XHTML 1.0 中,这些元素的name属性已正式弃用,并将在 XHTML 的后续版本中删除。

具有预定义值集的属性

HTML 和 XHTML 都具有一些具有预定义和有限值集的属性。例如,输入元素的type属性。在 HTML 和 XML 中,这些称为枚举属性。在 HTML 4 下,这些值的解释不区分大小写,因此TEXT的值相当于text的值。

在 XHTML 下,这些值的解释区分大小写,因此所有这些值都以小写形式定义。

作为十六进制值的实体引用

HTML 和 XML 都允许使用十六进制值引用字符。在 HTML 中,可以使用&#Xnn;来进行这些引用。&#xnn; 它们是有效的,但在 XHTML 文档中,您必须仅使用小写版本,例如&#xnn;

<html> 元素是必须的

所有 XHTML 元素必须嵌套在 <html> 根元素内。所有其他元素都可以具有子元素,这些子元素必须成对并正确嵌套在其父元素中。基本文档结构是 -

<!DOCTYPE html....>

<html>
   <head> ... </head>
   <body> ... </body>
</html>