文本

文本由任何标记之外的所有字符组成(打开元素标记,关闭元素标记等)。

<?xml version="1.0"?>
<document>
  This is some text and <b>this is some more text</b>.
</document>

文本的精确 XML 术语是字符数据。XML 规范实际上使用单词 text 作为整个 XML 文档或解析实体,因为它在语法级别定义 XML。然而,诸如 XDM(XQuery 和 XPath 数据模型)之类的一些数据模型(其将 XML 文档表示为树)将字符数据称为文本节点,使得文本通常被理解为实践中的字符数据的同义词。

字符数据可能不包含 < 字符 - 这将被解释为开放元素标记的第一个字符 - 它也不能包含 ]]> 字符序列。必须使用实体引用转义相应的字符。

<?xml version="1.0"?>
<document>
  It is fine to escape the &lt; character, as well as ]]&gt;.
</document>

为方便起见,还可以通过 CDATA 部分转义更大块的文本(但由于显而易见的原因,仍然不允许序列 ]]>):

<?xml version="1.0"?>
<document>
  <![CDATA[
    In a CDATA section, it is fine to write < or even & and entity references
    such as &amp; are not resolved.
  ]]>
</document>