文字

文字由任何標記之外的所有字元組成(開啟元素標記,關閉元素標記等)。

<?xml version="1.0"?>
<document>
  This is some text and <b>this is some more text</b>.
</document>

文字的精確 XML 術語是字元資料。XML 規範實際上使用單詞 text 作為整個 XML 文件或解析實體,因為它在語法級別定義 XML。然而,諸如 XDM(XQuery 和 XPath 資料模型)之類的一些資料模型(其將 XML 文件表示為樹)將字元資料稱為文字節點,使得文字通常被理解為實踐中的字元資料的同義詞。

字元資料可能不包含 < 字元 - 這將被解釋為開放元素標記的第一個字元 - 它也不能包含 ]]> 字元序列。必須使用實體引用轉義相應的字元。

<?xml version="1.0"?>
<document>
  It is fine to escape the &lt; character, as well as ]]&gt;.
</document>

為方便起見,還可以通過 CDATA 部分轉義更大塊的文字(但由於顯而易見的原因,仍然不允許序列 ]]>):

<?xml version="1.0"?>
<document>
  <![CDATA[
    In a CDATA section, it is fine to write < or even & and entity references
    such as &amp; are not resolved.
  ]]>
</document>