轉義文字中的序列

字串和字元文字提供了一種轉義機制,允許明文字元程式碼,否則文字中不允許這些字元程式碼。轉義序列由反斜槓字元(\)和一個或多個其他字元組成。相同的序列在字串文字中都有效。

完整的轉義序列集如下:

轉義序列 含義
\\ 表示反斜槓(\)字元
\' 表示單引號(')字元
\" 表示雙引號(")字元
\n 表示換行符(LF)字元
\r 表示回車符(CR
\t 表示水平製表符(HT)字元
\f 表示換頁(FF)字元
\b 表示退格(BS)字元
\<octal> 表示 0 到 255 範圍內的字元程式碼。

上面的 <octal> 由一個,兩個或三個八進位制數字(‘0’到'7’)組成,它們代表 0 到 255(十進位制)之間的數字。

請注意,反斜槓後跟任何其他字元是無效的轉義序列。無效的轉義序列被 JLS 視為編譯錯誤。

參考:

Unicode 轉義

除了上面描述的字串和字元轉義序列之外,Java 還有一個更通用的 Unicode 轉義機制,如 JLS 3.3 中所定義 Unicode Escapes 。Unicode 轉義具有以下語法:

'\' 'u' <hex-digit> <hex-digit> <hex-digit> <hex-digit> 

其中 <hex-digit>'0''1''2''3''4''5''6''7''8''9''a''b''c''d''e''f''A''B''C''D''E''F'

Java 編譯器將 Unicode 轉義符對映到字元(嚴格來說是 16 位 Unicode 程式碼單元 ),並且可以在對映字元有效的原始碼中的任何位置使用。當你需要在文字中表示非 ASCII 字元時,它通常用於字元和字串文字。

在正規表示式中轉義

TBD