转义文字中的序列

字符串和字符文字提供了一种转义机制,允许明文字符代码,否则文字中不允许这些字符代码。转义序列由反斜杠字符(\)和一个或多个其他字符组成。相同的序列在字符串文字中都有效。

完整的转义序列集如下:

转义序列 含义
\\ 表示反斜杠(\)字符
\' 表示单引号(')字符
\" 表示双引号(")字符
\n 表示换行符(LF)字符
\r 表示回车符(CR
\t 表示水平制表符(HT)字符
\f 表示换页(FF)字符
\b 表示退格(BS)字符
\<octal> 表示 0 到 255 范围内的字符代码。

上面的 <octal> 由一个,两个或三个八进制数字(‘0’到'7’)组成,它们代表 0 到 255(十进制)之间的数字。

请注意,反斜杠后跟任何其他字符是无效的转义序列。无效的转义序列被 JLS 视为编译错误。

参考:

Unicode 转义

除了上面描述的字符串和字符转义序列之外,Java 还有一个更通用的 Unicode 转义机制,如 JLS 3.3 中所定义 Unicode Escapes 。Unicode 转义具有以下语法:

'\' 'u' <hex-digit> <hex-digit> <hex-digit> <hex-digit> 

其中 <hex-digit>'0''1''2''3''4''5''6''7''8''9''a''b''c''d''e''f''A''B''C''D''E''F'

Java 编译器将 Unicode 转义符映射到字符(严格来说是 16 位 Unicode 代码单元 ),并且可以在映射字符有效的源代码中的任何位置使用。当你需要在文字中表示非 ASCII 字符时,它通常用于字符和字符串文字。

在正则表达式中转义

TBD