英文文字不僅僅是 ASCII

定期彈出的假設是,當僅處理英文文字時,不太可能遇到 ASCII 字符集之外的字元。為了避免正確處理 Unicode 的問題,人們很想做一些事情,比如剝離非 ASCII 字元或刪除字母上的任何重音。

這些示例表明這種假設是錯誤的,即使對於英文文字,你也應該注意正確處理 Unicode 字元。