Escape Character trong C#
Về cơ bản, Escape Character trong C# là những ký tự đặc biệt. Ký tự dấu gạch chéo ngược (\) trong một Regular Expression chỉ rằng ký tự mà theo sau nó: hoặc là một ký tự đặc biệt hoặc nên được thông dịch theo từng ký tự.
Bảng dưới liệt kê các Escape Character trong C#:
Escape character | Miêu tả | Pattern | So khớp |
---|---|---|---|
\a | So khớp một ký tự bell, \u0007 | \a | "\u0007" trong "Warning!" + '\u0007' |
\b | Trong một lớp ký tự, so khớp một backspace, \u0008 | [\b]{3,} | "\b\b\b\b" trong "\b\b\b\b" |
\t | So khớp một tab, \u0009 | (\w+)\t | "Name\t", "Addr\t" trong "Name\tAddr\t" |
\r | So khớp một carriage return, \u000D. (\r là không tương đương với ký tự newline (dòng mới), \n) | \r\n(\w+) | "\r\nHello" trong "\r\Hello\nWorld." |
\v | So khớp một tab dọc, \u000B | [\v]{2,} | "\v\v\v" trong "\v\v\v" |
\f | So khớp một form feed, \u000C | [\f]{2,} | "\f\f\f" trong "\f\f\f" |
\n | So khớp một newline (dòng mới), \u000A | \r\n(\w+) | "\r\nHello" trong "\r\Hello\nWorld." |
\e | So khớp một escape, \u001B | \e | "\x001B" trong "\x001B" |
\nnn | Sử dụng biểu diễn hệ cơ số 8 để xác định một ký tự (nnn gồm 3 chữ số) | \w\040\w | "a b", "c d" trong "a bc d" |
\x nn | Sử dụng biểu diễn hệ cơ số 16 để xác định một ký tự (nn gồm 2 chữ số) | \w\x20\w | "a b", "c d" trong "a bc d" |
\c X\c x | So khớp ký tự điều khiển ASCII mà được xác định bởi X hoặc x, với X hoặc x là chữ cái của ký tự điều khiển | \cC | "\x0003" trong "\x0003" (Ctrl-C) |
\u nnnn | So khớp môt ký tự Unicode bởi sử dụng biểu diễn thập lục phân (gồm 4 chữ số, như được biểu diễn bởi nnnn) | \w\u0020\w | "a b", "c d" trong "a bc d" |
\ | Khi được theo sau bởi một ký tự mà không được nhận ra như là một Escape Character, thì so khớp ký tự đó | \d+[\+-x\*]\d+\d+[\+-x\*\d+ | "2+2" and "3*9" trong "(2+2) * 3*9" |
Bài học C# phổ biến khác tại hoconline.club:
regular_expression_trong_csharp.jsp
Bài viết liên quan