Translations:

English
Español
Français
Português do Brasil
中文版
日本語
한국어
Turkish
Greek
Magyar
Polish
Русский
Tiếng Việt
فارسی
עברית

Biểu thức chính quy là gì?

Biểu thức chính quy là một nhóm các ký tự hoặc ký hiệu được sử dụng để tìm một mẫu cụ thể từ một văn bản.

Biểu thức chính quy là một khuôn mẫu được khớp với chuỗi các từ, từ trái sang phải. Từ "Biểu thức chính quy" là một câu cửa miệng, bạn thường sẽ tìm thấy thuật ngữ viết tắt là "regex" hoặc "regexp". Biểu thức chính quy được sử dụng để thay thế một văn bản trong một chuỗi, xác thực mẫu, trích xuất một chuỗi con từ một chuỗi dựa trên khớp mẫu và hơn thế nữa.

Hãy tưởng tượng bạn đang viết một ứng dụng và bạn muốn đặt quy tắc khi người dùng chọn tên người dùng của họ. Chúng tôi muốn cho phép tên người dùng chứa các chữ cái, số, dấu gạch dưới và dấu gạch nối. Chúng tôi cũng muốn giới hạn số lượng ký tự trong tên người dùng để nó trông không xấu. Chúng tôi sử dụng biểu thức chính quy sau để xác thực tên người dùng:

Trên biểu thức chính quy có thể chấp nhận các chuỗi john_doe, jo-hn_doe và john12_as. Nó không khớp với Jo vì chuỗi đó chứa chữ hoa và nó quá ngắn.

1. Basic Matchers

Biểu thức chính quy chỉ là một mẫu các ký tự mà chúng ta sử dụng để thực hiện tìm kiếm trong văn bản. Ví dụ, biểu thức chính quy the có nghĩa là: chữ t, tiếp theo là chữ h, tiếp theo là chữ e.

"the" => The fat cat sat on the mat.

Meta character	Description
.	Khớp với tất cả các kí tự trừ dấu xuống dòng.
[ ]	Lớp kí tự. Khớp với bất kỳ ký tự nào nằm giữa dấu ngoặc vuông.
[^ ]	Lớp kí tự phủ định. Khớp với bất kỳ ký tự nào không có trong dấu ngoặc vuông.
*	Khớp 0 hoặc nhiều lần lặp lại của kí tự trước.
+	Khớp 1 hoặc nhiều lần lặp lại của kí tự trước.
?	Làm cho kí tự trước tùy chọn.
{n,m}	Braces. Khớp ít nhất là "n" nhưng không nhiều hơn "m" lặp lại của kí tự trước.
(xyz)	Nhóm kí tự. Khớp các ký tự xyz theo thứ tự chính xác đó.
\|	Thay thế. Khớp các ký tự trước hoặc ký tự sau ký hiệu.
\	Thoát khỏi kí tự tiếp theo. Điều này cho phép bạn khớp các ký tự dành riêng `[ ] ( ) { } . * + ? ^ $ \ \|`
^	Khớp với sự bắt đầu của đầu vào.
$	Khớp với kết thúc đầu vào.

Shorthand	Description
.	Bất kỳ kí tự nào ngoại trừ dòng mới
\w	Khớp các ký tự chữ và số: `[a-zA-Z0-9_]`
\W	Khớp các ký tự không phải chữ và số: `[^\w]`
\d	khớp với số trong khoảng: `[0-9]`
\D	Khớp không có chữ số: `[^\d]`
\s	Khớp các ký tự khoảng trắng: `[\t\n\f\r\p{Z}]`
\S	Khớp với ký tự không phải khoảng trắng: `[^\s]`

Kí hiệu	Mô tả
?=	Positive Lookahead
?!	Negative Lookahead
?<=	Positive Lookbehind
?<!	Negative Lookbehind

Cờ	Mô tả
i	Case insensitive: Đặt khớp với mẫu không phân biệt chữ hoa chữ thường.
g	Global Search: Tìm kiếm một mẫu trong suốt chuỗi đầu vào.
m	Multiline: ký tự Anchor meta hoạt động trên mỗi dòng.

Files

README-vn.md

Latest commit

History

README-vn.md

File metadata and controls

Translations:

Biểu thức chính quy là gì?

Table of Contents

1. Basic Matchers

2. Meta Characters

2.1 Full stop

2.2 Character set

2.2.1 Negated character set

2.3 Repetitions

2.3.1 The Star

2.3.2 The Plus

2.3.3 The Question Mark

2.4 Braces

2.5 Capturing Group

2.5.1 Non-capturing group

2.6 Alternation

2.7 Escaping special character

2.8 Anchors

2.8.1 Caret

2.8.2 Dollar

3. Shorthand Character Sets

4. Lookaround

4.1 Positive Lookahead

4.2 Negative Lookahead

4.3 Positive Lookbehind

4.4 Negative Lookbehind

5. Flags

5.1 Case Insensitive

5.2 Global search

5.3 Multiline

6. Greedy vs lazy matching

Contribution

License