10 mẫu biểu thức chính quy (Regex) thường dùng | Hữu ích cho lập trình viên
Sao chép ngay 10 mẫu thường dùng cho Email, URL, số, khoảng trắng, xuống dòng và ký tự tiếng Việt. Kiểm tra bằng công cụ để tăng hiệu quả công việc.
Danh sách các mẫu (Mục đích ・ Regex ・ Ví dụ)
| Mục đích | Regex ・ Ví dụ ・ Lưu ý |
|---|---|
| Địa chỉ Email (Cơ bản) | `^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$` — Dùng cho validation form. Để kiểm tra nghiêm ngặt theo RFC cần một mẫu phức tạp hơn. |
| Trích xuất URL | `https?://[^\s]+` — Trích xuất các URL bắt đầu bằng http/https. Có thể không bao gồm dấu câu ở cuối. |
| Chỉ cho phép số | `^\d+$` — Chỉ cho phép số nguyên. Dùng cho nhập tuổi, số lượng. |
| Ký tự chữ và số | `^[a-zA-Z0-9]+$` — Kiểm tra định dạng ID người dùng hoặc mật khẩu cơ bản. |
| Dòng trống | `^\s*$` — Phát hiện các dòng chỉ chứa khoảng trắng. Rất hữu ích khi xử lý log. |
| Xóa khoảng trắng đầu/cuối | `^\s+|\s+$` — Thay thế cho hàm trim. Dùng để xóa bỏ khoảng trắng thừa. |
| Gộp nhiều dấu cách thành một | `\s+` — Thay thế các chuỗi khoảng trắng dài bằng một dấu cách duy nhất. |
| Xuống dòng | `\r?\n` — Tương thích với cả Windows (\r\n) và Unix (\n). |
| Ký tự tiếng Việt | `[a-zA-Zà-ỹÀ-Ỹ]+` — Bao gồm các chữ cái Latinh và các chữ cái có dấu trong tiếng Việt. |
| Chuỗi trong dấu ngoặc kép | `"([^"]*)"` — Trích xuất nội dung bên trong dấu ngoặc kép. |
1. Địa chỉ Email (Cơ bản)
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
Dùng cho validation form cơ bản. Lưu ý rằng để kiểm tra tuyệt đối theo tiêu chuẩn RFC thì cần mẫu phức tạp hơn nhiều.
2. URL
https?://[^\s]+
Trích xuất các đường dẫn bắt đầu bằng http hoặc https.
3. Chỉ cho phép số
^\d+$
Chỉ cho phép các ký tự số (phù hợp cho các trường nhập liệu như tuổi).
4. Ký tự chữ và số (Alphanumeric)
^[a-zA-Z0-9]+$
Dùng để kiểm tra định dạng tên đăng nhập hoặc mã số chỉ chứa chữ cái và số.
5. Dòng trống
^\s*$
Phát hiện các dòng không chứa nội dung hoặc chỉ chứa khoảng trắng.
6. Xóa khoảng trắng ở đầu và cuối
^\s+|\s+$
Sử dụng tính năng thay thế (replace) để xóa bỏ khoảng trắng thừa ở hai đầu chuỗi văn bản.
7. Gộp nhiều dấu cách thành một
\s+
Dùng để chuẩn hóa văn bản bằng cách gộp nhiều khoảng trắng liên tiếp lại.
8. Xuống dòng
\r?\n
Xử lý ký tự xuống dòng một cách an toàn trên cả hệ điều hành Windows và Linux/Mac.
9. Ký tự tiếng Việt
[a-zA-Zà-ỹÀ-Ỹ]+
Mẫu này giúp bạn nhận diện các từ ngữ tiếng Việt có dấu.
10. Chuỗi văn bản trong dấu ngoặc kép
"([^"]*)"
Lấy ra nội dung nằm giữa hai dấu ngoặc kép. Bạn có thể lấy nội dung này thông qua nhóm bắt (capture group) số 1.