Vào thẳng nội dung

Regular Expression#

Regular Expression là gì?#

Regular Expression (Biểu thức chính quy hay viết tắt là regex hoặc regexp) là một chuỗi ký tự có mẫu (pattern) theo quy định, dùng để tìm kiếm kết quả phù hợp (match) với pattern đã cho, thường hay dùng trong search hoặc search and replace. Ngoài ra còn được dùng để kiểm tra đầu vào của các chương trình.

Nói đơn giản hơn, Regular Expression sử dụng một đoạn mẫu (pattern) để so khớp với các chuỗi khác.

Tại sao phải dùng Regular Expression?#

Dưới đây là một vài trường hợp bạn hay gặp phải mà có thể giải quyết bằng Regular Expression.

  • Bạn có một danh sách các số điện thoại với kiểu định dạng khác nhau. Làm thế nào để tìm và thay thế 6 số đầu bằng dấu X để ẩn thông tin khách hàng.
  • Bạn muốn kiểm tra thông tin người dùng như email, SĐT, IP có hợp lệ không mỗi khi họ đăng ký tài khoản.
  • Bạn muốn định dạng lại một đoạn văn bản nằm ở vị trí phù hợp với điều kiện ban đưa ra.
  • Bạn là một developer, và bạn muốn xóa một vài biến (variable) nhưng ngặt nỗi có một số function cũng chứa biến cùng tên. Bằng cách dùng Regex để chọn các biến nhưng không bao gồm các biến trong 1 function nào đó mà bạn quy định giữ lại.

Tất cả trường hợp trên đều rơi vào 2 kiểu: Search (tìm kiếm) hoặc Replace (thay thế)

Trong một vài trường hợp, Regex có thể nó giúp bạn rút ngắn hàng trăm, thậm chí hàng ngàn mã code.

Trong loạt bài hướng dẫn này, chúng ta sẽ cùng tìm hiểu cách viết các quy tắc, trường hợp sử dụng và các kịch bản thực hiện ở nhiều ngôn ngữ khác nhau.

Regular Expression có nguồn gốc từ những nghiên cứu trong toán học những năm 1950. Sau đó các quy tắc và những ý tưởng này được áp dụng vào Unix, ngôn ngữ Perl và nhiều công cụ khác như grep. Trong một thời gian dài, cái tên Regular Expression được sử dụng độc quyền trong cộng đồng Unix. Nhưng tới bây giờ thì Regular Expression đã phổ biến khắp nơi và hỗ trợ trên mọi nền tảng máy tính.

^