Phương thức biểu thức chính quy trong Python là gì?

Một trong những ngôn ngữ lập trình phổ biến nhất hiện nay, Python có nhiều tính năng mạnh mẽ cho phép các nhà khoa học và nhà phân tích dữ liệu trích xuất giá trị thực từ dữ liệu. Một trong số đó, biểu thức chính quy trong Python, là tập hợp các ký tự đặc biệt được sử dụng để mô tả hoặc tìm kiếm các mẫu trong một chuỗi nhất định. Chúng chủ yếu được sử dụng để làm sạch dữ liệu hoặc khớp mẫu trong tệp văn bản.   

Biểu thức chính quy Python [RegEx] là gì?

Một biểu thức chính quy của Python là một chuỗi các siêu ký tự xác định một mẫu tìm kiếm. Chúng tôi sử dụng các mẫu này trong thuật toán tìm kiếm chuỗi để "tìm" hoặc "tìm và thay thế" trên các chuỗi.  

Thuật ngữ "biểu thức chính quy" thường được rút ngắn thành "RegEx"

Trong hướng dẫn này, chúng ta sẽ tìm hiểu những kiến ​​thức cơ bản về biểu thức chính quy trong Python thông qua phần trình diễn. Chúng ta sẽ bắt đầu bằng cách nhập mô-đun “re” của mình.  

Quả sung. Nhập mô-đun biểu thức chính quy [lại]

Hàm RegEx

Mô-đun “re” cung cấp một tập hợp các chức năng cho phép chúng tôi tìm kiếm một chuỗi cho phù hợp. Một số chức năng được liệt kê dưới đây

  • hàm findall[]

Hàm findall[] trả về một danh sách chứa tất cả các kết quả khớp

Ví dụ

Quả sung. hàm findall[]

  • chức năng tìm kiếm

Hàm search[] lấy một mẫu biểu thức chính quy và một chuỗi và nó tìm kiếm mẫu đó trong chuỗi. Nếu tìm kiếm thành công, search[] trả về một đối tượng khớp. Mặt khác, nó không trả lại bất kỳ

Ví dụ

Quả sung. chức năng tìm kiếm

  • chức năng tách []

Hàm split[] trả về một danh sách hiển thị vị trí chuỗi đã được tách ở mỗi lần khớp

Ví dụ

Quả sung. chức năng tách []

Nó tách chuỗi khi gặp khoảng trắng trong chuỗi

Khóa đào tạo Python

Tìm hiểu về thao tác dữ liệu trong Python Khám phá khóa học

Python RegEx. Siêu ký tự

Mọi ký tự trong Python RegEx đều là ký tự meta hoặc ký tự thông thường. Một siêu ký tự có một ý nghĩa đặc biệt, trong khi một ký tự thông thường khớp với chính nó

Một số siêu ký tự cơ bản được sử dụng trong RegEx bao gồm

  • “^”

Ký tự ‘^’ kiểm tra xem chuỗi có bắt đầu bằng một từ hoặc ký tự cụ thể không

Ví dụ.  

Quả sung. ký tự ^ trong Python RegEx

  • “$”

Ký tự ‘$‘ kiểm tra xem chuỗi có kết thúc bằng một từ hoặc ký tự cụ thể không

Ví dụ

  • “. ”

Các '. ‘ ký tự được sử dụng để kiểm tra một trong hai/hoặc điều kiện

Ví dụ

Quả sung. . tính cách

  • “+”

Điều này khớp với một hoặc nhiều lần xuất hiện của một ký tự trong một chuỗi

Ví dụ

Quả sung. + nhân vật

  • “*”

Điều này trả về 0 hoặc nhiều lần xuất hiện của một ký tự trong một chuỗi

Ví dụ

Quả sung. * tính cách

Nhân vật

Sự miêu tả

{ }

Khớp chính xác số lần xuất hiện đã chỉ định

*

Khớp không hoặc nhiều lần xuất hiện

+

So khớp một hoặc nhiều lần xuất hiện

[ ]

So khớp với một tập hợp các ký tự

khóa học miễn phí. Giới thiệu về Numpy

Nắm vững các nguyên tắc cơ bản của Numpy Đăng ký ngay

Python RegEx - Trình tự đặc biệt

Một chuỗi đặc biệt là ký hiệu ‘ \ ‘, theo sau là một trong các ký tự cụ thể. Một số trình tự đặc biệt bao gồm

  • \MỘT

Điều này kiểm tra xem chuỗi có bắt đầu bằng một ký tự cụ thể không

Ví dụ

Quả sung. \Một chuỗi trong Python RegEx

  • "\S"

Chuỗi \s trả về kết quả khớp khi chuỗi chứa các ký tự khoảng trắng

Ví dụ

Quả sung. \s trình tự

  • “\d”

Trình tự \d kiểm tra xem có bất kỳ chữ số nào trong chuỗi đã cho không

Ví dụ

Quả sung. trình tự \d

  • “\Z”

Trình tự \Z kiểm tra xem chuỗi có kết thúc bằng một từ cụ thể không

Ví dụ

Quả sung. trình tự \Z

  • “\w”

Trình tự \w trả về kết quả khớp ở mọi ký tự từ

Ví dụ

Quả sung. \w trình tự trong Python RegEx

Python RegEx - Bộ

Nhân vật

Sự miêu tả

[ à ]

Trả về kết quả khớp khi có bất kỳ ký tự nào được đề cập

[ Ah ]

Trả về kết quả khớp cho các ký tự chữ thường giữa a và h

[ ^à ]

Trả về một kết quả phù hợp cho mọi ký tự ngoại trừ a, g và h

  • “[à]”

Ví dụ

Quả sung. đặt ví dụ

  • "[Ah]"

Ví dụ

Quả sung. Đặt ví dụ trong Python RegEx

  • “[^ah]”

Ví dụ

Quả sung. đặt ví dụ

Mong muốn chuyển sang lập trình?

Phần kết luận

Trong bài viết này, chúng ta đã thảo luận về các biểu thức chính quy của Python. Chúng tôi đã xem xét các hàm và siêu ký tự khác nhau trong Python RegEx thông qua các minh họa.  

Nếu bạn có bất kỳ câu hỏi nào, vui lòng hỏi họ trong phần bình luận và chúng tôi sẽ có các chuyên gia của chúng tôi trả lời ngay cho bạn

Bạn muốn tìm hiểu thêm về Python?

Python là một công cụ thiết yếu mà tất cả các nhà phân tích và nhà khoa học dữ liệu khao khát nên thành thạo. Nếu bạn quan tâm đến việc thêm kỹ năng rất được thèm muốn này vào sơ yếu lý lịch của mình, hãy đăng ký Khóa đào tạo Python của chúng tôi ngay hôm nay

Tìm Chương trình đào tạo trực tuyến dành cho nhà phát triển Java Full Stack của chúng tôi tại các thành phố hàng đầu

NameDatePlaceFull Stack Nhóm nhà phát triển Java bắt đầu vào ngày 15 tháng 2 năm 2023,
Đợt cuối tuầnChi tiết CityView của bạnNhóm nhà phát triển Java đầy đủ ngăn xếp bắt đầu vào ngày 22 tháng 2 năm 2023,
Đợt cuối tuầnChi tiết CityView của bạnNhóm nhà phát triển Java đầy đủ ngăn xếp bắt đầu vào ngày 15 tháng 3 năm 2023,
Lô hàng cuối tuầnChi tiết CityView của bạn

Giới thiệu về tác giả

Aryan Gupta

Aryan là một người đam mê công nghệ, thích cập nhật các xu hướng công nghệ ngày nay. Anh ấy đam mê tất cả mọi thứ về công nghệ, một nhà nghiên cứu sắc sảo và viết để truyền cảm hứng. Bên cạnh công nghệ, anh ấy là một cầu thủ bóng đá tích cực và là một người đam mê trò chơi

Phương thức biểu thức chính quy là gì?

Biểu thức chính quy là các mẫu được sử dụng để so khớp các tổ hợp ký tự trong chuỗi . Trong JavaScript, biểu thức chính quy cũng là đối tượng. Các mẫu này được sử dụng với các phương thức exec[] và test[] của RegExp và với các phương thức match[], matchAll[], replace[], replaceAll[], search[] và split[] của String.

Ví dụ về biểu thức chính quy trong Python là gì?

Trong hướng dẫn này, bạn sẽ tìm hiểu về biểu thức chính quy [RegEx] và sử dụng mô-đun re của Python để làm việc với RegEx [với sự trợ giúp của các ví dụ]. Đoạn mã trên định nghĩa một mẫu RegEx. . Siêu ký tự

Biểu thức chính quy được sử dụng để làm gì?

Cụm từ thông dụng đặc biệt hữu ích cho xác định bộ lọc . Cụm từ thông dụng chứa một chuỗi ký tự xác định mẫu văn bản được đối sánh—để làm cho bộ lọc trở nên chuyên biệt hơn hoặc tổng quát hơn. Ví dụ, biểu thức chính quy ^AL[. ]* tìm kiếm tất cả các mục bắt đầu bằng AL.

Các bước để sử dụng biểu thức chính quy trong Python là gì?

Các bước so khớp biểu thức chính quy .
Nhập mô-đun regex với nhập lại
Tạo một đối tượng Regex với re. chức năng biên dịch[]. .
Truyền chuỗi bạn muốn tìm kiếm vào phương thức search[] của đối tượng Regex. .
Gọi phương thức group[] của đối tượng Match để trả về một chuỗi văn bản khớp thực tế

Chủ Đề