Giải mã ký tự đặc biệt python

Trong python, chúng tôi đã thảo luận về nhiều khái niệm và chuyển đổi. Nhưng đôi khi, chúng ta gặp phải tình huống cần xóa các ký tự Unicode khỏi chuỗi. Trong hướng dẫn này, chúng ta sẽ thảo luận về cách xóa tất cả các ký tự Unicode khỏi chuỗi trong python

Ký tự Unicode là gì?

Unicode là chuẩn mã hóa quốc tế được phổ biến rộng rãi và được chấp nhận trên toàn thế giới. Nó được sử dụng với các ngôn ngữ và tập lệnh khác nhau mà theo đó mỗi chữ cái, chữ số hoặc ký hiệu được gán một giá trị số duy nhất áp dụng trên các nền tảng và chương trình khác nhau

Ví dụ để loại bỏ các ký tự Unicode

Ở đây, chúng ta sẽ thảo luận về tất cả các cách khác nhau để chúng ta có thể xóa tất cả các ký tự Unicode khỏi chuỗi

1. Sử dụng phương thức mã hóa [] và giải mã []

Trong ví dụ này, chúng ta sẽ sử dụng hàm encode[] và hàm decode[] để xóa các ký tự Unicode khỏi Chuỗi. Hàm Encode[] sẽ mã hóa chuỗi thành ‘ASCII’ và báo lỗi là ‘ignore’ để loại bỏ các ký tự Unicode. Hàm Decode[] sau đó sẽ giải mã chuỗi trở lại dạng của nó. Chúng ta hãy xem ví dụ để hiểu khái niệm này một cách chi tiết

#input string
str = "This is Python \u500cPool"

#encode[] method
strencode = str.encode["ascii", "ignore"]

#decode[] method
strdecode = strencode.decode[]

#output
print["Output after removing Unicode characters : ",strdecode]

đầu ra

Python pool tutorial?"" output = "" for character in str: if character.isalnum[]: output += character print[output]

đầu ra

Giải trình

  • Đầu tiên, chúng ta sẽ lấy một chuỗi đầu vào trong biến có tên str
  • Sau đó, chúng ta sẽ lấy một chuỗi rỗng với biến có tên là đầu ra
  • Sau đó, chúng ta sẽ áp dụng vòng lặp for từ ký tự đầu tiên đến ký tự cuối cùng của chuỗi
  • Sau đó, chúng ta sẽ kiểm tra điều kiện if và nối thêm ký tự vào chuỗi trống
  • Quá trình này sẽ tiếp tục cho đến khi xuất hiện ký tự cuối cùng trong chuỗi
  • Cuối cùng, chúng tôi sẽ in đầu ra
  • Do đó, bạn có thể thấy đầu ra với tất cả các ký tự đặc biệt và khoảng trắng đã bị xóa khỏi chuỗi

4. Sử dụng biểu thức chính quy để xóa các ký tự Unicode cụ thể trong Python

Trong ví dụ này, chúng ta sẽ sử dụng biểu thức chính quy [re. sub[]] để xóa ký tự Unicode cụ thể khỏi chuỗi. Phương thức này chứa ba tham số trong đó, tôi. e. , mẫu, thay thế và chuỗi. Chúng ta hãy xem ví dụ để hiểu khái niệm này một cách chi tiết

#import re module
import re

#input string
str = "Pyéthonò Poòol!"

#re.sub[] method
Output = re.sub[r"[\xe9|\362]", "", str]

#output
print["Removing specific charcater : ",Output]

đầu ra

Giải trình

  • Đầu tiên, chúng tôi sẽ nhập mô-đun re
  • Sau đó, chúng ta sẽ lấy một chuỗi đầu vào trong biến có tên str
  • Sau đó, chúng tôi sẽ áp dụng lại. sub[] để xóa các ký tự cụ thể khỏi chuỗi và lưu kết quả đầu ra trong biến Đầu ra
  • Cuối cùng, chúng tôi sẽ in đầu ra
  • Do đó, bạn sẽ thấy đầu ra là ký tự cụ thể bị xóa khỏi chuỗi

5. Sử dụng phương thức ord[] và vòng lặp for để loại bỏ các ký tự Unicode trong Python

Trong ví dụ này, chúng ta sẽ sử dụng phương thức ord[] và vòng lặp for để xóa các ký tự Unicode khỏi chuỗi. Phương thức Ord[] chấp nhận chuỗi có độ dài 1 làm đối số và được sử dụng để trả về biểu diễn điểm mã Unicode của đối số đã truyền. Chúng ta hãy xem ví dụ để hiểu khái niệm này một cách chi tiết

#input string
str = "This is Python \u500cPool"

#ord[] function
output = ''.join[[i if ord[i] < 128 else ' ' for i in str]]

#output
print["After removing Unicode character : ",output]

đầu ra

Giải trình

  • Đầu tiên, chúng ta sẽ lấy một chuỗi đầu vào trong biến có tên str
  • Sau đó, chúng ta sẽ áp dụng hàm join[] bên trong mà chúng ta đã áp dụng phương thức ord[] và vòng lặp for và lưu đầu ra vào biến đầu ra
  • Cuối cùng, chúng tôi đã in đầu ra
  • Do đó, bạn có thể thấy đầu ra khi các ký tự Unicode bị xóa khỏi chuỗi

Phần kết luận

Trong hướng dẫn này, chúng ta đã tìm hiểu về khái niệm xóa các ký tự Unicode khỏi chuỗi. Chúng tôi đã thảo luận về tất cả các cách mà chúng tôi có thể xóa các ký tự Unicode khỏi chuỗi. Tất cả các cách được giải thích chi tiết với sự trợ giúp của các ví dụ. Bạn có thể sử dụng bất kỳ chức năng nào theo sự lựa chọn và yêu cầu của bạn trong chương trình

Tuy nhiên, nếu bạn có bất kỳ nghi ngờ hoặc câu hỏi nào, hãy cho tôi biết trong phần bình luận bên dưới. Tôi sẽ cố gắng giúp bạn trong thời gian sớm nhất

Chủ Đề