Làm cách nào để chuyển đổi mã HTML thành văn bản trong PHP?

Giá trị trả về. Hàm này trả về chuỗi đã chuyển đổi. Nếu có chuỗi đầu vào không hợp lệ thì chuỗi rỗng sẽ được trả về

Ví dụ




string htmlentities( $string, $flags, $encoding, $double_encode )
0

string htmlentities( $string, $flags, $encoding, $double_encode )
1

string htmlentities( $string, $flags, $encoding, $double_encode )
2
string htmlentities( $string, $flags, $encoding, $double_encode )
3
string htmlentities( $string, $flags, $encoding, $double_encode )
4
string htmlentities( $string, $flags, $encoding, $double_encode )
5

string htmlentities( $string, $flags, $encoding, $double_encode )
1

string htmlentities( $string, $flags, $encoding, $double_encode )
7
string htmlentities( $string, $flags, $encoding, $double_encode )
0

_______01____02____03

string htmlentities( $string, $flags, $encoding, $double_encode )
2____23
string htmlentities( $string, $flags, $encoding, $double_encode )
7
string htmlentities( $string, $flags, $encoding, $double_encode )
5

string htmlentities( $string, $flags, $encoding, $double_encode )
8

đầu ra

Làm cách nào để chuyển đổi mã HTML thành văn bản trong PHP?

Phương pháp 2. Sử dụng hàm htmlentities(). Hàm htmlentities() là một hàm có sẵn trong PHP, được sử dụng để chuyển đổi tất cả các ký tự có thể áp dụng cho các thực thể HTML. Hàm này chuyển đổi tất cả các ký tự có thể áp dụng cho thực thể HTML

cú pháp

string htmlentities( $string, $flags, $encoding, $double_encode )

Thông số. Hàm này chấp nhận bốn tham số như đã đề cập ở trên và được mô tả bên dưới

  • $chuỗi. Tham số này được sử dụng để giữ chuỗi đầu vào
  • $flags. Tham số này được sử dụng để giữ các cờ. Nó là sự kết hợp của một hoặc hai cờ, cho biết cách xử lý dấu ngoặc kép
  • mã hóa. Đây là một đối số tùy chọn chỉ định mã hóa được sử dụng khi các ký tự được chuyển đổi. Nếu mã hóa không được cung cấp thì nó được chuyển đổi theo phiên bản mặc định của PHP
  • $double_encode. Nếu double_encode bị tắt thì PHP sẽ không mã hóa các thực thể HTML hiện có. Mặc định là chuyển đổi mọi thứ

Giá trị trả về. Hàm này trả về chuỗi đã được mã hóa

Ví dụ




string htmlentities( $string, $flags, $encoding, $double_encode )
0

string htmlentities( $string, $flags, $encoding, $double_encode )
00
string htmlentities( $string, $flags, $encoding, $double_encode )
01____202______203

string htmlentities( $string, $flags, $encoding, $double_encode )
2______23
string htmlentities( $string, $flags, $encoding, $double_encode )
06
string htmlentities( $string, $flags, $encoding, $double_encode )
07
string htmlentities( $string, $flags, $encoding, $double_encode )
00
string htmlentities( $string, $flags, $encoding, $double_encode )
07
string htmlentities( $string, $flags, $encoding, $double_encode )
10
string htmlentities( $string, $flags, $encoding, $double_encode )
5

string htmlentities( $string, $flags, $encoding, $double_encode )
12

string htmlentities( $string, $flags, $encoding, $double_encode )
7
string htmlentities( $string, $flags, $encoding, $double_encode )
14
string htmlentities( $string, $flags, $encoding, $double_encode )
00
string htmlentities( $string, $flags, $encoding, $double_encode )
16

string htmlentities( $string, $flags, $encoding, $double_encode )
2______23
string htmlentities( $string, $flags, $encoding, $double_encode )
19
string htmlentities( $string, $flags, $encoding, $double_encode )
07
string htmlentities( $string, $flags, $encoding, $double_encode )
7
string htmlentities( $string, $flags, $encoding, $double_encode )
5

string htmlentities( $string, $flags, $encoding, $double_encode )
12

string htmlentities( $string, $flags, $encoding, $double_encode )
8

đầu ra

Làm cách nào để chuyển đổi mã HTML thành văn bản trong PHP?

Phương pháp 3. Phương pháp này được sử dụng để thay thế ký tự bằng bộ ký tự để có được đầu ra mong muốn. Trong phương pháp này, < được thay thế bằng < và > được thay thế bằng >

string htmlentities( $string, $flags, $encoding, $double_encode )
7

string htmlentities( $string, $flags, $encoding, $double_encode )
8

string htmlentities( $string, $flags, $encoding, $double_encode )
9

string htmlentities( $string, $flags, $encoding, $double_encode )
0

Tất nhiên, HTML là một ngôn ngữ rất hữu ích, nhưng đôi khi, trong một trang web, nó có thể gặp vấn đề. Đặc biệt nếu bạn đang sử dụng tập lệnh để phân tích văn bản trong đó. Trong bài viết này, việc chuyển đổi hoặc phân tích cú pháp mã HTML thành các biến văn bản thuần túy sẽ được khám phá

Hãy xem ví dụ HTML sẽ được phân tích cú pháp thành văn bản thuần túy –

HTML


        

This is a body of text encapsulated in HTML. Let's parse it

Bây giờ hãy xem nó bên trong một biến PHP

PHP

________số 8

Cuối cùng, trước khi chúng tôi bắt đầu, xuất ra những gì chúng tôi yêu cầu, dưới dạng văn bản thuần túy

Đây là phần nội dung văn bản được gói gọn trong HTML. Hãy phân tích nó

phương pháp một

PHP đi kèm với một phương pháp một lớp xuất sắc ngoạn mục, mới ra mắt. Cụ thể là,

$html = "
    
        

This is a body of text encapsulated in HTML. Let's parse it

";
0, chức năng dễ sử dụng này yêu cầu hai tham số sau

  1. Chuỗi HTML
  2. Ví dụ: các thẻ được phép, các thẻ mà bạn không muốn loại bỏ khỏi chuỗi HTML (thực sự khá tiện dụng)

Xem các ví dụ sau về việc sử dụng

$html = "
    
        

This is a body of text encapsulated in HTML. Let's parse it

";
0, ví dụ đầu tiên chỉ sử dụng tham số chuỗi HTML và ví dụ thứ hai có tham số thẻ cho phép

ví dụ 1

PHP

string htmlentities( $string, $flags, $encoding, $double_encode )
1

đầu ra

string htmlentities( $string, $flags, $encoding, $double_encode )
2
ví dụ 2

PHP

string htmlentities( $string, $flags, $encoding, $double_encode )
3

đầu ra

string htmlentities( $string, $flags, $encoding, $double_encode )
4

Trong 2 ví dụ này, hàm strip_tags() được chứng minh là rất nhanh để thực thi, hãy xem tài liệu về hàm bên dưới

tài liệu strip_tags()

Ngoài ra, đây là đoạn mã trên trong PHP Fiddle để chơi cùng,

Phương pháp 2

Có một thư viện dựa trên lớp được tạo đặc biệt hoàn toàn dành riêng cho việc chuyển đổi đánh dấu HTML thành đầu ra văn bản thuần túy. Nó được gọi là html2text, ít nhất phải nói là một tên gói rất mô tả. Nó có giấy phép sử dụng công khai và miễn phí, có sẵn để tải xuống từ kho lưu trữ GitHub của nó

ví dụ 1

Đầu tiên, bạn sẽ cần cài đặt gói này từ trang kho lưu trữ của nó tại đây. Cách nhanh nhất là sử dụng trình soạn thảo để tải xuống và cài đặt gói bằng lệnh sau –

$html = "
    
        

This is a body of text encapsulated in HTML. Let's parse it

";
2

Làm cách nào để chuyển đổi mã HTML thành văn bản trong PHP?

Nếu bạn chưa có Composer và muốn bắt đầu sử dụng nó, hãy làm theo hướng dẫn này về cách sử dụng Composer

Sau đó, lớp này có thể được gọi trong tập lệnh PHP của bạn dưới dạng một đối tượng và được sử dụng với kiểu mã hóa hướng đối tượng. Đây là một ví dụ về nó đang được sử dụng -

PHP

string htmlentities( $string, $flags, $encoding, $double_encode )
6

đầu ra

string htmlentities( $string, $flags, $encoding, $double_encode )
7
ví dụ 2

Nếu bạn không phải là người hâm mộ Composer và thích làm mọi thứ theo cách cũ, thì bạn chỉ cần tải xuống lớp học từ trang GitHub. Văn bản Html2. tệp php nằm trong thư mục 'src' trong kho lưu trữ. Sau khi tải xuống, hãy đặt nó vào thư mục lớp học của bạn và yêu cầu nó bằng PHP như sau

PHP

string htmlentities( $string, $flags, $encoding, $double_encode )
8

đầu ra

string htmlentities( $string, $flags, $encoding, $double_encode )
7

Tóm lược

Tôi có thể tưởng tượng rằng bạn sẽ khá ngạc nhiên về việc chuyển đổi HTML sang văn bản không có thẻ dễ dàng như thế nào. Nó cực kỳ đơn giản và có thể được thực hiện với mã rõ ràng và dễ hiểu. Đây là một trong những niềm vui khác khi sử dụng PHP, trong một số ngôn ngữ khác, nhiệm vụ đơn giản này có thể tốn thời gian không cần thiết. mã hóa hạnh phúc

Làm cách nào để trích xuất văn bản từ HTML trong PHP?

Hàm preg_match() là tùy chọn tốt nhất để trích xuất văn bản giữa các thẻ HTML bằng REGEX trong PHP.

Làm cách nào để chuyển đổi mẫu HTML thành PHP?

Chuyển đổi trang web HTML của bạn thành trang web PHP trong 40 phút .
Cài đặt và thiết lập XAMPP (máy chủ web)
Chuyển đổi một trang. trang web html vào. php
Chuyển đổi nhiều trang. trang web html vào. php
Thiết lập năm có thể thay đổi tự động với PHP
Hiển thị địa chỉ IP của người dùng
Tạo mẫu PHP chuẩn
Tạo các tệp PHP có thể tái sử dụng

Làm cách nào để giải mã thẻ HTML trong PHP?

ENT_COMPAT - Mặc định. Chỉ giải mã dấu ngoặc kép. ENT_QUOTES - Giải mã dấu ngoặc kép và dấu nháy đơn. ENT_NOQUOTES - Không giải mã bất kỳ trích dẫn nào. .
ENT_HTML401 - Mặc định. .
ENT_HTML5 - Xử lý mã dưới dạng HTML 5
ENT_XML1 - Xử lý mã dưới dạng XML 1
ENT_XHTML - Xử lý mã dưới dạng XHTML

Làm cách nào để chuyển đổi các thực thể HTML trong PHP?

Hàm htmlentities() chuyển đổi ký tự thành thực thể HTML . Mẹo. Để chuyển đổi các thực thể HTML trở lại ký tự, hãy sử dụng hàm html_entity_decode(). Mẹo. Sử dụng hàm get_html_translation_table() để trả về bảng dịch được sử dụng bởi htmlentities().