Làm cách nào để chuyển đổi nội dung HTML thành văn bản thuần túy trong PHP?

Xin chào bạn, bạn có thể có nhiều nghi ngờ về Cách chuyển đổi mã HTML thành văn bản thuần túy bằng PHP. Chúng tôi hy vọng bài viết này sẽ giải quyết được tất cả những nghi ngờ trong bài viết. Hãy trở lại với bài viết

Làm cách nào để chuyển đổi nội dung HTML thành văn bản thuần túy trong PHP?
Làm cách nào để chuyển đổi nội dung HTML thành văn bản thuần túy trong PHP?

Cách chuyển đổi mã HTML thành văn bản thuần túy bằng PHP

HTML




    
    
    Convert HTML to Text


    

This is a body of text encapsulated in HTML. Let's parse it

Mã PHP để chuyển đổi HTML thành văn bản

PHP

$html = "
    
        

This is a body of text encapsulated in HTML. Let's parse it!

"; echo strip_tags($html);

Đoạn mã trên sẽ loại bỏ tất cả các thẻ và chỉ xuất văn bản

đầu ra

This is a body of text encapsulated in HTML. Let's parse it!

PHP

$html = "
    
        

This is a body of text encapsulated in HTML. Let's parse it!

"; echo strip_tags($html, '') // Don't strip Tags

đầu ra

This is a body of text encapsulated in HTML.
Let's parse it!

đọc thêm. Tải xuống tệp PDF trên nút Bấm bằng jQuery

Từ cuối cùng

Cách Chuyển Mã HTML Sang Văn Bản Thuần Bằng PHP bài viết sẽ giải đáp mọi thắc mắc của bạn

Đọc thêm. -

  • PHP 7 HTML2PDF. js Ví dụ về Chuyển đổi Mẫu HTML thành…

The following function decodes named and numeric HTML entities and works on UTF-8. Requires iconv.

________số 8_______

        if (substr($ret, $p+2, 1) == 'x')
            $char = hexdec(substr($ret, $p+3, $p2-$p-3));
        else
            $char = intval(substr($ret, $p+2, $p2-$p-2));

        //echo "$char\n";
        $newchar = iconv(
            'UCS-4', 'UTF-8',
            chr(($char>>24)&0xFF).chr(($char>>16)&0xFF).chr(($char>>8)&0xFF).chr($char&0xFF)
        );
        //echo "$newchar<$p<$p2<<\n";
        $ret = substr_replace($ret, $newchar, $p, 1+$p2-$p);
        $p2 = $p + strlen($newchar);
    }
    return $ret;
}

Những gì chúng tôi đang cố gắng làm là xóa các thẻ khỏi chuỗi và làm cho chuỗi có thể in được dưới dạng văn bản thuần túy. Hãy đi sâu vào và xem nó hoạt động như thế nào

1. Using .replace(/]>/g, ‘’)

Phương pháp này là một cách đơn giản và hiệu quả để xóa các thẻ khỏi văn bản. Phương thức này sử dụng phương thức chuỗi .replace(old value, new value) để thay thế các giá trị thẻ HTML bằng chuỗi rỗng. /g được sử dụng để nó xảy ra trên toàn cầu (mọi giá trị được tìm thấy trong chuỗi được thay thế bằng giá trị được chỉ định nếu sử dụng ____12_______)

Hạn chế của phương pháp này là chúng tôi không thể xóa một số thực thể HTML. Nó vẫn hoạt động tốt mặc dù

var myHTML = "

Jimbo.

\n

That's what she said

"
; var strippedHtml = myHTML.replace(/<[^>]+>/g, ""); // Jimbo. // That's what she said console.log(stripedHtml);

2. Tạo một phần tử DOM tạm thời và truy xuất văn bản

Đây là cách hiệu quả nhất để thực hiện nhiệm vụ. Tạo một phần tử giả và gán nó cho một biến. Chúng ta có thể trích xuất sau bằng cách sử dụng các đối tượng phần tử. Gán văn bản HTML cho InternalHTML của phần tử giả và chúng ta sẽ nhận được văn bản thuần túy từ các đối tượng phần tử văn bản

function convertToPlain(html) {
  // Create a new div element
  var tempDivElement = document.createElement("div");

  // Set the HTML content with the given value
  tempDivElement.innerHTML = html;

  // Retrieve the text property of the element
  return tempDivElement.textContent || tempDivElement.innerText || "";
}

var htmlString =
  "

Bears Beets Battlestar Galactica

\n

Quote by Dwight Schrute

"
; console.log(convertToPlain(htmlString)); // Expected Result: // Bears Beets Battlestar Galactica // Quote by Dwight Schrute

3. gói npm chuyển html thành văn bản

Đây là gói tôi phát hiện ra gần đây. Đây là trình chuyển đổi phân tích cú pháp HTML và trả về văn bản đẹp. Nó đi kèm với nhiều tùy chọn để chuyển đổi nó thành văn bản thuần túy như wordwrap, tags, whitespaceCharacters, formatters, v.v.

Bưu kiện. json là cần thiết để sử dụng gói. Chúng tôi cần cài đặt gói trước rồi sử dụng gói đó trong tệp của mình

Bạn có thể tìm tài liệu chính thức cho gói tại đây. Tôi đã sử dụng nó trong dự án vue của mình và nó hoạt động rất tốt

Làm cách nào để chuyển đổi văn bản HTML thành văn bản bình thường trong PHP?

Bạn có thể sử dụng hàm strip_tags() để chuyển đổi mã HTML thành văn bản thuần túy trong PHP. Thao tác này sẽ xóa các thẻ HTML cơ bản khỏi chuỗi và sẽ trả về chuỗi văn bản thuần túy.

Làm cách nào để lấy văn bản thuần túy từ HTML trong PHP?

Phương pháp 1. Sử dụng hàm htmlspecialchars() . Hàm htmlspecialchars() là một hàm có sẵn trong PHP, được sử dụng để chuyển đổi tất cả các ký tự được xác định trước thành các thực thể HTML.

Làm cách nào để lấy văn bản không có thẻ HTML trong PHP?

PHP cung cấp chức năng sẵn có để xóa các thẻ HTML khỏi dữ liệu. Hàm strip_tags() là một hàm có sẵn trong PHP giúp loại bỏ các thẻ HTML, XML và PHP dạng chuỗi . Nó chấp nhận hai tham số. Hàm này trả về một chuỗi có tất cả các byte NULL, thẻ HTML và PHP bị loại bỏ khỏi một $str đã cho.

Làm cách nào để xóa thẻ HTML khỏi chuỗi trong PHP?

Hàm strip_tags() tách một chuỗi khỏi các thẻ HTML, XML và PHP. Ghi chú. Nhận xét HTML luôn bị tước. Điều này không thể thay đổi với tham số allow.