Hướng dẫn html to plain text - html sang văn bản thuần túy

Nội phân chính

  • 1] Sử dụng .replace [/]*>/g, ‘
  • 2] Tạo phần tử DOM tạm thời và truy xuất văn bản
  • 3] Gói NPM HTML-to-Text
  • Làm cách nào để hiển thị HTML dưới dạng văn bản đơn giản?
  • Làm cách nào để chuyển đổi HTML thành Word?
  • Làm cách nào để chuyển đổi sang văn bản đơn giản?
  • Làm cách nào để lưu một trang web dưới dạng tệp văn bản?

Tôi đã làm việc với một trình soạn thảo văn bản phong phú vào một ngày khác và cần phải tước các thẻ HTML từ chuỗi và lưu trữ nó trong cơ sở dữ liệu. Và đây là một vài cách tôi học được có thể có ích cho bất cứ ai đang cố gắng làm điều tương tự. Những gì chúng tôi đang cố gắng làm là xóa các thẻ khỏi chuỗi và làm cho chuỗi có thể in dưới dạng văn bản thuần túy. Hãy để lặn và xem nó hoạt động như thế nào.
What we are trying to do is remove the tags from the string and make the string printable as plain text. Let’s dive in and see how it works.

1] Sử dụng .replace [/]*>/g, ‘

2] Tạo phần tử DOM tạm thời và truy xuất văn bản
The drawback of this method is that we can’t remove some HTML entities. It still works well though.

var myHTML= "

Jimbo.

\n

That's what she said

"; var strippedHtml = myHTML.replace[/]+>/g, '']; // Jimbo. // That's what she said console.log[stripedHtml];

3] Gói NPM HTML-to-Text

2] Tạo phần tử DOM tạm thời và truy xuất văn bản

3] Gói NPM HTML-to-Text

function convertToPlain[html]{

    // Create a new div element
    var tempDivElement = document.createElement["div"];

    // Set the HTML content with the given value
    tempDivElement.innerHTML = html;

    // Retrieve the text property of the element 
    return tempDivElement.textContent || tempDivElement.innerText || "";
}

var htmlString= "

Bears Beets Battlestar Galactica

\n

Quote by Dwight Schrute

"; console.log[convertToPlain[htmlString]]; // Expected Result: // Bears Beets Battlestar Galactica // Quote by Dwight Schrute

3] Gói NPM HTML-to-Text

3] Gói NPM HTML-to-Text

Làm cách nào để hiển thị HTML dưới dạng văn bản đơn giản?
Package.json is needed to use the package. We need to install the package first and then use it in our file.
You can find the official doc of the package here.

Làm cách nào để chuyển đổi HTML thành Word?

npm install html-to-text

3] Gói NPM HTML-to-Text

Làm cách nào để hiển thị HTML dưới dạng văn bản đơn giản?

const { htmlToText } = require['html-to-text'];

const text = htmlToText['
Nope Its not Ashton Kutcher. It is Kevin Malone.

Equally Smart and equally handsome

', { wordwrap: 130 }]; console.log[text]; // expected result: // Nope Its not Ashton Kutcher. It is Kevin Malone. // Equally Smart and equally handsome

3] Gói NPM HTML-to-Text

Làm cách nào để hiển thị HTML dưới dạng văn bản đơn giản?

Làm cách nào để chuyển đổi HTML thành Word?

Làm cách nào để hiển thị HTML dưới dạng văn bản đơn giản?

Làm cách nào để chuyển đổi HTML thành Word?replacing < with < or &60; and > with > or &62; on each HTML tag that you want to be visible. Ordinarily, HTML tags are not visible to the reader on the browser.

Làm cách nào để chuyển đổi HTML thành Word?

Làm cách nào để chuyển đổi sang văn bản đơn giản?

Làm cách nào để lưu một trang web dưới dạng tệp văn bản?

Tôi đã làm việc với một trình soạn thảo văn bản phong phú vào một ngày khác và cần phải tước các thẻ HTML từ chuỗi và lưu trữ nó trong cơ sở dữ liệu. Và đây là một vài cách tôi học được có thể có ích cho bất cứ ai đang cố gắng làm điều tương tự. Những gì chúng tôi đang cố gắng làm là xóa các thẻ khỏi chuỗi và làm cho chuỗi có thể in dưới dạng văn bản thuần túy. Hãy để lặn và xem nó hoạt động như thế nào.

Phương pháp này là một cách đơn giản và hiệu quả để xóa các thẻ khỏi văn bản. Phương thức này sử dụng phương thức chuỗi .replace[old value,new value] thay thế các giá trị thẻ HTML bằng chuỗi trống. /g được sử dụng để nó xảy ra trên toàn cầu [mọi giá trị được tìm thấy trong chuỗi được thay thế bằng quy định nếu /g được sử dụng]. Hạn chế của phương pháp này là chúng ta có thể loại bỏ một số thực thể HTML. Nó vẫn hoạt động tốt mặc dù.

Nhập chế độ FullScreenen EXIT Mode FullScreen

Làm cách nào để chuyển đổi sang văn bản đơn giản?

Làm cách nào để lưu một trang web dưới dạng tệp văn bản?click the Save As button from the File menu. Select Save As Type from the drop-down list then select Plain Text [*. txt]. Click the Save button and a File Conversion window will open.

Làm cách nào để lưu một trang web dưới dạng tệp văn bản?

Tôi đã làm việc với một trình soạn thảo văn bản phong phú vào một ngày khác và cần phải tước các thẻ HTML từ chuỗi và lưu trữ nó trong cơ sở dữ liệu. Và đây là một vài cách tôi học được có thể có ích cho bất cứ ai đang cố gắng làm điều tương tự. Những gì chúng tôi đang cố gắng làm là xóa các thẻ khỏi chuỗi và làm cho chuỗi có thể in dưới dạng văn bản thuần túy. Hãy để lặn và xem nó hoạt động như thế nào..

Phương pháp này là một cách đơn giản và hiệu quả để xóa các thẻ khỏi văn bản. Phương thức này sử dụng phương thức chuỗi .replace[old value,new value] thay thế các giá trị thẻ HTML bằng chuỗi trống. /g được sử dụng để nó xảy ra trên toàn cầu [mọi giá trị được tìm thấy trong chuỗi được thay thế bằng quy định nếu /g được sử dụng]. Hạn chế của phương pháp này là chúng ta có thể loại bỏ một số thực thể HTML. Nó vẫn hoạt động tốt mặc dù.

Nhập chế độ FullScreenen EXIT Mode FullScreen

Đây là cách hiệu quả nhất để thực hiện nhiệm vụ. Tạo một phần tử giả và gán nó cho một biến. Chúng ta có thể trích xuất sau bằng cách sử dụng các đối tượng phần tử. Gán văn bản HTML cho InsideHtml của phần tử giả và chúng ta sẽ lấy văn bản thuần túy từ các đối tượng phần tử văn bản.

Đây là gói tôi phát hiện ra gần đây. Đây là bộ chuyển đổi phân tích HTML và trả về văn bản đẹp. Nó đi kèm với nhiều tùy chọn để chuyển đổi nó thành văn bản thuần túy như wordwrap, tags, whitespaceCharacters,

function convertToPlain[html]{

    // Create a new div element
    var tempDivElement = document.createElement["div"];

    // Set the HTML content with the given value
    tempDivElement.innerHTML = html;

    // Retrieve the text property of the element 
    return tempDivElement.textContent || tempDivElement.innerText || "";
}

var htmlString= "

Bears Beets Battlestar Galactica

\n

Quote by Dwight Schrute

"; console.log[convertToPlain[htmlString]]; // Expected Result: // Bears Beets Battlestar Galactica // Quote by Dwight Schrute
0. Gói.json là cần thiết để sử dụng gói. Chúng tôi cần cài đặt gói trước và sau đó sử dụng nó trong tệp của chúng tôi. Bạn có thể tìm thấy tài liệu chính thức của gói ở đây.

Bài Viết Liên Quan

Chủ Đề