Hướng dẫn java remove html tags from string - java xóa các thẻ html khỏi chuỗi

Câu trả lời được chấp nhận của việc làm đơn giản là Jsoup.parse(html).text() có 2 vấn đề tiềm năng (với JSOUP 1.7.3):

  • Nó loại bỏ các dòng phá vỡ khỏi văn bản
  • Nó chuyển đổi văn bản <script> thành

{"regular string", "regular string"},
{"A link", "A link"},
{"

String str;
str.replaceAll("\\", "");
3<script>7

Before removing HTML Tags: 

Welcome to Tutorials Point

After removing HTML Tags: Welcome to Tutorials Point
7
public class RemoveHTMLTagsTest {
   public static void main(String[] args) {
      String str = "

Welcome to Tutorials Point

";       System.out.println("Before removing HTML Tags: " + str);       str = str.replaceAll("\<.*?\>", "");       System.out.println("After removing HTML Tags: " + str);    } }
1

public class RemoveHTMLTagsTest {
   public static void main(String[] args) {
      String str = "

Welcome to Tutorials Point

";       System.out.println("Before removing HTML Tags: " + str);       str = str.replaceAll("\<.*?\>", "");       System.out.println("After removing HTML Tags: " + str);    } }
1

Python3

{"regular string", "regular string"},
{"A link", "A link"},
{"