Hướng dẫn python re remove html tags - python lại xóa các thẻ html
26 Show Mới! Lưu câu hỏi hoặc câu trả lời và sắp xếp nội dung yêu thích của bạn. Tìm hiểu thêm. Tôi có một chuỗi chứa đánh dấu HTML như liên kết, văn bản in đậm, v.v. Tôi muốn tước tất cả các thẻ để tôi chỉ có văn bản thô. Cách tốt nhất để làm điều này là gì? Regex? Hỏi ngày 3 tháng 8 năm 2010 lúc 17:02Aug 3, 2010 at 17:02
BlankmanblankmanBlankman 252K315 Huy hiệu vàng747 Huy hiệu bạc1172 Huy hiệu đồng315 gold badges747 silver badges1172 bronze badges 0 Nếu bạn định sử dụng regex:
Đã trả lời ngày 3 tháng 8 năm 2010 lúc 17:09Aug 3, 2010 at 17:09
John Howardjohn HowardJohn Howard 57.9K23 Huy hiệu vàng48 Huy hiệu bạc65 Huy hiệu Đồng23 gold badges48 silver badges65 bronze badges 3 Afaik sử dụng Regex là một ý tưởng tồi để phân tích cú pháp HTML, bạn sẽ tốt hơn khi sử dụng trình phân tích cú pháp HTML/XML như Soup xinh đẹp. Đã trả lời ngày 3 tháng 8 năm 2010 lúc 17:17Aug 3, 2010 at 17:17
6 Sử dụng lxml.html. Nó nhanh hơn nhiều so với văn bản đẹp và thô là một lệnh duy nhất.
|