HTML là cốt lõi của web, tất cả các trang bạn thấy trên internet đều là HTML, cho dù chúng được tạo động bởi JavaScript, JSP, PHP, ASP hay bất kỳ công nghệ web nào khác. Trình duyệt của bạn thực sự phân tích cú pháp HTML và hiển thị nó cho bạn Nhưng nếu chúng tôi cần phân tích cú pháp tài liệu HTML và tìm một số thành phần, thẻ, thuộc tính hoặc kiểm tra xem một thành phần cụ thể có tồn tại hay không. Trong java, chúng ta có thể trích xuất nội dung HTML và có thể phân tích cú pháp Tài liệu HTML
phương pháp tiếp cận
- Sử dụng FileReader
- Sử dụng url. openStream[]
Cách tiếp cận 1. Thư viện được gọi là FileReader cung cấp cách đọc bất kỳ Tệp nào bất kể Tiện ích mở rộng nào. Cách nối các dòng HTML vào Trình tạo chuỗi như sau
API Java HTML hỗ trợ các nhà phát triển viết, đọc, sửa đổi, điều hướng và chuyển đổi [X] tài liệu HTML từ bên trong các ứng dụng Java
giả định. API HTML cho Java hoạt động như một trình duyệt không đầu cho phép bạn tạo hoặc mở các tài liệu HTML hiện có từ nhiều nguồn khác nhau để thực hiện các thao tác thao tác như xóa và thay thế các nút HTML, lưu tài liệu HTML, trích xuất CSS từ HTML, định cấu hình hộp cát tài liệu và . Bạn có thể điều hướng các tài liệu HTML bằng cách sử dụng các phương pháp khác nhau, chẳng hạn như truyền tải phần tử, truyền tải tài liệu, truy vấn XPath và truy vấn bộ chọn CSS cũng như thao tác HTML DOM qua JavaScript, chuyển đổi tệp HTML thành hình ảnh hoặc định dạng bố cục cố định và chuyển đổi XHTML và EPUB
quy trình làm việc
Để thực hiện các thay đổi trong kho lưu trữ, bạn cần phải
- Tạo một nhánh với các thay đổi được đề xuất có tên khớp với mẫu tính năng/*
- Tạo yêu cầu kéo cho chi nhánh này. Nó sẽ được tự động chỉ định cho một người đánh giá phù hợp
- Sau khi yêu cầu được phê duyệt, nó có thể được hợp nhất
Tính năng xử lý HTML
- Được viết hoàn toàn bằng Java và hoạt động với JRE
- Hỗ trợ cả hệ điều hành
32-bit
&
0mvn compile test
- Tạo hoặc mở tài liệu HTML hiện có từ các nguồn khác nhau
- Khả năng thao tác [tạo, chỉnh sửa, xóa, thay thế] các nút HTML thông qua API
- Trích xuất các kiểu CSS cho nút HTML cụ thể
- Định cấu hình hộp cát tài liệu ảnh hưởng đến quá trình xử lý tài liệu HTML
- Hỗ trợ điều hướng thông qua tài liệu HTML theo nhiều cách khác nhau [Truyền tải phần tử, Truyền tải tài liệu, truy vấn XPath, truy vấn bộ chọn CSS]
- Thao tác HTML DOM qua JavaScript
- Chuyển đổi tài liệu web sang các định dạng tệp được hỗ trợ khác nhau
- Trích xuất văn bản từ các trang
- Tìm kiếm văn bản từ các trang
- Thêm văn bản vào tệp HTML
- Tạo, chỉnh sửa, xóa và thay thế các nút HTML
- Trích xuất các kiểu CSS cho nút HTML cụ thể
- Chuyển đổi tài liệu HTML sang các định dạng hình ảnh được hỗ trợ khác nhau. JPEG, PNG, BMP, TIFF
- Chuyển đổi tài liệu HTML sang định dạng PDF
- Chuyển đổi tài liệu HTML sang định dạng XPS
Đọc & Viết Định dạng Web
mạng. HTML, XHTML^, MHTML^^
Khác. SVG*, MD**
Lưu HTML dưới dạng
Bố cục cố định. PDF, XPS
Hình ảnh. TIFF, JPEG, PNG, BMP
Đọc định dạng
Hình ảnh. EPUB
Môi trường được hỗ trợ
- Microsoft Windows. Máy tính để bàn & Máy chủ Windows [x86, x64]
- hệ điều hành Mac. hệ điều hành Mac
- Linux. Ubuntu, OpenSUSE, CentOS và những thứ khác
- Phiên bản Java.
1,mvn compile test
2,mvn compile test
3mvn compile test
Bắt đầu với Aspose. HTML cho Java
Aspose lưu trữ tất cả các API Java tại. Bạn có thể dễ dàng sử dụng Aspose. HTML cho Java API trực tiếp trong các dự án Maven của bạn với các cấu hình đơn giản. Để biết hướng dẫn chi tiết, vui lòng truy cập Cài đặt Aspose. HTML cho Java từ trang tài liệu Kho lưu trữ Aspose
Tải HTML từ một Vị trí Từ xa
HTMLDocument document = HTMLDocument[new Url["template.html"]]; // read children nodes and get length information if [document.getBody[].getChildNodes[].getLength[] == 0] System.out.println["No ChildNodes found..."]; // print Document URI to console. As per information above, it has to be //www.w3.org/TR/html5/ System.out.println["Print Document URI = " + document.getDocumentURI[]]; // print domain name for remote HTML System.out.println["Domain Name = " + document.getDomain[]];
Làm thế nào để sử dụng các ví dụ?
Sao chép hoặc Tải xuống ZIP và trích xuất nội dung vào ổ cứng cục bộ của bạn. Dự án này sử dụng hệ thống xây dựng Maven/Gradle và có thể được mở trong bất kỳ IDE hiện đại nào như IntelliJ IDEA, Eclipse hoặc NetBeans. Để biết thêm chi tiết, hãy truy cập trang web Tài liệu của chúng tôi
Bước một
cho maven
mvn compile test
cho lớp
gradle build
Thực hiện tất cả các bài kiểm tra
maven
mvn -Dtest="com.aspose.html.examples.**" test
lớp
________số 8_______
Thực hiện bài kiểm tra đơn lẻ
maven
mvn -Dtest=Examples_Java_AdvancedUsage_DOMMutationObserver_ObserveHowNodesAreAdded test
lớp
./gradlew test --tests "com.aspose.html.examples.Examples_Java_AdvancedUsage_DOMMutationObserver_ObserveHowNodesAreAdded"
Thực hiện kiểm tra không đồng bộ trong Chủ đề
maven
mvn org.codehaus.mojo:exec-maven-plugin:3.0.0:java -Dexec.mainClass="com.aspose.html.examples.SimpleWait" -Dexec.classpathScope="test" -Dexec.cleanupDaemonThreads=false
lớp
./gradlew SimpleWait
Trang chủ. Trang sản phẩm. Tài liệu. trình diễn. Tham chiếu API. Blog. Tìm kiếm. Hỗ trợ miễn phí. Giấy phép tạm thời