Cải thiện bài viết
Lưu bài viết
Trong bài đăng này, chúng ta sẽ xem cách chúng ta có thể chuyển đổi mã nguồn HTML thành đối tượng JSON. Các đối tượng JSON có thể dễ dàng được chuyển giao và chúng được hỗ trợ bởi hầu hết các ngôn ngữ lập trình hiện đại. Chúng ta có thể đọc JSON từ JavaScript và phân tích nó dưới dạng đối tượng JavaScript một cách dễ dàng. JavaScript có thể được sử dụng để tạo HTML cho các trang web của bạn. & NBSP;
Chúng tôi sẽ sử dụng mô -đun XMLTOJSON trong bài đăng này. Hàm phân tích phân tích của mô -đun này lấy HTML làm đầu vào và trả về chuỗi JSON được phân tích cú pháp.xmltojson module in this post. The parse function of this module takes the HTML as the input and returns the parsed JSON string.
Cú pháp: xmltojson.parse [xml_input, xml_attribs = true, item_depth = 0, item_callback] xmltojson.parse[xml_input, xml_attribs=True, item_depth=0, item_callback]
Parameters:
- xml_input có thể là một tệp hoặc một chuỗi.can be either a file or a string.
- xml_attribs sẽ bao gồm các thuộc tính nếu được đặt thành true. Nếu không, bỏ qua chúng nếu được đặt thành sai.will include attributes if set to True. Otherwise, ignore them if set to False.
- item_depth là độ sâu của trẻ em có chức năng item_callback được gọi khi tìm thấy.is the depth of children for which item_callback function is called when found.
- item_callback là một chức năng gọi lạiis a callback function
Thiết lập môi trường:
Cài đặt các mô -đun bắt buộc:modules :
pip install xmltojson pip install requests
Steps:
- Nhập thư viện
Python3
import
xmltojson
import
json
import
requests
- Tìm nạp mã HTML và lưu nó vào một tệp.
Python3
headers
=
{
Các
Các
import
1
import
2=
import
4=
import
6=
import
8
import
9json
0json
1json
2json
3json
4json
5
import
0json
7
- Sử dụng chức năng phân tích cú pháp để chuyển đổi HTML này thành JSON. Mở tệp HTML và sử dụng chức năng phân tích cú pháp của mô -đun XMLTOJSON.xmltojson module.
Python3
import
9json
0json
1json
2json
3import
3json
5
import
0import
6=
import
8
import
0requests
0=
requests
2
- Biến JSON_ chứa chuỗi JSON mà chúng ta có thể in hoặc đổ vào một tệp.json_ variable contains a JSON string that we can print or dump into a file.
Python3
Các
import
0headers
3headers
0headers
5
- In đầu ra.
Python3
Mã hoàn chỉnh:
Python3
import
xmltojson
import
json
import
requests
headers
=
{
Các
Các
import
2=
import
4=
import
6=
import
8
import
2=
import
4=
import
6=
import
8
import
9json
0json
1json
2json
3json
4json
5
import
0json
7
import
9json
0json
1json
2json
3import
3json
5
import
0import
6=
import
8
import
0requests
0=
requests
2
import
9json
0json
1requests
6json
3json
4requests
9headers
0headers
1
import
0headers
3headers
0headers
5
import
51import
52
Output:
Biến JSON_ chứa chuỗi JSON mà chúng ta có thể in hoặc đổ vào một tệp.
Các
In đầu ra.