Hướng dẫn how do you read a specific tag in an xml file in python? - làm cách nào để bạn đọc một thẻ cụ thể trong tệp xml bằng python?
XML là viết tắt của ngôn ngữ đánh dấu mở rộng. Nó được thiết kế để lưu trữ và vận chuyển một lượng dữ liệu nhỏ đến trung bình và được sử dụng rộng rãi để chia sẻ thông tin có cấu trúc. Python cho phép bạn phân tích và sửa đổi các tài liệu XML. Để phân tích tài liệu XML, bạn cần có toàn bộ tài liệu XML trong bộ nhớ. Trong hướng dẫn này, chúng ta sẽ xem cách chúng ta có thể sử dụng lớp XML Minidom trong Python để tải và phân tích các tệp XML. Chúng tôi đã tạo một tệp XML mẫu mà chúng tôi sẽ phân tích. Bước 1) Tạo tệp XML mẫu Bên trong tập tin, chúng ta có thể thấy tên, họ, nhà và lĩnh vực chuyên môn (SQL, Python, thử nghiệm và kinh doanh) Bước 2) Sử dụng hàm phân tích cú pháp để tải và phân tích tệp XML Khi chúng tôi đã phân tích cú pháp tài liệu, chúng tôi sẽ in ra tên nút của tên gốc của gốc của tài liệu và tên đầu tiên của trò chơi. TagName và Nodename là các thuộc tính tiêu chuẩn của tệp XML.“node name” of the root of the document and the “firstchild tagname”. Tagname and nodename are the standard properties of the XML file.
Ghi chú:: Tên gật đầu và tên con là tên hoặc thuộc tính tiêu chuẩn của XML DOM. Bước 3) Gọi danh sách các thẻ XML từ tài liệu XML và được in ra Tiếp theo, chúng tôi cũng có thể gọi danh sách các thẻ XML từ tài liệu XML và được in ra. Ở đây chúng tôi đã in ra tập hợp các kỹ năng như SQL, Python, thử nghiệm và kinh doanh.
Chúng ta có thể tạo một thuộc tính mới bằng cách sử dụng chức năng created createdEement và sau đó nối phần thuộc tính hoặc thẻ mới này vào các thẻ XML hiện có. Chúng tôi đã thêm một thẻ mới, Bigdata, trong tệp XML của chúng tôi.
Ví dụ trình phân tích cú pháp XMLVí dụ Python 2 import xml.dom.minidom def main(): # use the parse() function to load and parse an XML file doc = xml.dom.minidom.parse("Myxml.xml"); # print out the document node and the name of the first child tag print doc.nodeName print doc.firstChild.tagName # get a list of XML tags from the document and print each one expertise = doc.getElementsByTagName("expertise") print "%d expertise:" % expertise.length for skill in expertise: print skill.getAttribute("name") #Write a new XML tag and add it into the document newexpertise = doc.createElement("expertise") newexpertise.setAttribute("name", "BigData") doc.firstChild.appendChild(newexpertise) print " " expertise = doc.getElementsByTagName("expertise") print "%d expertise:" % expertise.length for skill in expertise: print skill.getAttribute("name") if name == "__main__": main(); Ví dụ Python 3 import xml.dom.minidom def main(): # use the parse() function to load and parse an XML file doc = xml.dom.minidom.parse("Myxml.xml"); # print out the document node and the name of the first child tag print (doc.nodeName) print (doc.firstChild.tagName) # get a list of XML tags from the document and print each one expertise = doc.getElementsByTagName("expertise") print ("%d expertise:" % expertise.length) for skill in expertise: print (skill.getAttribute("name")) # Write a new XML tag and add it into the document newexpertise = doc.createElement("expertise") newexpertise.setAttribute("name", "BigData") doc.firstChild.appendChild(newexpertise) print (" ") expertise = doc.getElementsByTagName("expertise") print ("%d expertise:" % expertise.length) for skill in expertise: print (skill.getAttribute("name")) if __name__ == "__main__": main(); Cách phân tích XML bằng cách sử dụng ElementTreeElementTree là API để thao tác XML. ElementTree là cách dễ dàng để xử lý các tệp XML. Chúng tôi đang sử dụng tài liệu XML sau làm dữ liệu mẫu:
Đọc XML bằng ElementTree: Trước tiên chúng ta phải nhập mô -đun xml.etree.elementtree. import xml.etree.ElementTree as ET Bây giờ, hãy để lấy phần tử gốc: root = tree.getroot() Sau đây là mã hoàn chỉnh để đọc dữ liệu XML trên import xml.etree.ElementTree as ET tree = ET.parse('items.xml') root = tree.getroot() # all items data print('Expertise Data:') for elem in root: for subelem in elem: print(subelem.text) output: Expertise Data: SQL Python Summary:Python cho phép bạn phân tích toàn bộ tài liệu XML tại một lần và không chỉ một dòng tại một thời điểm. Để phân tích tài liệu XML, bạn cần có toàn bộ tài liệu trong bộ nhớ.
Làm cách nào để đọc thẻ XML?Các thẻ XML là nhạy cảm với trường hợp và cả hai thẻ đều khác nhau. Các thẻ XML được sử dụng để xác định phạm vi của các phần tử trong tài liệu XML. Thuộc tính của thẻ XML: Có nhiều thuộc tính của các thẻ XML được thảo luận dưới đây: Mỗi tài liệu XML phải có một thẻ gốc bao quanh tài liệu XML.. The XML tags are used to define the scope of elements in XML document. Property of XML Tags: There are many property of XML tags which are discussed below: Every XML document must have a root tag which enclose the XML document.
Làm thế nào để bạn đọc dữ liệu giữa các thẻ XML trong Python?Để phân tích tài liệu XML, bạn cần có toàn bộ tài liệu trong bộ nhớ ... Để phân tích tài liệu XML .. Nhập xml.dom.minidom .. Sử dụng chức năng parse parse để phân tích cú pháp tài liệu (doc = xml.dom.minidom.parse (tên tệp) ;. Gọi danh sách các thẻ XML từ tài liệu XML bằng mã (= doc.getelementsByTagName (tên tên của thẻ XML thẻ). Làm thế nào để bạn thêm một thẻ vào XML trong Python?Thêm chúng bằng hàm subelement () và xác định thuộc tính văn bản của nó ... con = xml.Phần tử ("nhân viên") nm = xml.Subelement (trẻ em, "Tên") nm.Văn bản = Sinh viên..... Nhập XML.Etree.ElementTree là Et Tree = et.ElementTree (file = 'nhân viên.xml') root = cây..... Nhập XML.Etree.ElementTree là Et Tree = et .. Làm cách nào để đọc chuỗi XML?Bạn có thể phân tích tệp XML bằng biểu thức XPath, bạn có thể thực hiện chuyển đổi XSL, xác thực lược đồ XSD và thậm chí bạn có thể phân tích toàn bộ tệp XML dưới dạng chuỗi chỉ trong một vài dòng mã.using XPath expression, you can do XSL transformation, XSD schema validation and you can even parse whole XML file as String in just a couple of lines of code. |