Обработка XML-файлов Python
Содержание
Что такое XML?
XML означает расширяемый язык разметки . Стандарт XML - это гибкий способ создания информационных форматов и электронного обмена структурированными данными через общедоступный Интернет, а также через корпоративные сети.
XML Parser
Объектная модель документа (DOM) , определяет стандарт для доступа и работы с документами. XML DOM определяет стандартный способ для доступа и манипулирования XML - документов. Он представляет XML-документ как древовидную структуру.
Разбор XML в Python
Python может анализировать XML-документы несколькими способами. В нем есть традиционные парсеры dom и sax. В этой главе основное внимание будет уделено использованию встроенного XML- модуля в python для синтаксического анализа XML.
Пример XML-документа
<data> <items> <item name = "product1"> </ item> <item name = "product2"> </ item> <item name = "product3"> </ item> <item name = "product4"> </ item> <item name = "product5"> </ item> </ items> </ data>
Пример:
import xml.etree.ElementTree doc = xml.etree.ElementTree.parse('data.xml').getroot() for elem in doc.findall('items/item'): print (elem.get('name'))
Вывод:
product1 product2 product3 product4 product5
Минимальная реализация DOM (xml.dom.minidom)
Пример DOM
Xml.dom.minidom минимальная реализация интерфейса объектной модели документа, с API , аналогичной на других языках. Он должен быть проще, чем полный DOM, а также значительно меньше. Программисты, которые еще не владеют DOM, должны вместо этого использовать модуль xml.etree.ElementTree для своей обработки XML.
Пример:
from xml.dom import minidom xmldoc = minidom.parse('data.xml') product_list = xmldoc.getElementsByTagName('item') print("No of Items : ", len(product_list)) for product in product_list: print(product.attributes['name'].value)
Вывод:
No of Items : 5 product1 product2 product3 product4 product5
Источник: net-informations.com