Инструменты обработки структурированной разметки¶
Python поддерживает множество модулей для работы с различными формами структурированной разметки данных. Он включает в себя модули для работы с стандартным обобщённым языком разметки (SGML) и языком разметки гипертекста (HTML), а также несколько интерфейсов для работы с расширяемым языком разметки (XML).
html
— Поддержка языка гипертекстовой разметкиhtml.parser
— Простой HTML и XHTML парсерhtml.entities
— Определения общих сущностей HTML- Модули обработки XML
xml.etree.ElementTree
— ElementTree XML APIxml.dom
— API объектной модели документаxml.dom.minidom
— Минимальная реализация DOMxml.dom.pulldom
— Поддержка построения частичных деревьев DOMxml.sax
— Поддержка SAX2 парсеровxml.sax.handler
— Базовые классы для обработчиков SAXxml.sax.saxutils
— Утилиты SAXxml.sax.xmlreader
— Интерфейс для XML парсеровxml.parsers.expat
— Быстрый парсинг XML с использованием Expat