Инструменты синтаксического анализа XML и HTML

instrumenty sintaksicheskogo analiza xml i html Сетевые сценарии

Хотя документы XML технически не привязаны к Интернету, тем не менее они часто используются на определенных этапах работы с ним. Следуя за многообразием применений XML, мы изучим базовую поддержку синтаксического анализа XML в Python, а также познакомимся со сторонними расширениями, выполняющими эту функцию, в следующей части книги, когда будем исследовать инструменты обработки текста, имеющиеся в Python. Как мы увидим, анализ XML обеспечивается пакетом xml из стандартной библиотеки Python, который предоставляет три вида парсеров — DOM, SAX и ElementTree, а среди открытого программного обеспечения можно, кроме того, найти расширения для поддержки XPath и многие другие инструменты. Библиотечный модуль html.parser также предоставляет инструмент синтаксического анализа разметки HTML, модель которого похожа на модель SAX для XML. Подобные инструменты используются для анализа и извлечения содержимого веб-страниц, загружаемых с помощью инструментов urllib.request.

Использованная литература:

Марк Лутц — Программирование на Python, 4-е издание, II том, 2011

Каталог сайтов Всего.ру
Оцените статью
Секреты программирования
Добавить комментарий