Обработка текстовой информации Python 19в

obrabotka tekstovoj informacii python 19v Текст и язык

Обработка текстовой информации в той или иной форме является одной из наиболее частых задач, которые приходится выполнять приложениям. Под этим может подразумеваться все, что угодно, — от просмотра текстового файла по колонкам до анализа инструкций языка, определяемого формальной грамматикой. Такую обработку обычно называют син так си че ским ана ли зом (или парсингом) — разбором структуры текстовой строки. В этой главе мы исследуем способы обработки языковой и текстовой информации, а попутно во врезках будут кратко освещаться некоторые концепции разработки на языке Python. В процессе мы познакомимся с методами строк, приемами сопоставления с шаблонами, средствами синтаксического анализа разметки XML и HTML и другими инструментами.

Часть материала является достаточно сложной, но я привожу примеры небольшого объема, чтобы не удлинять главу. Например, синтаксический анализ методом рекурсивного спуска иллюстрируется простым примером, показывающим, как он может быть реализован на языке Python. Мы также увидим, что часто нет необходимости писать специальные инструменты анализа для всех задач обработки языков в Python. Обычно вместо этого можно экспортировать прикладной интерфейс и использовать его в программе Python, а иногда достаточно одного вызова встроенной функции. Завершится эта глава представлением PyCalc — калькулятора с графическим интерфейсом, написанного на языке Python и являющегося последним крупным примером программ в этой книге. Как мы увидим, написание калькуляторов состоит в основном в жонглировании стеками во время лексического анализа текста.

Использованная литература:

Марк Лутц — Программирование на Python, 4-е издание, II том, 2011

Каталог сайтов Всего.ру
Оцените статью
Секреты программирования
Добавить комментарий