Поиск по шаблонам регулярных выражений Python

poisk po shablonam regulyarnyh vyrazhenij python Текст и язык

Операции разбиения и объединения строк представляют собой простой способ обработки текста, если он соответствует предполагаемому формату. Для решения более общих задач анализа текста, когда структура данных определена не так жестко, Python предоставляет средства сопоставления с регулярными выражениями. В частности, для текстовых данных, связанных с такими прикладными областями, как Интернет и базы данных, высокая гибкость регулярных выражений может оказаться очень полезной.

Регулярные выражения являются простыми строками, определяющими шабло ны для сопоставления с другими строками. Вы указываете шаблон и строку и спрашиваете, соответствует ли строка вашему шаблону. После нахождения совпадения части строки, соответствующие частям шаблона, становятся доступными сценарию. Таким образом, поиск соответствия не только дает ответ «да/нет», но и позволяет выбирать подстроки.

Строки шаблонов регулярных выражений могут быть весьма сложными (скажем честно — они могут выглядеть устрашающе). Но после того как вы освоитесь с ними, они смогут заменить собой подпрограммы поиска в строках, которые пришлось бы писать вручную, — обычно один шаблон способен выполнить работу десятков строк программного кода, выполняющего сканирование строк, и может оказаться намного быстрее. Регулярные выражения позволяют кратко описать ожидаемую структуру текста и извлекать ее части.

Использованная литература:

Марк Лутц — Программирование на Python, 4-е издание, II том, 2011

Каталог сайтов Всего.ру
Оцените статью
Секреты программирования
Добавить комментарий