Еще более сложные задачи синтаксического анализа естественных языков требуют использования приемов искусственного интеллекта, таких как семантический анализ и средства самообучения. Например, Natural Language Toolkit, или NLTK, — комплект программ и библиотек на языке Python с открытыми исходными текстами для символического и статистического анализа текстов на естественных языках. Этот комплект применяет к текстовым данным лингвистические методики обработки и может использоваться в разработке программных систем распознавания естественных языков. Подробнее эта тема раскрывается в книге издательства O’Reilly «Natural Language Processing with Python», в которой среди всего прочего исследуются приемы использования NLTK в Python. Разумеется, далеко не в каждой системе пользователи должны задавать вопросы на естественном языке, но существует множество прикладных областей, где такая возможность была бы полезна.
Несмотря на безусловную полезность, генераторы парсеров и инструменты анализа естественных языков слишком сложны, чтобы хоть с какой-то пользой их можно было рассматривать в этой книге. За дополнительной информацией об инструментах синтаксического анализа, доступных для использования в программах на языке Python, обращайтесь на сайт http://python.org/ или выполните поиск в Интернете. А теперь, продолжая тему этой главы, перейдем к исследованию наиболее простого подхода, иллюстрирующего основные концепции, — син так си че ско го ана ли за ме то дом ре кур сив но го спус ка.
Использованная литература:
Марк Лутц — Программирование на Python, 4-е издание, II том, 2011