Извлечение основного текста в формате HTML (прототип)

izvlechenie osnovnogo teksta v formate html prototip Почтовый клиент PyMailGUI Python

Несмотря на все более широкое проникновение HTML в электронную почту в последние годы, PyMailGUI все еще остается клиентом, ориентированным на простой текст. Когда содержимое основной (или единственной) текстовой части письма представлено разметкой HTML, оно отображается в окне веб-броузера. Однако в предыдущей версии этот текст в формате HTML отображался в компоненте текстового редактора PyEdit и считался главной текстовой частью при создании ответов или при пересылке.

Так как большинству пользователей неудобно разбирать разметку HTML, в версии для этого издания предпринята попытка реализовать извлечение простого текста из этой части в формате HTML за счет простого анализа HTML. После этого извлеченный текст отображается в окне просмотра содержимого письма и используется для цитирования при создании ответов и пересылке.

Этот механизм анализа HTML в лучшем случае можно считать только прототипом, и он включен в пример, в основном, чтобы помочь вам сделать первый шаг и приспособить его под свои потребности, но в любом случае результат, который он воспроизводит, лучше, чем отображение впрямую разметки HTML. Если этот механизм окажется не в состоянии воспроизвести простой текст, пользователи всегда смогут вернуться к просмотру в веб-броузере и копировать текст оттуда для цитирования в ответах и при пересылке. Смотрите также примечание, касающееся альтернативных решений с открытыми исходными текстами далее в этой главе, — эта проблема лежит в уже исследованной области.

Использованная литература:

Марк Лутц — Программирование на Python, 4-е издание, II том, 2011

Каталог сайтов Всего.ру
Оцените статью
Секреты программирования
Добавить комментарий