Решил перевести одну интересную главу из книги Perl&LWP, буду выкладывать ее тут по мере перевода.
Глава 7. Обработка HTML посимвольно (with Token)
Contents:
HTML как Токены
Основы использования HTML::TokeParser
Индивидуальные токены (символы)
Последовательности токенов
Больше методов HTML::TokeParser
Регулярные выражения безусловно очень мощная штука, но они предлагают нам крайне низкий уровень работы с HTML. Вы вынуждены волноваться о пробелах и переводе строк, одинарных и двойных кавычках, HTML комментариях, и много еще о чем. В этой главе мы будем использовать модуль HTML:: TokeParser, чтобы извлечь информацию из файлов HTML. Используя эти методы, Вы можете извлечь информацию из любого файла HTML, и никогда больше не беспокоиться о спецификации той или иной разметки HTML (или стиля web-программиста).


