Задачи для решения
Часть 1
Дана страница: перейдите по ссылке.
С помощью file_get_contents получите HTML код страницы по ссылке выше и для этой страницы с помощью регулярных выражений решите следующие задачи:
Получите содержимое head, title и body.
Получите массив href всех ссылок.
Получите массив текстов всех ссылок.
Часть 2
Дана страница: перейдите по ссылке.
С помощью file_get_contents получите HTML код страницы по ссылке выше и для этой страницы с помощью регулярных выражений решите следующие задачи:
Получите содержимое body.
Получите кодировку документа (нового и старого типа).
Получите содержимое #content.
Получите все ссылки из #content.
Получите содержимое всех абзацев.
Получите содержимое всех абзацев из #content.
Получите все абзацы с классом www.
Получите все ссылки с классом www (их href и анкоры).
Получите все ссылки с классом www из #content.
Получите все ссылки из пагинации .pag.
Получите активную ссылку из пагинации .pag.
Получите содержимое абзаца с классом .eee из #footer.
Часть 3
Дана страница: перейдите по ссылке.
С помощью file_get_contents получите HTML код страницы по ссылке выше и для этой страницы с помощью регулярных выражений решите следующие задачи:
Получите массив ссылок из меню.
Получите массив всех картинок.
Получите содержимое контента.
Получите картинки контента.
Удалите скрипты из полученного контента.
Удалите картинки из полученного контента.
Удалите абзацы с классом "more" из полученного контента.
Теги h2 из контента сделайте просто текстом, а не ссылками.
Удалите все атрибуты абзацев из полученного контента.
Удалите все теги span из полученного контента.