Задачи для решения
Задача
Зайдите на следующую страницу: перейдите по ссылке.
Сделайте парсер, который заберет все ссылки из главного меню, затем перейдет по каждой из них, спарсит содержимое контента страниц и сохранит в базу данных контент страницы, тайтл страницы, url страницы.
Задача
Зайдите на следующую страницу: перейдите по ссылке.
Сделайте парсер, который заберет все ссылки из пагинации, затем перейдет по каждой из них, заберет все ссылки на статьи, а затем зайдет на каждую из статей.
Сохраните в базу данных страницы со статьями (промежуточные не нужны). А именно: контент страницы, тайтл страницы, url страницы.
Задача
Зайдите на следующую страницу: перейдите по ссылке (это тот же сайт, что и в предыдущей задаче).
Спарсите этот сайт методом паука. Страницы, которые следует сохранять в базу легко отделить по урлу.
Задача
Зайдите на следующую страницу
Сохраните описание городов в базу данных. Страны для этих городов храните в отдельной таблице.
Задача
Спарсите названия всех фильмов из определенного раздела сайта
Сохраните эти названия в базу данных.
Задача
Спарсите все анекдоты из определенного раздела сайта
Сохраните их в базу данных. При сохранении очистите их от лишних тегов.
Задача
Спарсите все статьи с сайта
Решите задачу вначале поэтапным парсингом, а потом методом паука.
Задача
Спарсите все статьи с сайта
Сохраните в базу данных контент страницы, тайтл, ссылку на главную картинку с этой страницы.
Решите задачу вначале поэтапным парсингом, а потом методом паука.