Сохранение списка поездок с сайта podorozhnik.spb.ru
Интересует сохранение этой информации во внешний файл в каком-нибудь удобном для дальнейшей обработки формате, например, XML, JSON или CSV (другие форматы - по согласованию).
Требуется разработать скрипт, который бы данные с сайта извлекал и сохранял/обновлял во внешнем файле.
Ожидаемый сценарий работы скрипта:
- Вход на сайт или использование работающего браузера, где уже произведён вход.
- Переход на страничку с поездками, извлечение данных.
- Проверка, что уже сохранено во внешних файлах - если на сайте появились новые данные, то дописать в файл.
- Завершение работы (т.е. скрипт не мониторит сайт постоянно - запускается вручную по необходимости).
Параметры для скрипта (если понадобится) брать из внешнего файла (напр., в JSON5 - с поддержкой комментариев).
Нюансы:
- Транспортных карт может быть несколько - поездки по каждой сохранять отдельно.
- Группировка в пределах месяца.
- В пределах месяца сортировка по дате поездки (по возрастанию).
Другие языки - по согласованию.
Комментарии в исходном коде - на русском/английском.
Позже предоставлю примеры страниц, чтоб можно было оценить структуру.