Написать скрипты на Python для парсинга сайтов (bashspirt.ru)
Целевой хост: www.bashspirt.ru
Описание задачи:
Для сбора данных об организации в Рунете нужно написать скрипты на Python. Результат скрипта отдаётся в STDOUT в XML формате.
Нужны данные с целевого хоста про контакты магазинов.
rubric-id Магазин алкогольных напитков(184107899)
Подробная инструкция для XML-задач: gist.github
Особенности:
- в адресе не должно быть индекса, кавычек, скобок, пропущенных пробелов/запятых
- все телефоны должны быть с кодом города, выделенным в круглые скобки, если телефонов несколько, то допустимо их указывать через запятую.
STDOUT
- XML (UTF-8)
Техническое описание
The script should not
- Use the system environment
- Create/write anything to the file
- Trying to delete/remove files on FS
The script could
- Create temporary files using os.tmpfile
Supported Languages
- Python 2.7
Supported Libraries
- Grab
- Scrapy
- BeautifulSoup4
- Lxml
- Requests