Aнализ 10K баннеров с moat.com (OCR, image recognition)
- только статичные картинки
- выборка по ретейловым брендам
- примерно одинаковая выборка по размерам
- проанализировать и описать баннера
– урл
– размер
– координаты и размеры текстовых строк (OCR не требуется, хотя размер шрифта и количество букв приветсвуется)
– желательно координаты и размер других обеъектов
– объекты в картинках-фотографиях (примерно то что используется для анноции фотографий, но без самой аннотации), если с этим есть сложности, то возможно подойдет более примитивный visual feature extraction
– логотипы, иконки и прочая плоская графика
– плашки, фоны под текстами
- желательно использовать python, поскольку вплоне возможно, что потребуется повторные прогоны и мелкие подпиливания, на других выборках и нужен будет и исходный код.