Провести EDA используя любую библиотеку Python
Задача:
1. Выбрать индивидуальное задание: можно использовать “свои” данные или использовать датасеты с Kaggle https://www.kaggle.com/datasets?fileType=csv или взять любой датасет из PyCaret
2. В Colab (используя подготовленный датасет .csv) провести EDA используя любую библиотеку Python (pandas-profiling, dataprep, Sweetviz или другую), обучить и сравнивать модели машинного обучения с использованием библиотеки scikit-learn (или LightGBM, XGBoost, CatBoost, h2o-3, AutoGluon, PyCaret используя алгоритмы регрессии, градиентного бустинга, случайного леса). Провести прогнозирование ответа лучшей модели на новых данных (сгенерировать самостоятельно используя исходные данные или получить “новые” данные путем исключения из исходного датасета (например - https://colab.research.google.com/drive/1HTQJx8waY... ).
3. Провести прогнозирование ответа лучшей модели на новых данных.
Пример выполнения с датасетом есть