Это приложение предназначено для прогнозирования значений временных рядов с использованием AutoML-библиотеки AutoGluon. Оно позволяет загружать данные, настраивать параметры модели и получать точные прогнозы.
- Установите Miniconda или Anaconda
- Создайте окружение:
conda create -n my_time_series_app python=3.10 conda activate my_time_series_app
- Установите зависимости:
pip install -r requirements.txt
- Склонируйте репозиторий или поместите файлы проекта в папку
- Активируйте окружение и выполните:
streamlit run app.py
- Приложение откроется в вашем браузере автоматически
Приложение содержит три основные страницы:
- Главная - загрузка данных, настройка и обучение моделей, прогнозирование
- Анализ данных - расширенный анализ временных рядов, обнаружение аномалий и концепт-дрифта
- Help - справочная информация по использованию приложения
- Загрузите файл с историческими данными (CSV или Excel)
- Для больших файлов (>100 МБ) доступна оптимизированная загрузка с настройками размера чанка
- Выберите столбцы для:
- Даты
- Целевой переменной
- Идентификатора
- Укажите статические признаки, если они есть
- Настройте параметры модели:
- Метод заполнения пропусков (включая KNN и интерполяцию)
- Частота данных
- Метрика оценки
- Модели AutoGluon
- Время обучения
На странице "Анализ данных" доступны:
- Валидация данных - проверка качества данных, обнаружение пропусков и аномалий
- Анализ целевой переменной - распределение, временной ряд, выбросы, трансформации
- Корреляции и статические признаки - анализ мультиколлинеарности, расчет VIF
- Временной ряд и сезонность - декомпозиция ряда, генерация временных признаков
- Выявление концепт-дрифта - определение изменений в данных с течением времени
- Разделение данных - разбиение на обучающую, валидационную и тестовую выборки
- Нажмите кнопку "Обучить модель" для начала обучения
- Прогресс-бар отображает состояние процесса обучения
- После завершения обучения вы увидите результаты и лидерборд
- Нажмите кнопку "Сделать прогноз" для получения прогнозов
- Прогнозы будут отображены в виде таблицы и графиков
- Доступна опция проверки концепт-дрифта в прогнозе
Для работы с большими данными предусмотрены функции контроля и очистки памяти:
- Отображение текущего использования памяти
- Кнопка "Очистить память" для освобождения неиспользуемых ресурсов
- Под капотом используется AutoML-библиотека AutoGluon для работы с временными рядами
- Оптимизированная обработка больших файлов через чанкинг
- Расширенные методы валидации данных и обнаружения аномалий
- Генерация дополнительных признаков (лаги, скользящие окна, временные компоненты)
- Анализ и обработка концепт-дрифта для адаптации к изменениям в данных
Для получения справки по работе с приложением перейдите на вкладку "Help" в боковом меню.