Конструктор предобработки данных — это веб-приложение для автоматизации подготовки данных перед построением прогнозных моделей. Приложение поддерживает работу как с табличными данными, так и с временными рядами, предоставляя интуитивный интерфейс для различных методов трансформации.
- Загрузка и анализ данных в форматах CSV и Excel
- Автоматическое определение типов данных и рекомендации по предобработке
- Визуализация и предпросмотр результатов обработки
- Экспорт обработанных данных для дальнейшего использования
- Сохранение и повторное применение параметров масштабирования
- Обработка пропущенных значений (заполнение средним, медианой, модой или удаление строк)
- Обработка выбросов (методы Z-оценки и межквартильного размаха)
- Стандартизация числовых данных (StandardScaler, MinMaxScaler)
- Кодирование категориальных переменных (One-Hot, Label кодирование)
- Снижение размерности (PCA)
- Лагирование переменных (создание признаков на основе предыдущих значений)
- Скользящие статистики (среднее, стандартное отклонение, минимум, максимум)
- Извлечение компонентов даты (год, месяц, квартал, день недели и т.д.)
- Обратное масштабирование (для интерпретации результатов в исходном масштабе)
- Установите Docker Desktop для Windows.
- Клонируйте репозиторий:
git clone https://github.com/mihnin/data-preprocessing-constructor.git cd data-preprocessing-constructor
- Запустите контейнеры:
docker-compose up -d
- Приложение будет доступно по адресу: http://localhost:8080
- Установите Docker Desktop для Mac.
- Клонируйте репозиторий:
git clone https://github.com/mihnin/data-preprocessing-constructor.git cd data-preprocessing-constructor
- Запустите контейнеры:
docker-compose up -d
- Приложение будет доступно по адресу: http://localhost:8080
- Установите Docker и Docker Compose:
sudo apt-get update sudo apt-get install docker.io docker-compose sudo systemctl enable docker sudo systemctl start docker
- Клонируйте репозиторий:
git clone https://github.com/mihnin/data-preprocessing-constructor.git cd data-preprocessing-constructor
- Запустите контейнеры:
sudo docker-compose up -d
- Приложение будет доступно по адресу: http://localhost:8080
- Создайте следующие манифесты:
- deployment.yaml
apiVersion: apps/v1 kind: Deployment metadata: name: data-preprocessing-app spec: replicas: 1 selector: matchLabels: app: data-preprocessing template: metadata: labels: app: data-preprocessing spec: containers: - name: data-preprocessing image: yourusername/data-preprocessing-constructor:latest ports: - containerPort: 80 env: - name: MAX_WORKERS value: "4" - name: UPLOAD_FILE_SIZE_LIMIT value: "10485760" volumeMounts: - name: data-volume mountPath: /app/data volumes: - name: data-volume persistentVolumeClaim: claimName: data-processing-pvc
- service.yaml
apiVersion: v1 kind: Service metadata: name: data-preprocessing-service spec: selector: app: data-preprocessing ports: - port: 80 targetPort: 80 type: ClusterIP
- ingress.yaml (при использовании Ingress)
apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: data-preprocessing-ingress spec: rules: - host: preprocessing.example.com http: paths: - path: / pathType: Prefix backend: service: name: data-preprocessing-service port: number: 80
- pvc.yaml
apiVersion: v1 kind: PersistentVolumeClaim metadata: name: data-processing-pvc spec: accessModes: - ReadWriteOnce resources: requests: storage: 10Gi
- deployment.yaml
- Соберите Docker образ и загрузите его в реестр:
docker build -t mihnin/data-preprocessing-constructor:latest . docker push mihnin/data-preprocessing-constructor:latest
- Примените манифесты:
kubectl apply -f pvc.yaml kubectl apply -f deployment.yaml kubectl apply -f service.yaml kubectl apply -f ingress.yaml
- Frontend: Vue.js 3, Element Plus
- Backend: Python 3.11, FastAPI
- Библиотеки: pandas, numpy, scikit-learn, statsmodels
- Инфраструктура: Docker, Nginx
- Подготовка данных для машинного обучения
- Предобработка временных рядов перед прогнозированием
- Стандартизация и нормализация данных
- Обработка категориальных переменных
- Выявление и удаление выбросов
- Заполнение пропущенных значений