Este proyecto es parte de un reto promovido por CertDevs, donde se aplican técnicas de análisis de datos utilizando Python y la librería Pandas para procesar y analizar datos de eventos deportivos, aficionados y promociones publicitarias.
El objetivo es extraer insights clave que ayuden a mejorar la planificación de futuros eventos y las estrategias promocionales.
La empresa ha recopilado datos de:
- Eventos deportivos: nombre, fecha, ubicación, asistentes.
- Aficionados: edad, género, lugar de residencia.
- Promociones publicitarias: medio publicitario, presupuesto y duración.
El análisis se centra en responder preguntas de negocio clave, como:
- ¿Cuál es el evento con mayor asistencia total?
- ¿Cuál es el rango de edad que asiste más frecuentemente a los eventos?
- ¿Qué medio publicitario ha generado mayor impacto en términos de asistencia?
- ¿Cuál es la ubicación de residencia que más aficionados aporta?
- Limpieza de datos y combinación de DataFrames con Pandas.
- Análisis del evento con mayor asistencia.
- Identificación del medio publicitario más efectivo.
- Visualizaciones con
matplotlib
yseaborn
.
Para ejecutar el proyecto en tu máquina local, sigue estos pasos:
-
Clona el repositorio:
git clone https://github.com/ea-analisisdatos/analisisdatoseventosdeportivos.git
-
Instala las dependencias requeridas:
pip install -r requirements.txt
-
Ejecuta el script principal:
python analisis_eventos.py
El proyecto utiliza tres archivos CSV:
- eventos.csv: datos de eventos deportivos (nombre, asistentes, etc.).
- aficionados.csv: datos de los aficionados (edad, género, ubicación).
- promociones.csv: información de promociones publicitarias (medio, presupuesto, fechas).
Algunos de los análisis incluyen:
- Evento con mayor asistencia total.
- Rango de edad más frecuente en los eventos.
- Impacto de los medios publicitarios sobre la asistencia.
- Ubicación que más aficionados aporta.
Todos los resultados están almacenados en el archivo reporte_eventos.csv
.
El proyecto genera varias visualizaciones:
- Top 5 eventos con mayor asistencia.
- Frecuencia de asistencia por rango de edad.
- Impacto de los medios publicitarios.
Puedes ver algunos ejemplos a continuación:
El archivo resultante con los análisis se exporta como reporte_eventos.csv
y contiene:
- Nombre del Evento
- Asistentes Totales
- Ubicación de Residencia
- Medio Publicitario
- ID de la Promoción
- Impacto de la Promoción
- Presupuesto de la Promoción
- Fecha de Inicio de la Promoción
- Fecha de Fin de la Promoción
Las contribuciones son bienvenidas. Si tienes sugerencias o encuentras algún error, no dudes en crear un issue o pull request en el repositorio.
Erika Alvares
Visita mi web personal para más proyectos relacionados con análisis de datos y TICs.
Este proyecto forma parte del reto en CertDevs, una plataforma de formación en informática creada por Alan Sastre.
- Python
- Pandas
- Matplotlib
- Seaborn
- Para evitar confusiones con promociones duplicadas, el archivo final incluye columnas adicionales para las fechas de inicio y fin de la promoción, y el ID de la misma.