Análisis de datos mediante consultas SQL
Fragmentos del notebook, para ver proyecto completo hacer click aquí
El coronavirus tomó al mundo entero por sorpresa, cambiando la rutina diaria de todos y todas. Los habitantes de las ciudades ya no pasaban su tiempo libre fuera, yendo a cafés y centros comerciales; sino que más gente se quedaba en casa, leyendo libros. Eso atrajo la atención de las startups (empresas emergentes) que se apresuraron a desarrollar nuevas aplicaciones para los amantes de los libros.
Se ha proporcionado una base de datos de uno de los servicios que compiten en este mercado. Contiene datos sobre libros, editoriales, autores y calificaciones de clientes y reseñas de libros. Esta información se utilizará para generar una propuesta de valor para un nuevo producto.
- Lenguaje de Programación: Python.
- Entorno de Desarrollo: Jupyter Notebook.
- Bibliotecas: Pandas, SQLAlchemy.
El proyecto se dividió en dos fases:
- Preparativos: Importar las librerías necesarias, optimizar el proceso de realizar las consultas en SQL y previsualizar las tablas.
- Análisis: Responder 5 preguntas clave sobre el e-commerce de libros.
El análisis de datos reveló patrones interesantes acerca del consumo de libros y de las interacciones de los usuarios ("me gusta" y reseñas).
Ejecuta el proyecto aquí
Para ver el diccionario de datos, el desarrollo completo en código, todos los gráficos y las conclusiones, haga click en el enlace de arriba.