Este repositório foi desenvolvido como parte da disciplina de Projeto Interdisciplinar para Sistemas de Informação III do Bacharelado de Sistemas de Informação na Universidade Federal Rural de Pernambuco (UFRPE), no semestre 2024.2.
O projeto consiste em aplicar o método KDD (Knowledge Discovery in Databases) para realizar todo o processo de análise de dados e aprendizado de máquina (machine learning), a partir de um dataset selecionado no Kaggle. Este trabalho envolve etapas de análise exploratória de dados (AED), pré-processamento, e a aplicação de algoritmos de classificação e clusterização para responder a perguntas-chave relacionadas a fatores socioeconômicos e desempenho acadêmico.
O projeto é complementado com um aplicativo web interativo, desenvolvido em Streamlit, para apresentar os resultados de maneira prática e intuitiva, e um artigo científico que documenta as questões, objetivos, métodos e resultados obtidos.
Essa disciplina foi feita em conjunto com a disciplina de Desenvolvimento de Sistemas de Informações onde foi desenvolvido uma aplicação mobile e o repositório pode ser acessado aqui
- Davi Vieira
- Guilherme Leonardo
- Ronaldo de Araújo
Professor: Gabriel Alves
Este repositório contém os seguintes arquivos e diretórios principais:
src/
: Scripts em Python com a implementação dos modelos de classificação e clusterização.app/
: Arquivos do Streamlit para o aplicativo web.requirements.txt
: Lista de dependências necessárias para rodar o projeto.data/
: para armazenar os datasets utilizados no projeto.
Siga os passos abaixo para rodar o projeto em sua máquina:
git clone https://github.com/notsogreatdavi/PISI3-2024.2
cd nome-do-repositorio