Este projeto utiliza técnicas avançadas de visualização de dados para analisar acidentes ferroviários no Brasil, baseado em dados públicos da ANTT (Agência Nacional de Transportes Terrestres) disponiveis aqui.
O projeto explora as seguintes técnicas de visualização avançadas:
- Mapas Interativos: Utiliza Plotly Express para criar mapas interativos que mostram a distribuição geográfica dos acidentes.
- Gráficos de Barras Dinâmicos: Apresenta informações sobre acidentes por concessionária e UF.
- Gráficos de Linhas Temporais: Mostra a evolução dos acidentes ao longo do tempo.
- Gráficos de Pizza Interativos: Visualiza a distribuição de causas diretas e natureza dos acidentes.
- Clusterização Geoespacial: Aplica K-means para agrupar acidentes com base em localização e frequência.
- Filtros Interativos: Permite a filtragem dinâmica dos dados por diversos critérios.
- Python 3.7+
- pip
-
Clone este repositório:
git clone https://github.com/mateusememe/visualizeit.git cd visualizeit
-
Crie um ambiente virtual:
python -m venv myenv
-
Ative o ambiente virtual:
- No Windows:
myenv\Scripts\activate # Para ativar myenv\bin\deactivate # Para desativar
- No macOS e Linux:
source myenv/bin/activate # Para ativar source myenv/bin/deactivate # Para desativar
- No Windows:
-
Instale as dependências:
pip install -r requirements.txt
Para executar a aplicação:
streamlit run app.py
Abra seu navegador e acesse http://localhost:8501
para ver a aplicação em execução.
app.py
: O código principal da aplicação Streamlitpreprocessing_data_including_geolocalization.py
: O código de préprocessamento do csv original para termos as coordenadas dos municipiosrequirements.txt
: Lista de dependências do projetodatasets/
diretório com os arquivos csv utilizados para visualizaçãoacidentes_ferroviarios_12.2020-07.2024.csv
- base de dados de Dezembro de 2020 á Julho de 2024acidentes_ferroviarios_2004_2020.csv
- base de dados de 2004 á Novembro de 2020acidentes_ferroviarios_2004_2024.csv
- base de dados unificado dos casos de 2004 á Julho de 2024
README.md
: Este arquivo
Baseado no código, o projeto permite extrair os seguintes insights:
- Distribuição Geográfica: Identificar áreas de alta concentração de acidentes.
- Padrões Temporais: Analisar tendências de acidentes ao longo do tempo.
- Análise por Concessionária: Comparar o desempenho de segurança entre diferentes operadoras.
- Causas Comuns: Identificar as causas mais frequentes de acidentes.
- Natureza dos Acidentes: Entender os tipos mais comuns de incidentes.
- Clusters de Risco: Identificar regiões com características similares em termos de frequência de acidentes.
- Impacto de Mercadorias: Analisar se certos tipos de mercadorias estão associados a maiores riscos.
- Variações Sazonais: Investigar se há padrões sazonais nos acidentes.
- Hotspots: Identificar municípios ou linhas com frequência anormalmente alta de acidentes.
- Certifique-se de ter o arquivo CSV com os dados dos acidentes no diretório do projeto.
- As visualizações são interativas, permitindo zoom, hover e seleção de dados.
- O slider para escolha do número de clusters permite uma análise flexível da distribuição geográfica dos acidentes.
Este projeto está licenciado sob a licença MIT - veja o arquivo LICENSE.md para detalhes.