-
Notifications
You must be signed in to change notification settings - Fork 3
/
Copy pathREADME.Rmd
101 lines (60 loc) · 4.79 KB
/
README.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
---
output: github_document
---
<!-- README.md is generated from README.Rmd. Please edit that file -->
```{r, include = FALSE}
knitr::opts_chunk$set(
collapse = TRUE,
comment = "#>",
fig.path = "man/figures/README-",
out.width = "100%",
fig.align = "center"
)
```
# Monitor da CPI da Pandemia
## Apresentação
O presente projeto foi inicialmente apresentado como trabalho de conclusão do curso de dashboards da Curso-R. Foi gerado um aplicativo Shiny disponível em:
<https://rfdornelles.shinyapps.io/cpipandemia/>
## Contexto
<img src="https://conteudo.imguol.com.br/c/entretenimento/30/2021/06/11/rafael-chalub-o-esse-menino-em-sua-esquete-da-pifaizer-1623439612984_v2_600x600.jpg.webp" width="158"/>
É certo que o Brasil lidou e vem lidando muito mal com a pandemia da COVID-19, que se mostrou ser muito mais grave do que uma *gripezinha*. Depois de alcançar mais de centenas de milhares de óbitos em razão direta da pandemia, o Senado Federal resolveu agir e instalou a "CPI da Pandemia".
Não sem resistência do Governo Federal, que fez o que pôde para retirar assinaturas e retardar ao máximo a instalação da Comissão, ela vem trabalhando intensamente desde abril de 2021 e promete e reunir as evidências de mal uso de recursos públicos, omissões dolosas e responsabilizar as pessoas culpadas.
<center>
<img src="https://static.poder360.com.br/2021/05/gif-pazuello-cpi.gif" width="349"/>
</center>
## O que é
Para ajudar a entender melhor esse contexto, os dados relativos à CPI foram raspados diretamente do Senado Federal e tratados a fim de permitir algumas análises e observar alguns comportamentos.
Podemos verificar a quantidade de tempo que cada parlamentar falou, a diferença entre espaço que homens e mulheres receberam na Comissão, a nuvem de palavras de cada uma das participantes (depoentes, testemunhas e parlamentares) etc.
<center>
<img src="https://www12.senado.leg.br/noticias/materias/2021/04/29/cpi-da-pandemia-omar-aziz-nega-pedido-de-funcionamento-presencial/20210429_00917jr.jpg/@@images/image/imagem_materia" width="256"/>
</center>
### Metodologia
Os dados foram obtidos utilizando [raspagem de dados](https://pt.wikipedia.org/wiki/Coleta_de_dados_web) (web scrap) diretamente do Senado Federal, que possui - junto à Câmara dos Deputados - um ótimo sistema de dados abertos.
<center>
<img src="man/figures/senado.jpg" width="340"/>
</center>
Foram acessadas cada uma das sessões da CPI e baixadas as transcrições oficiais dos discursos. Naturalmente, pode haver algumas diferenças entre o que foi transcrito e o efetivamente dito, mas o método além de muito eficiente (muito melhor do que ouvir centenas de horas de reuniões), é bastante confiável.
Esses discursos, com o nome de quem falou e o horário, foram organizados numa base de dados. Posteriormente, ela foi limpa e acrescentadas informações como o partido político, gênero, etc.
Os dados utilizados, bem como todos os scripts em R necessáros para raspar, organizar, limpar e gerar a presente visualização estão disponíveis no repositório do projeto no Github: <https://github.com/rfdornelles/discursocpi>.
Ainda, você pode copiar diretamente usando o comando abaixo:
``` r
# install.packages("devtools")
devtools::install_github("rfdornelles/discursocpi")
```
### A fazer
O presente projeto foi apresentado originalmente como trabalho de conclusão do (ótimo) curso de ["Dashboards"](https://curso-r.com/cursos/dashboards/) da [Curso-R](https://twitter.com/curso_r). Pretende-se, porém, torná-lo uma ferramenta útil para a comunidade e por isso num futuro próximo espero poder:
- automatizar a raspagem dos dados através de GitHub Actions, a fim de que a base esteja atualizada diariamente
- acrescentar os dados relativos aos requerimentos a serem avaliados pela CPI
- analisar também os documentos que estejam públicos
- mais visualizações úteis
- classificar o alinhamento dos Senadores para que essa perspectiva possa ser considerada também nas análises (e permitir, por exemplo, saber as palavras mais usadas pelos governistas X oposicionistas)
- incluir análises mais sofisticadas de análise de texto.
Naturalmente, nas próximas semanas também espero poder tornar os dados raspados disponíveis também na [Base dos Dados, esse projeto sensacional que recomendo conhecer](https://basedosdados.github.io/mais/).
## Contato
Caso queira contribuir com sugestões, críticas ou com alguma outra coisa:
- Repositório do projeto: <https://github.com/rfdornelles/discursocpi>
- LinkedIn: <https://www.linkedin.com/in/rodrigo-dornelles-576705a2/>
Muito obrigado pela atenção, se puder fique em casa, use máscara e vacine-se quando chegar sua vez!
<center>
<img src="https://media1.tenor.com/images/ef3f8360f336d7cd1f4e3779fdadb05f/tenor.gif?itemid=19474691" width="161"/>
</center>