Add this suggestion to a batch that can be applied as a single commit.
This suggestion is invalid because no changes were made to the code.
Suggestions cannot be applied while the pull request is closed.
Suggestions cannot be applied while viewing a subset of changes.
Only one suggestion per line can be applied in a batch.
Add this suggestion to a batch that can be applied as a single commit.
Applying suggestions on deleted lines is not supported.
You must change the existing code in this line in order to create a valid suggestion.
Outdated suggestions cannot be applied.
This suggestion has been applied or marked resolved.
Suggestions cannot be applied from pending reviews.
Suggestions cannot be applied on multi-line comments.
Suggestions cannot be applied while the pull request is queued to merge.
Suggestion cannot be applied right now. Please check back later.
AO ABRIR uma Pull Request de um novo raspador (spider), marque com um
X
cada um dos items da checklist abaixo. Caso algum item não seja marcado, JUSTIFIQUE o motivo.Layout do site publicador de diários oficiais
Marque apenas um dos itens a seguir:
Código da(s) spider(s)
custom_settings
em meu raspador.Testes
.log
deste teste está anexado na PR..log
e.csv
deste teste estão anexados na PR..log
e.csv
deste teste estão anexados na PR.Verificações
.csv
gerados pela minha coleta conforme a documentação não encontrando problemas..log
gerados pela minha coleta conforme a documentação não encontrando problemas.Descrição
O código base principal para os municípios de Cantagalo, Esmeraldas e São João Batista do Glória está adaptado para receber e coletar todos os diários dos sites. Ele funciona da seguinte maneira:
Primeiramente, as informações são obtidas por meio da classe correspondente a cada ano, ou seja, elas são separadas por ano. Por exemplo, na posição [0] do vetor years estão todos os atributos e elementos da classe referente ao ano de 2018
log completo cantagalo.txt
log de intervalo cantagalo.txt
log mais recente cantagalo.txt
. Verifico se o ano atual é menor que o ano de início configurado, ignorando os dados até que o ano atual seja igual ao ano de início.
Depois, dentro da classe do ano específico, os meses são coletados em ordem e organizados em um vetor, da mesma forma como foi feito com os anos. Para cada mês, os dias são coletados em sequência e adicionados a um vetor, seguindo a mesma lógica.
Em seguida, verifico se os meses e as datas são anteriores às datas de início configuradas, evitando assim leituras desnecessárias. As informações coletadas são então enviadas para o banco de dados.
Por fim, é adicionada uma condição de parada. Quando a data processada é maior que a data final configurada, o processo de scrapy é interrompido.