Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Rj duque de caxias #705

Closed
wants to merge 13 commits into from
Closed

Conversation

gbonesso
Copy link
Contributor

@gbonesso gbonesso commented Oct 6, 2022

AO ABRIR um Pull Request de um novo raspador (spider), marque com um X cada um dos items do checklist
abaixo. NÃO ABRA um novo Pull Request antes de completar todos os items abaixo.

Checklist - Novo spider

  • Você executou uma extração completa do spider localmente e os dados retornados estavam corretos.
  • Você executou uma extração por período (start_date e end_date definidos) ao menos uma vez e os dados retornados estavam corretos.
  • Você verificou que não existe nenhum erro nos logs (log/ERROR igual a zero).
  • Você definiu o atributo de classe start_date no seu spider com a data do Diário Oficial mais antigo disponível na página da cidade.
  • Você garantiu que todos os campos que poderiam ser extraídos foram extraídos de acordo com a documentação.

Descrição

PR para a issue Duque de Caxias-RJ #616. Os diários de Duque de Caxias estão disponíveis em 3 "fases" diferentes. A primeira vai de 2013 a 2016, sendo que em 2016 o último diário é de julho, provavelmente existe um gap nos dados. a segunda vai de 2017 até o ano atual - 1. A terceira tem os dados do ano atual.

log_rj_duque_de_caxias_full_2.txt.zip

@gbonesso gbonesso mentioned this pull request Oct 6, 2022
@trevineju trevineju linked an issue Oct 6, 2022 that may be closed by this pull request
@trevineju trevineju added the hacktoberfest-accepted Pull Requests aprovados na Hacktoberfest label Oct 6, 2022
@trevineju trevineju removed the hacktoberfest-accepted Pull Requests aprovados na Hacktoberfest label Sep 19, 2024
@firefueled
Copy link

Olá @gbonesso ,
Desculpe pela demora em responder este PR :)

Para aprovarmos o raspador, precisamos dos arquivos auxiliares referentes às raspagem da última edição, de intervalo, e completa.
Agradeço se puder gerar estes arquivos para prosseguirmos com o processo.

@slfabio
Copy link
Collaborator

slfabio commented Dec 15, 2024

Olá, @firefueled e @trevineju,
subi o código atualizado para Duque de Caxias no PR 1333.

Obrigado.

@firefueled
Copy link

Opa @gbonesso blz. Valeu pela dica!
Se a PR #1333 está substituindo esta aqui, então vamos fechá-la.

Agradeço novamente!

@trevineju pode fechar esta PR?

@trevineju trevineju closed this Dec 19, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

Duque de Caxias-RJ
4 participants