-
-
Notifications
You must be signed in to change notification settings - Fork 409
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Al maragogi #1290
Al maragogi #1290
Conversation
Criei esta PR com base no que foi feito em #1186 |
Valeu, @victorfernandesraton! Coloquei na fila de revisão. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
@victorfernandesraton o raspador tá bem eficiente. Tá ótimo requisitar todas as páginas disponíveis no intervalo de datas.
Fiz alguns comentários de melhoria aqui, qualquer coisa grita aí
Segue em anexos extração completa com csv e logs |
Testes de busca entre 04-06-2024 e 02-07-2024 |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Tá shou @victorfernandesraton !
url=f"{self.BASE_URL}/busca", | ||
formdata={"page": str(page), **self.__create_params()}, |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
💯
(cherry picked from commit 08919b7)
@victorfernandesraton vou fazer squash pra ficar somente um commit do @gabrielqr e um seu, beleza? Como é apenas um raspador, 12 commits onde a maioria é de correções ficaria excessivo. Normalmente apenas 1 já seria suficiente |
Layout do site publicador de diários oficiais
Marque apenas um dos itens a seguir:
Código da(s) spider(s)
custom_settings
em meu raspador.Testes
.log
deste teste está anexado na PR..log
e.csv
deste teste estão anexados na PR..log
e.csv
deste teste estão anexados na PR.Verificações
.csv
gerados pela minha coleta conforme a documentação não encontrando problemas..log
gerados pela minha coleta conforme a documentação não encontrando problemas.Descrição
Reimplementação do raspador do município de Maragogi AL , anteriormente citado nesta issue #1176 e feito parcialmente nesta PR #1186, porém o mesmo ficou muito tempo esperando retorno do desenvolvedor, visto que houve mudanças drásticas no site dos diários oficiais em questão, decidi abrir esta nova PR para facilitar o fluxo de revisão
Logs e outputs de uma extração completa:
output-all.log
output-all.csv
Logs e outputs de uma extração com data aleatória (2024-05-10 até 2024-08-23):
output-date.csv
output-date.log