Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[pipeline] br_ms_sim #765

Open
7 of 15 tasks
laura-l-amaral opened this issue May 8, 2024 · 0 comments
Open
7 of 15 tasks

[pipeline] br_ms_sim #765

laura-l-amaral opened this issue May 8, 2024 · 0 comments
Assignees

Comments

@laura-l-amaral
Copy link
Contributor

laura-l-amaral commented May 8, 2024

Arquitetura

  • Levantamento de todas as colunas de todos os arquivos
  • Compatibilização de colunas (arquivos originais x BigQuery)
  • Decisão de quais colunas seguir (levando em consideração colunas do arquivo e colunas do BigQuery)

Django

  • Guardar a data de última atualização no Django task

Pipeline

  • Construir o link com base numa chamada de API
  • Guardar o token da API
  • Acessar a URI de download dos recursos no Portal de Dados Abertos
  • Acessar a data de atualização/criação dos recursos no Portal de Dados Abertos
  • Referenciar a data de última atualização no Django
  • Acessar os recursos para guardar as URIs de download e data de atualização/criação
  • Usar a data de última atualização para filtrar os recursos
  • Com base na lista final de colunas, desconsiderar as adicionais e criar vazias as que não existem no arquivo
  • Paralelizar o processamento dos dataframes
  • Criar as transformações no dbt
  • Vamos seguir com o dicionário ou traduzir no próprio dbt?
@laura-l-amaral laura-l-amaral converted this from a draft issue May 8, 2024
@laura-l-amaral laura-l-amaral moved this from 🏁 Priorizado to 🏗 Em andamento in Roadmap de dados May 10, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging a pull request may close this issue.

2 participants