DECP processing

Projet de traitement et de publication de meilleures données sur les marchés publics attribués en France. Ce projet prend sa source dans la complexité de la publication des données faite par le Ministère des Finances :

code source de l'agrégation des données fermé
documentation incomplète et éparpillée
schéma de données DECP 2 complexe à utiliser

Ce projet se veut collaboratif et à l'écoute des besoins des usagers potentiels : entreprises, acteurs publics, journalistes, chercheurs et chercheuses, citoyens et citoyennes.

Pour me contacter vous pouvez ouvrir un "issue" sur Github ou me contacter par email [email protected].

Données

Les données produites sont les mêmes données que celles publiées par le Ministère des Finances sur data.economie.gouv.fr. J'ai choisi de prendre ces données comme source et non les DECP au format réglementaire JSON car les premières ont été nettoyées et améliorées (code) par le Ministère, ce qui me fait moins de travail.

Elles sont mises à dispositions aux formats CSV, Parquet et SQLite.

Vous pouvez...

les télécharger sur data.gouv.fr (vous trouverez aussi plus d'informations sur ces données)
les visualiséer, les filtrer et télécharger sur decp.info

Utilisation

Je vous recommande d'utiliser un environnement virtuel Python pour isoler l'installation des dépendances :

virtualenv .venv

Activez l'environnement virtuel :

source .venv/bin/activate

Installez les dépendances :

pip install .

Lancez Jupyter notebook (je n'ai pas trop testé, j'utilise l'intégration dans VS Code) :

jupyter notebook

Ordre d'exécution et description des notebooks :

marchés : pour récupérer les données de base et les nettoyer
sirene_acheteurs : pour récupérer les noms des acheteurs depuis la base SIRENE
sirene_titulaires : pour récupérer les données des titulaires depuis la base SIRENE
publish : création du datapackage, de la base de données SQLite, et publication sur data.gouv.fr

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
.github		.github
data		data
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
README.md		README.md
marchés.ipynb		marchés.ipynb
publish.ipynb		publish.ipynb
pyproject.toml		pyproject.toml
sirene_acheteurs.ipynb		sirene_acheteurs.ipynb
sirene_titulaires.ipynb		sirene_titulaires.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DECP processing

Données

Utilisation

About

Releases

Sponsor this project

Packages

Languages

ColinMaudry/decp-processing

Folders and files

Latest commit

History

Repository files navigation

DECP processing

Données

Utilisation

About

Resources

Stars

Watchers

Forks

Releases

Sponsor this project

Packages 0

Languages

Packages