Faire un premier état des lieux de la connaissance naturaliste dans la région des Hauts-de-France. L'ensemble du projet est restreint à 9 groupes taxonomiques : amphibiens, chiroptères, mammifères (terrestres), odonates, oiseaux nicheurs, orthoptères, poissons, reptiles et rhopalocères. Un second filtre s'applique pour une partie du projet, celui des espèces protégées appartenant aux listes rouges régionales.
Pour ce faire, 3 indices sont utilisés : - l'indice de la pression d'observation - l'indice espèce-maille - l'indice de la connaissance
L'indice de la connaissance est le croisement des deux autres indices.
Pour chaque indice, deux niveaux d'analyses sont réalisés : - toutes espèces confondues - espèces protégées des listes rouges régionales
Pour approfondir le sujet, l'indice connaissance peut être mis en relation avec les continuités écologiques. Ceci dans le but d'avoir une vision plus précise de la connaissance naturaliste.
- make :
- data : dossier
- 'data_brutes' : les données brutes naturalistes
- 'data_geo' : les couches géographiques (région HdF et départements)
- fonction : dossier qui recense les scripts des différentes fonctions créées
- output : ce dossier regroupe les sorties des analyses, au format RData et aux formats qgis (shapefile et/ou geopackage)
- renv : dossier relatif au package renv, permettant de stocker les packages nécessaires au projet et de connaître leurs versions utilisées
- scripts : dossier qui regroupe tous les scripts utiles pour exécuter le projet
Cet indice représente la moyenne annuelle du nombre d'observations par maille. Les mailles seront ensuite comparées à la valeur de la moyenne régionale de la pression d'observation pour définir une sous-prospection ou un sur-prospection.
Cet indice classe les mailles en fonction du nombre d'espèces différentes présentes. A partir des valeurs seuils définies au préalable, la maille est classée "mauvaise" si son nombre d'espèces est inférieur au seuil et "bonne" s'il est supérieur.
C'est le croisement des deux autres indices pour indiquer un état de connaissance, tant au niveau de la pression d'observation qu'au niveau du nombre d'espèces présentes dans chaque maille.
Ce script permet de charger l'ensemble des packages nécessaires au lancement du projet. L'utilisation du package 'renv' facilite cela en les stockant.
- renv::init() : initialiser renv dans projet (renv::init(bare = TRUE) pour un projet existant)
- renv::status() : check le statut du lockfile, packages présents/absents, packages dans renv.lock non utilisés dans le code
- renv::dependencies() : quels packages utilisés dans le code ?
- renv::snapshot() : sauvergarder l'état des packages utilisés dans le fichier renv.lock
- renv::restore() : revenir à l'état du renv.lock. i.e. désinstalle les packages en trop, réinstalle les packages manquant
- renv::install() : installer un package en utilisant renv (CRAN, version spécifique, github, commit spécifique, Bioconductor, ...).
Ce script a pour but d'ouvrir les fichiers de données brutes, de les nettoyer et de les homogénéiser pour pouvoir les assembler par la suite.
L'assemblage des différents fichiers des bases de données se réalise à partir de ce script. Dans un premier temps, la réunification des données, toutes espèces confondues. Puis, le même processus pour les espèces protégées seulement.
Ce troisième script s'occupe de la partie géomtétrique du projet. C'est ici que les grilles contenant les mailles sont créées en fonction des départements, puis jointes au fichier global de données. Ceci dans le but d'avoir pour chaque observation, la maille et le numéro de maille qui lui correspond. Cela permettra par la suite de calculer les différents indices.
L'indice pression permet de calculer la moyenne annuelle de passages (d'observations) pour chaque maille. Il faut donc compter le nombre de passages par jour dans une maille, et ce pour chaque année. Puis faire la moyenne annuelle sur la période 2012 à 2022. Cet indice est ensuite divisé en 9 classes d'après la règle de Sturges. La discrétisation se fait par la méthode de classification des ruptures naturelles de Jenks.
L'indice espèce-maille représente le nombre d'espèces différentes par maille comparé à une valeur seuil définie. La valeur seuil correspond à un nombre d'espèces différentes fixé pour chaque groupe taxonomiques. Si dans une maille, son nombre d'espèces est inférieur à ce seuil, alors la maille sera considérée comme mauvaise et sera affectée de la valeur 0 (inversement, valeur de 1 lorsque la maille est supéireure au seuil). C'est donc un regroupement des observations par maille en fonction des espèces puis une comparaison à une valeur fixe. Lorsque tous les groupes taxonomiques sont confondus, l'indice établit un classement en faisant la moyenne des résultats de chaque groupe. Cette moyenne varie de 0 à 1 :
- très mauvaise : 0
- moyenne : entre 0 et 0.5
- bonne : entre 0.5 et 1
- très bonne : 1
L'indice connaissance résulte du croisement des deux indices précédents. Il permet de donner une vision de la connaissance naturaliste en fonction de la pression d'observation et de la diversité d'espèces dans chaque maille. Il est discrétisé en 5 classes :
- très mauvaise
- mauvaise
- moyenne
- bonne
- très bonne
Pour chaque indice, un fichier global contenant tous les départements et tous les groupes taxonomiques est créé. Ce fichier est à la fois créé pour toutes les espèces et également pour les espèces protégées. A la fin de l'exécution de chaque indice, 2 types de formats ressortent pour les fichiers : - .RData - .gpkg
Le format geopackage permet de pouvoir réaliser les cartographies sous Qgis, mais elles peuvent également être faites directement sous R à l'aide des fichiers en RData.