Les données de la recherche sont définies par l’OCDE comme des « enregistrements factuels qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche » (Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics).Â
Par exemple, il peut s’agir de questionnaires et résultats d’enquêtes, retranscriptions d’entretiens, séries statistiques, algorithmes, films, photographies, sons, etc. Â
Les données de recherche peuvent être disponibles sous différents formats (texte, audio, vidéo, tableur, image…).Â
Gérer, préserver, partager ses données… quels enjeux ?Â
Il est important de préserver, diffuser et rendre réutilisables les données pour plusieurs raisons : Â
- Promouvoir ses recherches, accroître sa visibilité et l’impact de son travail.Â
- Éviter la duplication des expériences et encourager la réutilisation des données (gain de temps et de ressources).Â
- Favoriser la collaboration scientifique et les possibilités de recherche interdisciplinaire.Â
- Eviter le risque de perte des données en les conservant de manière sécurisée.Â
- Améliorer la transparence des recherches scientifiques.Â
- Encourager le libre accès !
Pour une Science ouverteÂ
Un nombre croissant d’éditeurs scientifiques demandent aux auteurs de rendre disponibles les données analysées dans leurs articles pour améliorer les conditions d’évaluation de l’article. Â
C’est aussi le cas de certains financeurs dans un principe d’ouverture et de transparence :Â
- Dans le cadre du Plan S et du Plan national pour la science ouverte, l’Agence nationale de la recherche impose de fournir un Plan de gestion de données (PGD) pour les projets financés depuis 2019. Â
- La Commission européenne et le Conseil européen de la recherche dans le cadre du programme Horizon Europe (2021-2027) demandent la rédaction d’un Plan de gestion de données pour les projets qu’ils financent.Â
Plus de détails sur les lignes directrices dans les appels à projets français et européensÂ
La charte Science ouverte de l'université PSL adoptée en mai 2020 encourage également la rédaction de PGD et la diffusion des données en Open Access le plus largement possible. L’horizon fixé pour les données de recherche est de les rendre « aussi ouvertes que possible, tout en étant aussi fermées que nécessaire ».Â
Rendre ses données FAIRÂ
Dans le cadre de l’activité de recherche, la gestion des données s’effectue sous la forme d’un cycle de vie allant de la création à la réutilisation des données :Â
Les principes FAIR donnent des lignes directrices pour faciliter la découverte et l’utilisation des données (y compris par les machines) : les données doivent être rendues « Faciles à trouver, Accessibles, Interopérables et Réutilisables ». Â
Pour atteindre les objectifs des principes FAIR, chaque étape du cycle de vie des données suppose l’adoption de bonnes pratiques, telles que :Â
- Utiliser des formats ouverts et non-propriétaires.Â
- Décrire les jeux de données pour pouvoir les interpréter à court et long terme.Â
- Rendre les métadonnées accessibles même quand les données ne le sont pas ou plus.Â
- Conserver les données dans un espace pérenne et sécurisé, de préférence institutionnel.Â
- Diffuser les données dans un entrepôt de données (Zenodo ou Nakala par exemple. Voir aussi l’annuaire re3data.org) et/ou sous forme de data paper.Â
- Attribuer un identifiant unique et pérenne aux jeux de données.Â
- Définir une licence de diffusion et les conditions d’accès aux données.Â
Vos données sont-elles « FAIR » ? Faites-le testÂ
Le Plan de Gestion de DonnéesÂ
Le PGD - Plan de Gestion de Données (ou DMP - Data Management Plan) est un document qui présente et aide à organiser les différentes étapes de la gestion des données au cours d’une recherche ou d’un projet. Â
Il prépare le partage, la réutilisation et la pérennisation des données. Rédiger un PGD répond aux demandes des tutelles, des institutions, des agences de financement et aussi de certains éditeurs. Â
Documenter sa gestion des données à travers un Plan de Gestion de Données offre des garanties de transparence qui répondent à une démarche d'intégrité scientifique comme il est précisé dans le Code de conduite européen pour l'intégrité en recherche (2017) et dans le décret du 3 décembre 2021 relatif à l'intégrité scientifique.Â
Le PGD est un document évolutif : il doit être rédigé au début d’un projet de recherche et ensuite mis à jour régulièrement. Il y aura généralement plusieurs versions au cours d’un projet :Â
- Une version initiale dans les 6 premiers mois du projet de rechercheÂ
- Une version intermédiaire lors de l'évaluation à mi-parcours (pour les projets de plus de 30 mois)Â
- La version finale complète à la fin du projetÂ
Comment s’y prendre ?
Un modèle destiné à la communauté dauphinoise est proposé depuis novembre 2020. Ce document contient une liste de questions à se poser avec des exemples et des recommandations qui répondent aux spécificités disciplinaires de l’établissement.  Il suit une structure en 6 sections : Â
- Présentation du projet Â
- Présentation des données Â
- Aspects juridiques, éthiques et légauxÂ
- Stockage des données Â
- Diffusion et partageÂ
- ArchivageÂ
Où trouver le modèle de PGD de Dauphine ?
- Sur l’Intranet, sous format Excel : en français et en anglais
- Sur DMP OPIDoR qui comporte notamment des options de partage avec des collaborateurs. Cet outil propose différents modèles répondant aux exigences des institutions et des organismes de financement (ANR, Europe…). Â
Accès sur inscription ou par compte institutionnel (via Renater). Sélectionner l’onglet « Créer des plans » : les modèles « PGD Paris Dauphine–PSL (Français) » ou « DMP Paris Dauphine-PSL (English) » sont proposés par défaut aux personnes de l’université authentifiées par Renater.Â
Voir aussi le guide de prise en main du PGD Dauphine-PSL sur DMP Opidor (en français et en anglais).
Pour aller plus loin Â
Guides pratiques sur la gestion des données
- "Guide de bonnes pratiques sur la gestion des données de la Recherche" du groupe de travail inter-réseaux « Atelier Données ». Â
- Guide RGPD 2021 "Les sciences humaines et sociales et la protection des données à caractère personnel dans le contexte de la science ouverte", Institut des sciences humaines et sociales du CNRS (InSHS).Â
- Plusieurs guides OpenAire > Research Data ManagementÂ
Diffuser et réutiliser des données
- Arbre d’aide à la décision sur la diffusion des données de recherche du CIRAD.Â
- Logigramme de l’école des Ponts ParisTech relatif aux droits et obligations en matière de diffusion des données de recherche.Â
- Logigramme de l’Institut Pasteur relatif aux questions juridiques liées à la diffusion des données de la recherche.Â
- Logigramme de l’Institut Pasteur relatif aux questions juridiques liées à la réutilisation des données de la recherche.Â
S’autoformer
- DoRANum : un site pratique très complet qui propose de nombreuses ressources pour accompagner la communauté scientifique dans la gestion et le partage de données.Â
- GopenDoRe : un jeu pédagogique et ludique sous forme de questions/réponses pour acquérir les bonnes pratiques de gestion des données de recherche.Â
La bibliothèque vous accompagne dans l’ouverture et la diffusion de vos données de recherche. Elle travaille en lien avec l’équipe de la Direction du Soutien à la Recherche et la Déléguée à la protection des données. Â
Besoin de conseils ?Â
D’aide pour la rédaction ou la relecture de votre plan de gestion de données ?Â
Vous cherchez comment partager vos données avec votre communauté ?Â
Comment mettre en Å“uvre les bonnes pratiques dans la gestion de vos données ?Â
Contactez-nous !