Comment réutiliser les données de recherche

Je tiens à remercier mes collègues du groupe de travail (Ré)utilisatibilité du consortium Cahier pour leur fabuleux guide: Vademecum pour la réutilisabilité des données. À la page 6, les auteurs indiquent :

L’un des principaux verrous pour la réutilisation des données concerne les aspects juridiques. En France, le cadre légal prône l’ouverture des données au maximum (cf. loi sur la république numérique14 et loi Valter15). En même temps, d’autres principes s’appliquent : les droits d’auteur et les droits voisins, la question de la propriété intellectuelle ou des données personnelles (droits à l’image, respect de la vie privée, etc.). C’est surtout flagrant pour les corpus récents (XXe -XXIe siècle). Il en découle des restrictions pour la réutilisabilité des données et leur citabilité16. Il existe une zone de flou, qui peut déstabiliser les porteurs de projets et les utilisateurs : par exemple, du point de vue des droits, certaines données sont inaccessibles, alors que leurs métadonnées sont, elles, accessibles.

Dans quelle mesure les métadonnées sont-elles concernées par le droit d’auteur ? Sans doute faudrait-il distinguer les métadonnées purement descriptives de celles qui sont le fruit d’un travail d’interprétation17. Mais si ce travail d’interprétation n’est pas signé, il est difficile concrètement de le protéger. Une des premières actions d’un projet doit être de chercher les indications de signatures et de protection juridiques (licence, source, propriété, etc.) des données. Si ces indications ne permettent pas la réutilisation des données, il est toujours possible de contacter les propriétaires des droits.

14 Voir https://www.economie.gouv.fr/republique-numerique

15 Voir https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000031701525

16 Marie-Luce Demonet, « La Confiscation des données issues de l’humanisme numérique » in Véronique Ginouvès ; Isabelle Gras, La Diffusion numérique des données en SHS – Guide de bonnes pratiques éthiques et juridiques, Presses universitaires de Provence, 2018, Digitales, 9791032001790 〈hal-02068085〉.

17 Le droit d’auteur s’applique à tout travail témoignant de l’originalité d’une pensée. Voir le tutoriel de Mate-SHS avec une intervention de Lionel Maurel, « À qui appartiennent les données ? » : https://mate-shs.cnrs.fr/actions/tutomate/tuto25-propriete-donnees-lionel-maurel

Source: Vademecum pour la réutilisabilité des données. p. 6

À la page 11:

Faire un état des lieux juridique
Un tel état des lieux doit concerner autant les données réutilisées que les données produites
et comprendre au moins les aspects suivants :
– identification du statut juridique des données réutilisées ;
– prise en compte des différents types de contenus produits par le projet : images et transcriptions, images sans transcriptions, transcriptions sans images, etc. ;
– intégration de la question de la réutilisabilité des données à la convention entre les différents partenaires, qu’il s’agisse d’institutions, d’individus ou d’ayants droit ;
– résolution des problématiques induites par le RGPD (Règlement général sur la protection des données). En cas de doute, il faut contacter le DPO (Data Protection Officer), aussi appelé DPD (Délégué à la Protection des Données) de votre établissement, qui vous conseillera sur les démarches éventuelles à entreprendre auprès de la CNIL (Commission Informatique et Liberté) et sur les précautions à prendre avant
de traiter et de publier vos données ;
– résolution des contraintes liées au respect des droits d’auteurs ;
– état des lieux des possibles embargos pour ne pas se retrouver bloqué au moment de la mise en ligne des données

Source: Vademecum pour la réutilisation des données, janvier 2022, p.11

De plus, les auteurs précisent à la page 18:

Il faut pouvoir concevoir, dès la phase initiale du projet, une charte anticipant et précisant toutes les conditions de réutilisation possibles en concertation avec l’ensemble des acteurs concernés (institutions, ayants droit, etc.). Quand un projet implique plusieurs partenaires,
ou des partenaires internationaux, qui peuvent être soumis à des cadres légaux différents, il apparaît nécessaire de prévoir dans un document-cadre les difficultés potentielles à cette gestion des données, idéalement dès le tout début du projet.

Source: Vademecum pour la réutilisabilité des données. p. 18

Je me demande si la nouvelle norme ISO 24143:2022 – Information et documentation — Gouvernance de l’information — Concept et principes pourrait être utile pour documenter les pratiques des chercheurs en lien avec leur traitement des données… La recherche universitaire constitue une certaine forme de gouvernance des données.

Ce contenu a été mis à jour le 2022-06-06 à 19 h 50 min.