Demandez votre abonnement gratuit d'un mois !

Covid-19 : « Un bon test grandeur nature pour le Plan national de la science ouverte » (Marin Dacos)

News Tank Éducation & Recherche - Paris - Entretien n°180040 - Publié le 07/04/2020 à 16:43
- +

« Cette crise est un bon test grandeur nature pour le Plan national de la science ouverte : elle permet de révéler le chemin parcouru, et surtout le chemin qui reste à parcourir. Cela pourrait accélérer la mise à jour qui était prévue pour ce plan », déclare Marin Dacos, conseiller pour la science ouverte du DGRI Directeur/rice général(e) de la recherche et de l’innovation au Mesri Ministère de l’enseignement supérieur, de la recherche et de l’innovation , dans une interview à News Tank le 07/04/2020.

Ainsi, cette crise du Covid-19 « ne peut qu’accélérer les choses tant sur les questions numériques, c’est-à-dire sur toutes les difficultés du travail collaboratif à distance rencontrées actuellement par de nombreux acteurs, que sur les démarches d’ouverture de publication et de partage des données ».

Car selon lui, la science ouverte « est au cœur du projet scientifique de demain. Une crise comme celle-là ne fait que confirmer que la science ouverte n’est pas de l’ordre du gadget, mais une nécessité absolue. »

Au niveau international, il note aussi que des éditeurs qui s’étaient opposés au Plan S européen pour la science ouverte ont signé la déclaration du Wellcome Trust appelant au rapide partage des travaux de recherche, « en disant qu’ils allaient ouvrir leurs articles sur la Covid. On sent bien que la position consistant à dire que l’on conserve le système obsolète des abonnements va devenir intenable ».

Mais pour Marin Dacos, les publications scientifiques sur le Covid-19 mises en accès ouvert ne constituent « vraiment que le sommet de l’iceberg », car « ce n’est pas en mettant tous les articles traitant d’une pathologie donnée en accès ouvert que vous ouvrez l’ensemble de la littérature scientifique nécessaire à sa compréhension ».

Le conseiller pour la science ouverte identifie aussi une grosse lacune sur le partage des données de la recherche sur le Covid-19 : « Au sein du Mesri, nous menons des réflexions pour voir comment accélérer ce partage ».

Il indique aussi que le Comité pour la science ouverte réfléchit au lancement d’un chantier sur la traduction automatique de la production scientifique française.


Marin Dacos répond à News Tank

La récente mise en accès  ouvert de publications liées au Covid-19 par de grands éditeurs est-elle de nature à faire avancer plus vite la science pour mieux combattre cette épidémie ?

Sans doute, mais c’est loin d’être suffisant. Vincent Larivière [Université de Montréal] et ses collègues ont étudié  un corpus de 13 000 publications scientifiques sur la famille des virus Corona s’étalant sur plusieurs décennies. Seulement une moitié est en accès ouvert, car l’ouverture annoncée ne couvre que Covid-19.

Les auteurs ont par ailleurs observé que ces 13 000 publications citaient en références un total de 200 000 autres articles scientifiques n’ayant rien à voir avec le nouveau coronavirus, soit en moyenne 20 références par article. Et sur ces 200 000 articles :

  • seuls environ 20 % relèvent du domaine de la virologie,
  • près de 15 % relèvent de la biochimie et de la biologie moléculaire,
  • environ 10 % traitent d’immunologie,
  • près de 10 % relèvent de la recherche biomédicale générale,
  • environ 5 % sont des articles de science vétérinaire, etc.

Etude de V. Larivière et al. - ©  D.R.
Au total, ces 200 000 articles, qui constituent la bibliographie sur laquelle reposent les 13 000 articles sur les virus Corona, sont issus de tous les champs disciplinaires. Donc, même en mettant tous les articles de virologie en accès ouvert, près de 80 % des articles scientifiques utiles pour l’étude du Covid-19 resteraient en accès fermé.

Au final, les publications scientifiques sur le Covid-19 publiées en accès ouvert ne constituent vraiment que le sommet de l’iceberg. Et on ne parle ici que de l’étude du virus.

Mais si on se met à étudier l’épidémie, phénomène biologique et social à la fois, on doit aussi ouvrir les sciences humaines et sociales au sens large. Et la reconstruction de l’économie mondiale impose l’ouverture d’autres publications. Bref, sélectionner disciplinairement ou thématiquement les contenus qu’on veut ouvrir serait une erreur.

Il faudrait donc mettre ces quelques 200 000 publications références également en accès ouvert ?

Ces quelques 200 000 articles, qui représentent la source intellectuelle sous-jacente aux 13 000 articles sur le Coronavirus, ne sont pas majoritairement en accès ouvert : il faudrait donc aussi qu’ils le soient. Car cette étude montre que ce n’est pas en mettant tous les articles traitant d’une pathologie donnée en accès ouvert que vous ouvrez l’ensemble de la littérature scientifique nécessaire à sa compréhension.

Cette mise en accès ouvert de publications scientifiques sur le Covid-19 par les grands éditeurs est donc un bel effort, mais cela reste lacunaire. Par ailleurs, c’est un effort provisoire de quelques mois : une partie des articles ayant été ouverte va ensuite se refermer.

Et il faut aussi que les articles mis en accès ouvert puissent être réutilisés par les chercheurs, notamment pour faire du traitement automatique. Aux États-Unis, un consortium (incluant les NIH National Institutes of Health ) a par exemple voulu regrouper tous les articles scientifiques sur le Covid-19 pour que les chercheurs puissent réaliser des opérations de fouille de texte sur ceux-ci. Près de la moitié des 29 000 articles n’ont pas pu être récupérés à cette fin, car, certes, ils sont en accès ouvert, mais sans droits de réutilisation.

La science ouverte, ce n’est pas seulement l’ouverture des publications scientifiques, mais aussi le partage des données de la recherche, par exemple celles des protocoles d’expérimentation : la crise sanitaire actuelle accroît-elle la mise en accès ouvert des données liées aux publications sur le Covid-19 ? 

Grosse lacune sur le partage des données sur le Covid-19 »

On identifie une grosse lacune sur le partage des données liées aux publications sur le Covid-19. Cela nous conforte dans l’idée qu’il faut qu’on travaille plus sur la formation, l’accompagnement et l’ouverture de services liés à la diffusion des données : c’est crucial.

Les données liées au Covid-19 ne peuvent pas être complètement en accès ouvert quand elles sont liées à des patients, mais elles peuvent été partagées dans le cadre strict défini par le RGPD (règlement général sur la protection des données). Toutefois, globalement, il n’y a pas encore aujourd’hui de culture universelle de partage des données de la recherche (essais cliniques, études observationnelles…).

Mais ce partage des données demande des moyens, du temps, des compétences, des services, des habitudes, un encadrement juridique pour les données personnelles… cela ne se fait pas d’un claquement de doigts. Or, si l’on veut vraiment favoriser la conversation scientifique pour produire une connaissance consolidée, l’accès aux données initiales est vraiment fondamental.

Au sein du Mesri Ministère de l’enseignement supérieur, de la recherche et de l’innovation , nous menons actuellement des réflexions pour voir comment accélérer ce partage des données de la recherche sur le Covid-19. Il y a notamment un enjeu de déclaration des essais cliniques, qui ne sont aujourd’hui pas tous référencés. Il est très important qu’on puisse connaître l’existence de ces essais et de ces études. C’est le premier pas pour accéder aux données, pour pouvoir les croiser, les compiler, les confronter.

Olivier Véran, ministre des solidarités et de la santé, et Frédérique Vidal, ministre de l’Esri, ont demandé « l’accès libre et public aux publications, mais aussi aux données issues de la recherche en lien avec l’épidémie de Covid-19 en France  », le 30/03/2020, relayait News Tank le même jour.

Ceci « afin de créer les meilleures conditions possibles à l’effort intense mené par les forces de recherche françaises  », et donc de « permettre des avancées décisives, notamment concernant l’amélioration de la prise en charge des patients ».

Cela concerne notamment les résultats à venir des projets sélectionnés dans le cadre de l’AAP Appel à projets flash de l’ANR Agence nationale de la recherche sur le Covid-19, ou de la procédure accélérée Covid-19 du ministère des solidarités et de la santé.

Et quel impact cette crise sanitaire a-t-elle sur le Plan et le Fonds nationaux pour la science ouverte ?

Nous avons décidé de repousser la date de clôture de l’appel à projets du FNSO Fonds national pour la science ouverte de 30 jours, soit au 30/04/2020. Initialement prévues à l’automne 2020, les prochaines Journées nationales de la science ouverte auront finalement lieu au printemps 2021 pour se laisser du temps, sinon trop de choses vont se télescoper. En outre on réfléchissait déjà, avant cette crise, à passer d’un rythme annuel à tous les 18 mois pour les JNSO Journées nationales de la science ouverte .

Crise du Covid : un bon test grandeur nature »

Mais plus largement, cette crise est un bon test grandeur nature pour le Plan national de la science ouverte : elle permet de révéler le chemin parcouru, et tout le chemin qui reste à parcourir. Cela pourrait accélérer la mise à jour qui était prévue pour ce plan.

Pour la mise en accès ouvert des publications scientifiques sur le Covid-19 financées par de l’argent public, le problème est résolu au moins à court terme, mais pas du tout sur les données. Il reste un gros travail devant nous avec la particularité du caractère privé des données personnelles qu’il faut absolument respecter, ce qui demande un travail supplémentaire aux chercheurs : de traitement, d’anonymisation, et de structuration informatique.

Car ce qui marche sur votre ordinateur avec les deux collègues de votre bureau, n’est pas forcément compréhensible pour un confrère basé à 10 000 km et doté de logiciels et de conventions différents. Cela nécessite des services et outils numériques, des compétences en interne, les entrepôts de données qui vont avec, les procédures permettant d’avoir des autorisations rapides de la Cnil Commission nationale de l’informatique et des libertés , etc. : ça ne se fait pas du jour au lendemain.

Là encore, la crise sanitaire pourrait nous aider à accélérer le partage des données de la recherche en général, qui présente de fortes différences selon les disciplines scientifiques, via une prise de conscience collective et une concentration de nos efforts sur ce sujet.

La crise du Covid-19 pourrait-elle accélérer le déploiement de la science ouverte en France, en Europe et dans le monde ?

Globalement, cette crise du Covid-19 ne peut qu’accélérer les choses :

  • sur les questions numériques, c’est-à-dire sur toutes les difficultés du travail collaboratif à distance rencontrées actuellement par de nombreux acteurs,
  • et sur les démarches d’ouverture de publication et de partage des données.

Car la science ouverte n’est pas un colifichet pour se donner un supplément d’âme quand on a du temps le vendredi soir après avoir couché les enfants. Non, la science ouverte est au cœur du projet scientifique de demain. Une crise comme celle-là ne fait que confirmer que la science ouverte n’est pas de l’ordre du gadget, mais une nécessité absolue.

Au niveau international, on note par ailleurs que des éditeurs qui s’étaient opposés au Plan S ont signé la déclaration du Wellcome Trust appelant au rapide partage des travaux de recherche, en disant qu’ils allaient ouvrir leurs articles sur le Covid. Bref, on sent bien que la position consistant à dire que l’on conserve le système obsolète des abonnements va devenir intenable.

Quels sont les grands chantiers en cours et à venir pour la science ouverte, notamment en France ?

Nous avons lancé une étude de faisabilité pour créer un entrepôt de données ouvertes qui va générer un gros travail dans l’année qui vient. Ça bouge aussi pas mal à l’international. Nous devions organiser à Paris en avril 2020 la rencontre du Conosc (Conseil des coordinateurs nationaux de la science ouverte), qui a été créé par les Pays-Bas, la Finlande et la France : nous allons sûrement la réduire et l’organiser en visioconférence.

Un chantier sur la traduction automatique »

Par ailleurs, le Comité pour la science ouverte réfléchit au lancement d’un chantier sur la traduction automatique de la production scientifique française. J’ai été missionné pour explorer ce sujet, avec le ministère de la culture, des spécialistes de traduction, de traduction automatique et d’édition.

C’est un sujet important, car si on ne publie qu’en anglais, le citoyen français a un accès difficile aux publications. A l’inverse, dans les disciplines où on publie en français, les étrangers non francophones n’y ont pas un accès facile.

L’idée n’est pas de demander aux scientifiques de changer la langue dans laquelle ils publient, car cela provient de traditions disciplinaires acceptées entre pairs, mais de mettre des dispositifs facilitant la traduction d’une langue à l’autre.

Le but est ainsi d’aller jusqu’au bout de la promesse de la science ouverte de démocratiser l’accès aux savoirs et d’augmenter le rayonnement de la littérature scientifique française : pour cela, il ne faut pas faire que de l’accès ouvert, mais aussi du multilinguisme.

D’autres sujets majeurs pour la science ouverte qui devraient bouger en 2020 ?

Il y a aussi le sujet de l’évaluation des chercheurs, avec l’enjeu de desserrer l’étau de la métrique habituelle. En mars aux Pays-Bas devait se tenir une réunion du groupe rassemblant les DGRI Directeur/rice général(e) de la recherche et de l’innovation des pays membres de l’UE (RPG) sur l’évaluation de la recherche dans le cadre de la science ouverte ; elle a dû être annulée à cause de la crise sanitaire actuelle, ce qui nous a ralentis sur ce sujet crucial.

Il faut changer les règles du jeu, en récompensant les comportements vertueux sur l’ensemble de la chaîne scientifique, notamment la production et le partage des données et des codes sources, et pas seulement sur le bout de la chaîne matérialisée par la publication. Or, pour l’instant, les chercheurs n’ont pas intérêt à partager leurs données, car ils ne sont que rarement reconnus pour cela.

Evaluation : on n’a pas passé le tipping point  »

Si on veut aller au bout du pari de la science ouverte, il faut donc non seulement ouvrir des services pour le partage des données, mais qu’il y ait aussi une reconnaissance. C’est compliqué à mettre en place, car il faut impliquer tous les comités et jurys qui évaluent les projets de recherche, les carrières des chercheurs et les laboratoires en France et à l’étranger…

Pour l’instant, on n’a pas passé le « tipping point » qui nous permettrait de dire qu’on a fait le plus dur, on en est loin. Il y a donc un sujet énorme sur la réforme de l’évaluation. Le Mesri doit aussi lancer cette année le Prix des données de la recherche qui va dans ce sens-là, en donnant de la valeur au partage des données, même si la crise du Covid-19 nous retarde un peu, mais on va s’y mettre !

Alors que le Comité pour la science ouverte a annoncé un financement de 450 k€ pour trois infrastructures internationales via le FNSO le 10/03, Marin Dacos indique notamment qu’une rencontre est prévue avec les responsables d’une de ces trois infrastructures - le projet anglo-italien OpenCitations- «  qui est le projet que nous avons le plus lourdement soutenu.

Il revêt en effet une dimension stratégique pour nous, car l’idée est de passer d’un monde de citations fermées aux citations ouvertes, c’est un des fondements de la science ouverte qu’on essaye de débloquer. On ne va donc pas seulement leur donner un chèque, mais monter un partenariat étroit avec eux, notamment avec l’équipe du Baromètre de la science ouverte, en essayant d’insérer les données de citations ouvertes dans nos propres outils ».

L’analyse de la stratégie actuelle d’ouverture des grands editeurs en une image relayée par Johan Rooryck du Plan S européen

Marin Dacos

Email : marin.dacos@recherche.gouv.fr

• 2005 : Trophée du Libre pour le logiciel Lodel (Logiciel d’édition électronique) ;
• 2010 : Cristal du CNRS ;
• 2013 : Global Outlook Digital Humanities Essay First Prize ;
• 2016 : Médaille de l’innovation du CNRS ;

Consulter la fiche dans l‘annuaire

Parcours

Ministère de l’enseignement supérieur, de la recherche et l’innovation
Conseiller pour la science ouverte du DGRI
Istex
Membre du CT
HAL
Membre du CST
Crossref
Membre élu au CA, représentant d’OpenEdition
Comité de suivi de l’édition scientifique
Membre
OpenEdition
Directeur
Ministère de la recherche
Conseiller pour la numérisation des revues de SHS

Établissement & diplôme

Université Lumière - Lyon 2
DEA d’Histoire contemporaine
Histoire
Agrégé

Fiche n° 15768, créée le 04/02/2016 à 10:38 - MàJ le 28/08/2019 à 18:29