Knowtex Blog

Réenchanter la science, collectivement

Le 18 janvier 2012 par Tom Roud

J’ai profité de la pause de fin d’année pour me plonger dans le relativement fameux Reinventing Discovery, de Michael Nielsen, revu et encensé un peu partout. Dans cet essai, Nielsen, un physicien théoricien qui a décidé de se consacrer à l’écriture scientifique à l’occasion d’un congé sabbatique, présente sa vision d’une future science en réseau et citoyenne.

La thèse de Nielsen est simple : la prochaine révolution scientifique passera par une science totalement ouverte, participative, citoyenne, utilisant naturellement la force de frappe des réseaux de toutes sortes et notamment le temps de calcul humain évoqué ici. Nielsen passe l’essentiel de son livre à appuyer ses propos en disséquant moult exemples actuels de cette vision (dont la plupart m’étaient inconnus) :

  • le projet Polymath. Il s’agit à la base d’un blog, lancé par Terence Tao, médaille Fields en 2005 à 31 ans. L’idée de Tao était de proposer des problèmes de maths non résolus sur son blog, et d’ouvrir la discussion en commentaires sur la meilleure façon de les résoudre collectivement. Le premier projet Polymath résolu a été mis sur l’arXiv en octobre 2009 ;
  • le projet Galaxy Zoo. Devant la masse de données produites par Hubble, il est impossible aux astronomes de classifier toutes les galaxies observées. Ce projet demande au grand public d’utiliser leur temps de calcul humain pour opérer cette classification. Galaxy Zoo a rapidement bifurqué vers des directions inattendues grâce aux forums de discussions : ainsi, de nouveaux types de galaxies ont été découverts par les internautes, comme les galaxies « petits pois » ;

  • Fold-it, dont on a longuement parlé ici ;
  • d’autres projets collaboratifs moins scientifiques, comme le match d’échecs Kasparov vs The World. Durant ce match, tous les internautes étaient libres de voter pour chacun des coups de l’équipe « The World », et le vote majoritaire était retenu. Apparemment, Kasparov a qualifié cette rencontre de plus grand match d’échec de tous les temps. N’y connaissant rien aux échecs, je laisse les spécialistes juger.

Au-delà de la liste d’exemples, Nielsen dissèque assez bien (selon moi) les raisons pour lesquelles ces projets collaboratifs fonctionnent. Il y a bien sûr les projets de parallélisme brut, tels Fold-it ou Galaxy Zoo, où, en somme, les cerveaux humains se substituent aux ordinateurs incapables de traiter des tâches complexes très faciles pour l’intelligence humaine. Ces projets font donc appel à tous les Internautes, et n’importe qui peut ainsi contribuer à la science même sans avoir fait d’études scientifiques. Il suffit donc d’un petit pourcentage d’internautes motivés se passionnant pour l’entreprise pour produire des résultats significatifs, les scientifiques professionnels jouant le rôle de canalisateurs, d’interpréteurs de résultats ou plus prosaïquement, de fournisseurs d’outils d’analyse.

Le deuxième type de projets ressemble plus à un processus de recherche classique, dans lequel Internet joue le rôle de levier en canalisant et concentrant les discussions entre scientifiques. Nielsen dégage quelques critères intéressants pour le succès d’une telle entreprise. L’un d’eux me paraît très intéressant : pour qu’une discussion scientifique sur Internet soit productive, il faut que les différents intervenants puissent identifier de façon quasi objective un progrès ou une bonne idée.

Prenons l’exemple des échecs : tout le monde n’est pas capable de jouer comme Kasparov à tous les coups, mais nul besoin d’être Kasparov pour reconnaître un grand coup. De même, un mathématicien amateur n’est peut-être pas capable de produire une démonstration valant une médaille Fields, mais il est capable de reconnaître une grande idée si on la lui présente. Or, continue Nielsen, tous les scientifiques sont de facto hyper spécialisés, et sont capables de produire des idées exceptionnelles sur leur microspécialité. Si ces idées sont reconnaissables immédiatement par l’agora des chercheurs, la recherche peut alors avancer à vitesse grand V sur le réseau, dans un processus très darwinien qui est à la fois capable de générer de nombreuses idées (microspécialité des chercheurs) et de sélectionner à bon escient celles qui sont les plus prometteuses (reconnaissance objective des avancées par l’intelligence collective).

Si le propos et les exemples sont très intéressants, le scientifique professionnel sait évidemment que les choses ne peuvent se passer comme cela, et après une brève introduction des problèmes en début de livre, il faut attendre le dernier chapitre pour que Nielsen présente enfin des solutions pour ouvrir la science conformément à ses vœux. Car le problème essentiel aujourd’hui est que la reconnaissance scientifique, celle qui fait qu’on puisse vivre de la science, passe par la publication scientifique nominative. Et qui dit publication scientifique, dit risque de se faire « scooper », ce qui est un frein considérable au partage des données et des idées.

Nielsen prend alors un contrepied intéressant en mettant en perspective l’histoire des sciences, en rappelant les pratiques passées. On apprend notamment qu’il était de bon ton autrefois de ne pas publier ses idées scientifiques, pour des raisons assez similaires à celles d’aujourd’hui : la peur de se faire voler ses idées avant d’avoir pu les exploiter complètement. Nielsen raconte notamment cette anecdote que j’ignorais sur la découverte des anneaux de Saturne. Après les avoir observés, Galilée envoya à Kepler (et à d’autres) le message suivant :

« smaismrmilmepoetaleumibunenugttauiras »

qui était en fait l’anagramme de :

« Altissimum planetam tergeminum observavi »

(Traduction : « j’ai observé que la planète la plus éloignée a une forme triple »).

L’idée de Galilée était que sa découverte reste « cachée » dans l’anagramme, mais que si besoin était dans le futur, il pourrait révéler le sens de l’anagramme et ainsi s’assurer de l’antériorité de la découverte. On a là une sorte de dilemme du prisonnier : chaque scientifique individuellement n’avait pas intérêt à publier seul ses résultats, mais l’intérêt collectif était de favoriser une publication maximale.

Nielsen explique que ce sont les mécènes de la science qui ont, de facto, imposé un peu de coercition : en rétribuant la publication scientifique, en en faisant la condition pour la reconnaissance et l’avancement dans la carrière, on a forcé les scientifiques à publier ce qu’ils gardaient dans leur cerveau ou leurs tiroirs, et à en faire ainsi bénéficier la collectivité. Une fois le processus enclenché et les bonnes pratiques mises en place, plus personne n’avait intérêt à « jouer perso » et c’est ce que Nielsen appelle la première révolution de la science ouverte, structurant les pratiques de publication scientifique actuelle.

Nielsen note également que cette problématique reste d’actualité : par exemple, tous les génomes séquencés ne sont pas encore publiés pour des raisons exactement similaires. Il a fallu un protocole d’accord collectif entre scientifiques il y a 15 ans, les principes des Bermudes, pour que les données du génome humain soient mises en accès libre avant même la publication.

Pour ouvrir un peu plus la science et parvenir à la révolution qu’il souhaite, Nielson s’inspire du passé. Tout étant question d’incitations financières, son idée est de frapper le nerf de la guerre, et que tout changera le jour où les agences de financement valoriseront les données ouvertes, partagées, et plus généralement « l’open science ». Mais la coercition extérieure ne suffira pas : il faut que la communauté soit « mûre » sur le sujet, et que les chercheurs, collectivement, acceptent de « perdre » un peu du pouvoir qu’ils ont sur leurs données pour les partager au plus grand nombre, exactement comme ce qui s’est passé pour les principes des Bermudes (1).

Une autre idée tout aussi intéressante est une vision subtilement différente de la publication scientifique basée sur l’arXiv, ce dépôt de manuscrits scientifiques de physique en accès libre. En fait, Nielsen propose de faire un processus de peer-review ouvert et en temps réel, utilisant ce genre de dépôts centralisé comme métrique. Avec un système ouvert, centralisé, et les technologies types « réseau social », il devient alors très facile d’évaluer l’impact non seulement d’une publication, mais aussi d’un dépôt de données, voire d’un billet de blog ou d’un wiki. Nielson imagine un cercle vertueux où l’ouverture totale permet de devenir en quelque sorte plus influent, ce qui peut être immédiatement évalué et récompensé. Une perspective assez intéressante pour le scientifique blogueur ;-).

Enfin, Nielsen aborde même des aspects plus techniques, insistant sur le fait que la science en général doit aussi accepter de récompenser les scientifiques faisant des développements d’outils permettant partage et analyses collectives de données. Il rappelle par exemple comment le créateur de l’arXiv, Paul Ginsparg, a été légèrement méprisé par ses collègues au motif qu’il aurait « gâché » son talent de physicien pour créer ce dépôt, alors que, comme le souligne Nielsen, Ginsparg avec l’arXiv a peut-être plus fait pour la physique en général que n’importe quel physicien de sa génération.

Un livre très intéressant et très stimulant donc, qui fait réfléchir sur nos pratiques à la fois scientifiques et « blogosphériques ». Sur la forme et l’objectif, je ne peux m’empêcher d’être pessimiste : je ne crois pas qu’on puisse changer un système aussi facilement, d’autant que quoi qu’on en dise, le système est en crise. Il n’y a jamais eu autant de pression à publier, jamais eu aussi peu de postes, et l’argent pour les recherches tend à se tarir. Même chez les jeunes professeurs (…), l’état d’esprit ne me semble pas à l’ouverture maximale ; la peur du futur et de la tenure clock [la tenure clock désigne le compte à rebours avant la titularisation d’un professeur assistant aux États-Unis, ndlr] sont mauvaises conseillères.

Sur le fond, je ne peux m’empêcher de voir un biais très « sciences dures » dans le propos de Nielsen. Débattre d’idées mathématiques sur un blog, pourquoi pas. Débattre constructivement de biologie ou d’une science expérimentale, où il n’y a pas forcément de formalisme aussi clair et où une vérification d’idée peut prendre plusieurs semaines me paraît impossible.

Nielsen semble aussi oublier que, contrairement à la physique ou aux maths, dans beaucoup de sciences, ce ne sont pas nécessairement les idées brillantes qui ralentissent les progrès scientifiques, mais 1/ les aspects techniques 2/ le manque de moyens humains compétents 3/ une incitation à la prise de risque négative. Du coup, une grande part de la science est très « incrémentale » : on a tendance à vivre sur ses acquis techniques et humains, et le processus de création purement darwinien décrit plus haut me semble difficile à réaliser.

Plus généralement, dans un système reposant sur l’intelligence collective, comment sélectionne-t-on et forme-t-on les scientifiques ? Comment empêche-t-on les « free riders » de prospérer, ceux qui font plus de communication que de science, ou qui s’approprient les idées des autres, tuant ainsi tout le processus sur le long terme ? Qu’on songe par exemple à tout ce qui est déplaisant dans l’écosystème des blogs, n’y a-t-il pas certains risques similaires ? Un autre système est-il vraiment possible ?

Notes

  1. D’un strict point de vue économique, c’est d’ailleurs un exemple tout à fait intéressant d’échec d’une approche totalement individualiste : il faut que pour le bien collectif, tout le monde accepte de partager les données. Et une fois que la pratique est mise en place, un scientifique souhaitant garder pour lui seul le fruit de son travail se retrouverait nécessairement mis à l’écart de la société. Une leçon intéressante pour les théories libertariennes, je trouve ;-)

Pour aller plus loin

- Weblist Science citoyenne & participative

>> Illustrations : adesigna, jordigraells, opensourceway (Flickr, licence CC)

>> Source : Article publié initialement sur le blog Matières Vivantes, membre de la communauté du C@fé des Sciences.

1 commentaire

  1. Guillaume le 18 janvier 2012 à 16:06

    Cela résume plutôt bien la situation.

Ajoutez un commentaire

Pas encore membre ? Inscrivez-vous pour laisser un commentaire ! Déjà membre ? Connectez-vous

Tous les contenus, sauf exception signalée, sont sous licence Creative Commons BY-NC-SA