La production du chercheur, qu’en faire ?

Inspiré par un échange de tweets que j’ai eu récemment avec Miss K., qui se reconnaitra, je vous fais part de mon point de vue sur ce qu’il faut faire en terme de communication scientifique « professionnelle » (= à destination des pairs et des « utilisateurs » de la science).

L’idée d’origine évoquée était celle de mettre en ligne les idées le plus vite possible, en faisant des petits papiers courts sur arxiv. Cette idée, j’y adhère globalement, mais je pense qu’il faut réfléchir plus à ce que l’on souhaite, car finalement en tant que chercheurs nous sommes les premiers consommateurs de résultats scientifiques, en plus d’en être les producteurs.

La « mission » du chercheur

Le premier point délicat est d’abord de voir quelle est la mission du chercheur vis à vis de la société. C’est d’ailleurs très amusant, les chercheurs sont définis par les grands organismes via leurs livrables, ces derniers impliquant à leur tour des compétences administratives, logistiques et techniques, mais pas du tout par une définition réelle et simple de ce qu’est la recherche scientifique.

Ici, je partirais du principe que l’objectif du chercheur est de produire de la connaissance nouvelle. Une fois ce principe fixé, quid de la dissémination de cette connaissance?

Communiquer, une nécessité pour être évalué ?

Il est nécessaire d’aborder le « problème » de l’évaluation, car c’est cette dernière qui est le driver des livrables de dissémination.
Nous sommes à une époque où il faut être productif, c’est le leitmotiv des tutelles publiques ou privées. Mais ce mot ne veut rien dire en l’absence d’une vision claire de ce que l’on attend du producteur. Le phénomène est connu, l’évaluation étant réalisé principalement par des incompétents, ce qui ce met en place est une logique de comptage du livrable le plus simple à comprendre : l’article scientifique.

Posons-nous sincèrement la question : si il n’y avais pas tout le cinéma du comptage des publications par divers comités incompétents (parce qu’ils sont nuls, parce que les gens qui les composent n’ont pas le temps, parce que etc.), est-ce que nous ferions autant de publications, est-ce tout notre effort de communication serait tourné vers produire du papier à tout prix ?

Disséminer est INDISPENSABLE

La recherche est devenu une activité de moins en moins solitaire, et il est nécessaire de s’entourer de toutes les compétences possibles pour résoudre des problèmes de « grande largeur ». Un problème de grande largeur est pour moi justement un problème qui nécessite une force de travail et des connaissances/compétences qui dépassent celles d’une personne, indépendamment du temps disponible.

Il faut donc communiquer ses résultats pour créer un vrai réseau de recherche efficace, mais comment ?

Ma propre expérience (bah oui, vous êtes sur mon blog)

Pour expliquer ma propre expérience, il me faut raconter un minimum ma vie professionnelle, que vous pouvez mettre en regard avec mon entrée DBLP. Après ma thèse j’ai fait une année un peu flottante avec une expérience d’entreprise, puis je suis devenu enseignant-chercheur dans le privé (à l’EPITA) avec pour mission de bien enseigner et de publier. Puis, on m’a proposé de faire une année à l’X en postdoc, ce que j’ai fais pour repartir dans le circuit public. L’année en question est l’année 2006-2007, et je suis devenu MCF en septembre 2007. En 2010 je passe l’HDR, pour devenir prof en 2012, et depuis septembre 2014 je suis en dispo et je m’occupe du mini labo que j’ai co-fondé, mais je fais de la recherche (pas plus appliquée qu’avant, mais mise en place par des clients ou par nous).

Quand on confronte cette « bio » avec DBLP, on voit des pics de publications dans toutes les années consacrées à la carrière, et c’est là le paradoxe, dans les moments où on a le moins de temps à consacrer à la recherche, c’est là qu’on va produire le plus. Pour que cela soit possible, il y a plusieurs possibilités :

  • Une nette augmentation du temps de travail, au détriment du reste.
  • Des pratiques douteuses : cabales de publication, recherche incrémentale.
  • Canalisation de tout l’effort de recherche sur les papiers, et pas sur la production de nouvelles connaissances.
  • Etre un chercheur hors du commun.

Comme le quatrième point est, comme son nom l’indique, peu probable, il reste des comportements non souhaitables au niveau institutionnel, alors que chacun pense faire exactement ce qui lui est demandé.

Par ailleurs, une large partie de la dissipation en terme de production de publications est due au processus de publication lui-même. Il faut écrire le papier, il faut qu’il soit reviewé (et donc si on soumet on se retrouve à reviewer à un moment ou un autre au moins 2 à 3 fois plus de papiers que ce que l’on a écrit), vu que le taux d’acceptation moyen est sans doute autour de 25%, on va refaire le processus 3 à 4 fois avant acceptation, puis il faudra aller à la conférence, ce qui va demander des sous et du temps (au moins 3 ou 4 jours de voyage). Bref, un surcoût important pour la communauté, et de la fatigue pour les personnes.

Comment je vois les choses

Ce n’est que mon point de vue, et il est sans doute très centré sur les pratiques en informatique (au sens du computer science anglo-saxon), mais je le partage.

  • Il faut faire circuler les bonnes idées : si vous avez une idée que vous n’allez pas exploiter aussitôt (parce qu’elle peut amener un gros résultats, parce qu’il s’agit d’un algo qui peut rapporter financièrement), il est intéressant de les mettre en ligne rapidement. Pour cela, l’idée avancée par miss K. est parfaite : un petit papier de 4 pages double-colonnes maximum dans arxiv avec l’idée et quelques explications, c’est parfait pour permettre à d’autres de bosser, et parfait aussi pour vous donner la paternité si c’est ce qui vous intéresse.
  • Il faut signaler les mauvaises idées : si quelque chose ne fonctionne pas, il faut le dire d’une manière ou d’une autre pour éviter que d’autres perdent leur temps. Pour cela, un blog technique est parfait.
  • Coder n’est pas une fin en soi : si vous avez écrit du code pour prototyper vos algos, et si ce code n’est pas vendu à un tiers, faites le circuler. Même si c’est mal écrit, ça peut toujours être utile. Si vous avez peur qu’on vous vole votre code (?), alors donnez des binaires.
  • Partagez vos datasets et résultats d’expérimentations. La reproductibilité des résultats devrait être une priorité, et elle n’est possible que si vous partagez les sorties, mais aussi les entrées, de votre processus d’expérimentation.

Voilà, si vous faites tout cela, alors d’un pur point de vue scientifique, il n’y a pas besoin des publications, sauf pour la carrière…

Et comme d’habitude les commentaires sont là, pour commenter dans la joie, la bonne humeur et la courtoisie.

 

5 commentaires on "La production du chercheur, qu’en faire ?"

  • Miss K. says

    Bonsoir,

    Merci pour cet article très intéressant. La question de la production d’un chercheur est une question que je me pose… depuis que j’ai quitté la voie qui m’était tracée (l’entreprise privée, a priori en bureau d’études) pour la recherche publique.

    Partons d’une question de base : à quoi sert un chercheur, quel est son rôle dans la société ? Je pense qu’il est là pour produire des idées : répondre à des questions. Par conséquent, je te rejoins quand tu dis l’important est de disséminer : une fois qu’on a une réponse à une question, il est primordial de donner accès à quiconque en a besoin ! Un résultat est totalement inutile si il reste au fond d’un tiroir dans un labo. On n’a produit un résultat qu’une fois qu’on l’a communiqué, d’une manière ou d’une autre.

    C’est dans ce sens que, quand je travaille sur un article, je me pose toujours la question de la réutilisabilité de mon travail : si quelqu’un se pose cette question à nouveau, je lui donne la réponse et il faut qu’il puisse l’exploiter.

    Un autre argument en faveur d’une communication d’un rapport court sans review sur une plate-forme à la arXiv est sa rapidité. Prenons les délais d’une publication classique en conférence : soumission à une date D, fin du processus de review généralement 1,5 à 2 mois plus tard, publication 2 mois plus tard. Un article qui est publié a été rédigé 4 à 6 mois avant. Et je ne parle pas des revues où le processus peut être bien plus long et se compter en années. Un rapport arXiv est publié tout au plus 24h après son dépôt sur la plate-forme. Il peut être réutilisé extrêmement rapidement, que ça soit par son auteur pour des travaux ultérieurs (ne serait-ce que pour citer ces travaux antérieurs dans l’article suivant) ou par d’autres.

    Cependant, le processus de review, si il est fait correctement (notamment si les reviewers ont le temps de se pencher sur les détails, les preuves etc, et comme tu l’évoques c’est un processus lourd), donne une sortie de légitimité au résultat : il a été vérifié par 3 ou 4 experts du domaine qui ont validé le contenu, on peut donc avoir relativement confiance en ce qui est dit dans l’article. Certes l’erreur peut subsister, mais c’est mieux d’avoir 3 vérifications qui ne sont pas infaillibles qu’aucune. À l’inverse, quelqu’un qui réutilise un rapport (type arXiv ou HAL ou autre) doit faire ce processus de vérification lui-même. C’est là à mon sens la limite de la publication sans review. Cependant, on peut probablement nuancer : un rapport arXiv cité 10 fois a probablement été vérifié avec au moins le même soin que si il était passé entre les mains de 3 reviewers et on peut probablement considérer ce qui est dit comme aussi fiable 😉

    C’est pour cela que je ne considère pas l’un ou l’autre de ces deux systèmes de publication comme meilleur dans l’absolu, mais qu’ils peuvent être utilisés de façon complémentaire : d’où cette idée d’un article court sur arXiv en attendant la publication des articles complets, analysés plus en profondeur, par la voie traditionnelle soumission/review/publication.

    Camille

Trackbacks