vendredi 10 avril 2026 à 12h
Dépollution de la littérature scientifique : traque de la «fake science»
Avec Guillaume CABANAC
Professeur des universités en informatique à Toulouse, titulaire de la chaire « Décontamination de la littérature scientifique ». Membre de l'Institut universitaire de France (IUF)
https://toulouse.demosphere.net/rv/34808
La revue scientifique Nature, l'une des plus anciennes et réputées au monde, l'a surnommé « deception sleuth », littéralement : « fin limier de la supercherie ». Ce sont ses méthodes et ses découvertes de fraudes scientifiques produites par les usines à articles que nous présentera Guillaume Cabanac.
Le problème du 'fake' n'épargne pas la science. Imaginez lire du texte dénué de sens tel que invulnerable framework, glucose bigotry et nucleic corrosive* dans un article scientifique publié par une maison d'édition de référence comme Elsevier, Springer ou Wiley. Nous avons identifié 20k articles contenant de telles expressions torturées produites par des outils paraphrasant des publications authentiques pour passer sous les radars des détecteurs de plagiat. Ce problème affecte 3/10 000 articles publiés en 2021.
Les fraudeurs produisent ces articles non fiables ou les achètent auprès de paper mills. Cette conférence présentera comment des « détectives scientifiques » identifient les problèmes, les signalent, font rétracter des centaines d'articles et suivent les liens de citation pour freiner la propagation des erreurs grâce au Problematic Paper Screener : un site web public qui passe au peigne fin les 150 millions d'articles produits à ce jour.
* Au lieu de immune system, glucose intolerance et nucleic acid.
Biographie
Guillaume Cabanac est professeur d'informatique à l'Université de Toulouse et membre de l'Institut de recherche en informatique de Toulouse (IRIT UMR 5505 CNRS).
Il est titulaire d'une chaire de recherche fondamentale de l'Institut universitaire de France (IUF) intitulée « dépollution de la littérature scientifique ».
Ses travaux visent à identifier des publications non fiables par fouille de textes, notamment au sein du projet ERC Synergy 'Nanobubbles' questionnant le processus d'auto-correction de la science. Il développe le 'Problematic Paper Screener' qui traque des publications non fiables, pourtant publiées et souvent vendues par les maisons d'édition de premier plan.
Au quotidien, ses signalements d'articles problématiques, contenant notamment des expressions torturées, ont donné lieu à plus de 3 500 rétractations. Sa recherche a été distinguée dans le palmarès "Nature's 10" présentant « dix personnes qui ont contribué à façonner la science en 2021 » selon la revue Nature.
> Plus d'infos : coupures de presse et documentaires
Distinctions et prix
- 2025 Prix du meilleur article de l'année 2025 de la revue scientifique JASIST. https://asistdl.onlinelibrary.wiley.com/doi/1…
- 2022-2027 Membre Junior de l'Institut universitaire de France (IUF), chaire de recherche fondamentale.
- 2021 Nommé dans le Nature's 10 : dix personnes qui ont contribué à façonner la science en 2021. Cette distinction loue l'apport du Problematic Paper Screener traquant les articles scientifiques frauduleux.
https://www.nature.com/immersive/d41586-021-0… - 2012-2027 Prime d'excellence scientifique / d'encadrement doctoral et de recherche - rang A
- 2010 Prix du meilleur article de la European Conference on Digital Libraries.
https://link.springer.com/chapter/10.1007/978…
Publications
- Abalkina, A., Aquarius, R., Bik, E., Bimler, D., Bishop, D., Byrne, J., Cabanac, G., Day, A.,Labbé C., C Wise, N. (2025). 'Stamp out paper mills' - Science sleuths on how to fight fake research [Comment]. Nature, 637(8048), 1047-1050. https://doi.org/10.1038/d41586-025-00212-1
- Cabanac, G. (2024). Chain retraction: How to stop bad science propagating through the literature [Comment]. In Nature, 632(8027), 977-979.
https://doi.org/10.1038/d41586-024-02747-1
- Cabanac, G. (2021). This digital-hygiene routine will protect your scholarship [World View: A personal take on science and society]. Nature, 598(7882), 541-541. https://doi.org/10.1038/d41586-021-02901-z
- Cabanac, G., C Labbé, C. (2021). Prevalence of nonsensical algorithmically generated papers in the scientific literature. Journal of the Association for Information Science and Technology, 72(12), 1461-1476. https://doi.org/10.1002/asi.24495
- Cabanac, G., Labbé, C., C Magazinov, A. (2021). Tortured phrases: A dubious writing style emerging in science. Evidence of critical issues affecting established journals. arXiv preprint. https://arxiv.org/abs/2107.06751 (supplementary materials)
- Cabanac, G., Labbé, C., C Magazinov, A. (2022). "Bosom peril" is not "breast cancer": How weird computer-generated phrases help researchers find scientific publishing fraud. Bulletin of the Atomic Scientists. https://thebulletin.org/2022/01/bosom-peril peril
- Cabanac, G. (2022). Decontamination of the scientific literature. arXiv preprint. https://doi.org/10.48550/arXiv.2210.15912
- Conroy, G. (2023). Scientific sleuths spot dishonest ChatGPT use in papers [News].
Nature. https://doi.org/10.1038/d41586-023-02477-w - Else, H. (2021). "Tortured phrases" give away fabricated research papers [News].
Nature, 596(7872), 328-329. https://doi.org/10.1038/d41586-021-02134-0
Entrée libre
Lien : https://toulouse.demosphere.net/rv/34808
Source : https://grep-mp.org/evenement/tracker-de-fake…
Source : message reçu le 30 mars 11h