L'algorithme qui révèle l'ampleur du dopage

Les chiffres sont saisissants : 19 % d'analyses anormales chez les footballeurs de ligue 1 et 2, 42 % chez les cyclistes professionnels : un nouvel algorithme révèle les failles et les limites du passeport biologique des athlètes, pourtant présenté comme l’arme ultime de l’Agence mondiale antidopage.

par Louane Velten,

“L’algorithme sur lequel est fondé le passeport biologique de l’athlète contient des biais et des failles dont personne ne parle.” C’est une petite bombe que nous lâche Geoffroy Berthelot, chercheur à l’Insep, l’Institut national du sport, de l’expertise et de la performance. Une bombe placée au cœur du dispositif central de la lutte mondiale contre le dopage.

L’affaire commence il y a une dizaine d’années, quand l’équipe de chercheurs de l’Insep et de l’université Paris-Cité est mandatée par la Fédération française de football pour développer un algorithme qui suit des paramètres sanguins ou urinaires des sportifs : hémoglobine, testostérone, hormone de croissance… Cet algorithme, publié en 2019, vérifie que ces biomarqueurs fluctuent normalement au regard de précédentes valeurs recueillies chez le même athlète. Classique : c’est le principe du passeport biologique de l’athlète, lancé dix ans plus tôt par l’Agence mondiale antidopage (AMA). “Nous savons que certaines substances ou pratiques dopantes entraînent une variation anormale de certains paramètres biologiques, détaille Michel Audran, pharmacien et expert en charge de l’analyse de ce passeport. Par exemple, prendre de l’EPO va stimuler brutalement la production de réticulocytes, et quelques jours plus tard, on observe une augmentation de l’hémoglobine, ce qui favorise le transport de l’oxygène dans le sang. Puis les réticulocytes chutent et c’est la différence soudaine avec l’hémoglobine élevée qui marque le dopage sur le passeport.”

Des chiffres saisissants

Oui, sauf qu’en 2025, quand Geoffroy Berthelot fait tourner son algorithme sur des prélèvements sanguins de 3 963 footballeurs de ligues 1 et 2 collectés entre 2006 et 2019, et 436 cyclistes professionnels entre 2003 et 2014, il obtient des chiffres saisissants. Les résultats, en cours de validation par les pairs, pointent des séquences anormales pour l’hormone de croissance chez 42 % des cyclistes. 19 % des footballeurs et 40 % des cyclistes présentent des anomalies sur la ferritine, liée au taux de fer dans le sang, qui peut traduire un dopage par transfusion. Et chez 10 % des cyclistes, on relève des anomalies sur les marqueurs du dopage sanguin, relatives aux transfusions ou à la prise d’EPO, une hormone qui stimule la synthèse de globules rouges. 

Des chiffres à mettre en regard des statistiques officielles de détection. Entre 2009 et 2021, près de 300 000 prélèvements sanguins et 60 000 prélèvements urinaires ont été analysés dans le cadre du passeport biologique dans une quarantaine de sports qui ont débouché sur seulement 180 violations des règles de l’antidopage. 

Ça fait beaucoup

Même en tenant compte des contrôles complémentaires ciblés, avant et après les compétitions, le taux de cas positifs tous tests confondus tourne autour de 0,85 % ; 0,7 % pour le cyclisme, et 0,2 % pour le foot. Le calcul est simple : avec le nouveau logiciel, il y a donc 70 fois plus de cyclistes et 100 fois plus de footballeurs qui présentent des anomalies.

“Mais une anomalie ne veut pas dire dopage, prévient Reid Aikin, chargé du passeport à l’AMA. Le programme génère des centaines d’anomalies par an, au moins une tous les 100 échantillons.” “Un prélèvement sanguin reflète un moment circonscrit dans une saison d’un sportif et l’algorithme peut fréquemment détecter une anormalité sans que ça n’aboutisse à une sanction, car il y a d’autres facteurs qui peuvent influencer ou expliquer le résultat”, ajoute Yorck Olaf Schumacher, expert du passeport. Geoffroy Berthelot lui aussi le souligne : “Il est difficile de comparer nos résultats à ceux de l’antidopage car nous ne disposons pas de tests directs pour confirmer s’ils traduisent un dopage, ni des suivis médicaux des athlètes. Et nos prélèvements sont réalisés dans des circonstances différentes.” D’accord, mais comment justifier l’ampleur de l’écart ? “Ça fait beaucoup d’anomalies et ça doit questionner”, reconnaît le chercheur.

On ne cherchait pas un modèle parfait, ni à trouver tous les dopés

Pierre-Édouard Sottas, “père” du passeport biologique, ancien manager en charge de sa mise en place à l’AMA

Quelle est l’ampleur réelle du dopage dans le football ? Dans la natation ? En athlétisme ? Quelques sondages dressent un tableau très différent de celui du passeport biologique. En interrogeant 1 398 sportifs en 2024 avec des questionnaires anonymisés, l’agence antidopage américaine l’a par exemple estimée entre 6,5 et 9,2 %. Et ces chiffres sont sans doute largement sous-évalués, car fondés sur le volontariat – tous les sportifs concernés par un programme antidopage en amont des JO de Paris ont eu accès au questionnaire, mais seuls ceux qui ont donné leurs réponses et leur consentement ont été pris en compte. 

Dans le détail des codes

Du côté des instances, on se déclare pourtant satisfait du passeport biologique. “Ce modèle fonctionne, il est fiable et il a fait ses preuves. Il a été testé et évalué, ainsi que le processus d’évaluation dans son entièreté, par des experts scientifiques et judiciaires indépendants”, appuie Reid Aikin. Et que penser de l’algorithme alternatif de Geoffroy Berthelot ? ‘Plusieurs groupes de travail ainsi que les membres des laboratoires accrédités par l’AMA font de la veille, si quelque chose d’intéressant fait surface, nous en prenons connaissance et étudions la possibilité de l’intégrer dans le modèle actuel. Cet article a très certainement fait l’objet d’un examen interne mais qui n’a pas abouti”, balaie Reid Aikin, à propos de l’article de 2019. Plusieurs membres des groupes de travail dédiés à l’amélioration du passeport se souviennent vaguement de ces discussions. “Cet article nous est parvenu, je ne me souviens pas exactement de ce que nous en avons dit mais ce qui était proposé n’était certainement pas suffisant pour creuser davantage”, nous répond Yorck Olaf Schumacher. 

Une tendance à bugger

Cela vaut tout de même le coup d’entrer dans le détail des codes. Dès 2019, les résultats préliminaires de Geoffroy Berthelot et son équipe pointaient des failles statistiques du passeport biologique. L’algorithme de l’AMA est développé à partir d’un modèle bayésien adaptatif, ce qui veut dire que l’analyse des données se fonde sur des hypothèses a priori. En clair, le modèle juge d’abord si une nouvelle valeur est normale ou anormale selon les variations connues d’une population de référence choisie en fonction du sexe, de l’âge. Et ce n’est qu’au fur et à mesure des prélèvements que la connaissance de la physiologie de l’athlète s’affine et que les probabilités se calibrent sur les variations individuelles du sportif. “Dès le départ, l’approche bayésienne introduit un biais lié à l’utilisation des normes de cette population de référence. D’une certaine manière, on perd l’objectif d’individualiser les résultats”, souligne Geoffroy Berthelot. Son algorithme, lui, s’affranchit des connaissances a priori. “On détermine pour chaque sportif une plage de normalité qui correspond à ses variations physiologiques et on le compare avec lui-même et non avec une population lambda”, explique-t-il. 

Il est essentiel de remettre en question les approches existantes, même si on les juge suffisantes

Mario Thevis, du laboratoire allemand de l’antidopage, membre d’un groupe de travail sur la ­détection des stéroïdes à l’AMA

Autre biais, selon l’équipe de Paris : l’algorithme du passeport a tendance à bugger quand il teste plusieurs valeurs à plusieurs reprises – plus il y a de tests, plus il y a de risque que l’une des valeurs testées paraisse anormale par hasard. Et il dérive avec le temps : le dernier prélèvement a plus de poids dans le calcul que le premier. Cela participe probablement à cette forme de flou que rapportent les experts chargés d’analyser des passeports d’athlètes qui regroupent des dizaines de prélèvements sur plusieurs années. “Multiplier les analyses crée des bruits parasites qui peuvent être complexes à interpréter quand on regarde des passeports qui ont plus de dix ans ou ceux qui accumulent vingt prélèvements en une saison, comme c’est le cas dans le cyclisme. Il devient alors de plus en plus compliqué de prendre une décision éclairée”, témoigne par exemple Neil Robinson, à la tête du département sciences et médecine de l’ITA, l’International Testing Agency.

L’analyse des paramètres

Plusieurs autres équipes de recherche en statistique pointent elles aussi les limites du modèle antidopage. En 2023, un algorithme mis au point par Miguel de Figueiredo, à l’université de Genève, trouve les dopés dans 83 % des cas, contre 64 % pour le passeport biologique. Idem pour le modèle des statisticiennes Tereza Neocleous et Dimitra Eleftheriou, de l’université de Glasgow, publié en 2025 en collaboration avec le laboratoire antidopage allemand, qui parvient à identifier 44 % des dopés, contre 32 % pour le passeport biologique. “Nous sommes parties du même modèle statistique que l’AMA, mais au lieu d’analyser chaque paramètre indépendamment, on en a suivi plusieurs en parallèle. Cela permet une analyse plus fine des variations et augmente la sensibilité du modèle tout en conservant une spécificité robuste”, pointe Dimitra Eleftheriou.

L’arme ultime ?

Si l’AMA a refusé de financer ces dernières recherches, elle a versé des fonds pour développer un autre algorithme, à l’université de Rome. L’étude, publiée en 2024, démontre là encore de meilleures performances que celles du passeport biologique : seuls 16 % des sportifs dopés échappent au contrôle, contre 40 %. “En confrontant directement notre algorithme au profil d’une athlète dopée, nous sommes capables d’identifier une anomalie supplémentaire au niveau des valeurs d’hémoglobine et d’un paramètre qui reflète le dopage sanguin. Cette anomalie-là était totalement indétectable par le passeport”, détaille Nina Deliu, qui a mené l’étude. “On voit qu’en analysant les valeurs dans plusieurs dimensions, on parvient à mieux détecter les cas de dopage, de manière plus fiable et plus rapide”, appuie Dimitra Eleftheriou. 

En plongeant dans les lignes directrices de l’AMA, qui encadrent le processus d’évaluation des anomalies du passeport, on découvre aussi que le seuil de confiance de l’algorithme du passeport biologique a été fixé à 99,9 %. Toutes les anomalies qui se situent en deçà de ce seuil sont mises de côté. Ce qui bride naturellement les performances du modèle. “C’est nécessaire pour protéger les athlètes non dopés. Le modèle est donc avant tout calibré selon sa capacité à éliminer les vrais négatifs”, justifie Reid Aikin. Certes, mais une étude menée sur des cyclistes qui avaient pratiqué des autotransfusions pointait en 2011 qu’en abaissant ce seuil à 99 %, le passeport pourrait attraper 73 % des dopés au lieu 45 %, sans pour autant pointer plus de faux positifs.

L’analyse statistique est importante, elle peut faire la différence

Tereza Neocleous, statisticienne à l’université de Glasgow, qui a travaillé sur un algorithme avec le laboratoire antidopage allemand

L’instance fait-elle vraiment assez d’efforts pour améliorer ce qui a été présenté comme l’arme ultime contre le dopage ? Interrogée, l’AMA met en avant le développement d’outils d’analyse fondés sur l’IA. Et surtout de nouveaux paramètres biologiques à ajouter au passeport. Des biomarqueurs des stéroïdes ont été inclus en 2014 et 2023 ; puis deux marqueurs endocriniens en 2023, pour détecter la prise d’hormone de croissance. “C’est l’enjeu aujourd’hui, c’est par ce biais-là qu’on augmentera les performances, juge Reid Aikin. Nous cherchons continuellement à ajouter de nouveaux paramètres pour apporter et un nouveau niveau de lecture qui pourrait permettre de distinguer le dopage d’un facteur confondant.” 

Au coude-à-coude

Sauf que les biomarqueurs précédents peinent déjà à se faire adopter par les fédérations sportives. “L’analyse des marqueurs endocriniens ne se fait pas en routine, les kits de dosage coûtent très cher donc les fédérations ne l’incorporent pas”, rapporte Raphaël Faiss, chercheur en physiologie du sport à l’université de Lausanne. “De nouveaux biomarqueurs pourraient permettre plus de précision, mais si la méthode d’analyse derrière n’est pas rigoureuse, si ce n’est pas fiable, ça ne va pas fonctionner”, estime Geoffroy Berthelot.

Même le “père” du passeport biologique, Pierre-Édouard Sottas, ancien manager en charge de sa mise en place à l’AMA, convient des limites de l’algorithme : “La sensibilité est loin d’être parfaite. Le plus important, c’est d’assurer aux sportifs et à la justice qu’on ne sanctionne pas d’athlètes propres, tout en ayant une dimension dissuasive. On ne cherchait pas un modèle parfait, ni à trouver tous les dopés.” 

À la fin des années 2000, deux équipes scientifiques se sont affrontées pour développer le passeport : d’un côté, Pierre-Édouard Sottas et Neil Robinson avec leur modèle bayésien, qui va s’imposer, et de l’autre, des chercheurs australiens menés par Ken Sharpe, Michael Aschenden et Yorck Olaf Schumacher, qui ­proposaient un modèle proche de celui de l’équipe de chercheurs de l’Insep et de l’université Paris-cité. « Nous étions au coude-à-coude, les Australiens avaient plus d’argent avant les Jeux de Sydney, mais nous avions le soutien de la Fédération de cyclisme, l’accès aux athlètes, aux données, je pense que ça a aidé, raconte Neil Robinson. Nous avons sûrement bénéficié d’une certaine proximité avec les instances antidopage, mais dans mon souvenir, les deux modèles avaient des performances similaires. » Le choix technologique de l’AMA a depuis été gravé dans le marbre. En quinze ans, aucune modification de l’algorithme n’a été décidée. Et ses fondements statistiques n’ont jamais été réinterrogés.

Défendre une recherche statistique, c’est plus difficile, ça paraît tout de suite obscur et complexe

Jean-Christophe Thalabard, médecin et de biostatisticien à l’AFLD, le laboratoire antidopage français

Le blocage est ici sans doute en partie culturel : tous les experts interrogés reconnaissent que les discussions ne tournent que très rarement autour de l’algorithmique. “Dans le milieu de l’antidopage, il y a beaucoup de médecins, de biologistes, de pharmaciens et les biomarqueurs, c’est leur domaine. Défendre une recherche statistique, c’est beaucoup plus difficile, ça paraît immédiatement obscur et complexe”, confie Jean-Christophe Thalabard, qui cumule les deux casquettes de médecin et de biostatisticien à l’AFLD, le laboratoire français de l’antidopage. “L’analyse statistique est tout aussi importante, on peut aussi faire la différence grâce à ça”, appuie Tereza Neocleous.

Blocage culturel

L’AMA ne semble pourtant pas convaincue et circonscrit les faibles performances du passeport à un souci “de timing des tests – il faut être au bon endroit au bon moment –, plus que de méthode et d’algorithme” et relègue les arguments des statisticiens au titre de “lecture divertissante”. Le nouvel algorithme échappe pourtant à tous les biais statistiques qui entachent celui du passe­port biologique – “Nous n’avons pas de problèmes de multitests ni de robustesse dans le temps”. Mais il n’a jamais pu se confronter à lui sur un même jeu de données. “C’est très difficile d’avoir accès aux données des sportifs sans partenariat avec l’AMA, ou avec une autre équipe qui possède les droits des données”, confie Dimitra Eleftheriou. Et donc très difficile pour des équipes indépendantes de proposer des alternatives ou des évolutions du modèle. “C’est dommage, regrette Tereza Neocleous. Nous avons besoin de comparaisons empiriques entre différentes méthodes, sur plusieurs ensembles de données.” 

“Il est essentiel de remettre en question les approches existantes, même si on les juge suffisantes”, convient Mario Thevis, du laboratoire allemand de l’antidopage et d’un groupe de travail sur la détection des stéroïdes à l’AMA. Qui évoque le problème du financement : “Tout effort visant à compléter ou à remplacer l’approche actuelle doit être justifié par une supériorité significative, et il est compréhensible que des évaluations coûts-avantages doivent être menées avec soin.” En 2023, le budget de recherche de l’AMA était de 2,15 millions de dollars, dont environ 15 % consacrés à l’amélioration du passeport. À comparer avec un budget global de 45 millions de dollars, financé à 50 % par le Mouvement olympique. Et avec un marché global du sport estimé autour de 500 milliards de dollars.

L’AMA se dit “ouverte à de nouvelles propositions de recherche, ou à étudier des données préexistantes permettant une meilleure détection du dopage”. Sauf que la jurisprudence n’incite pas au changement. “Nous l’avons défendu pendant des années, aujourd’hui le modèle bayésien est incontestable devant la justice. Le moindre changement sera remis en question devant les juges, et doit donc constituer une véritable avancée, être solide scientifiquement.” En attendant, la statistique reste un sport confidentiel. And the show must go on.

Un article à retrouver dans Epsiloon n°56
Découvrir le numéro
Acheter ce numéro
Abonnez-vous et ne manquez aucun numéro
Chaque mois,dans votre boîte aux lettres
Toutes les archives,accessibles en ligne
La version numérique,avec l'appli Epsiloon
Un espace abonné,pour gérer mon compte