LUCA, premier portrait de l’ancêtre universel
C’est une grande étude qui fera date. Elle révèle que notre aïeul à tous, humains, microbes, artichauts, était beaucoup plus vieux et beaucoup plus complexe que ce qu’on pensait. De quoi réécrire l’histoire de la vie.
Toute bonne histoire se doit de commencer par une bonne accroche. Et quelle meilleure histoire que la nôtre ? À nous, les quelques trilliards d’entités estampillées vivantes, grandes ou microscopiques, qui nous partageons cette petite planète bleue tournoyant dans son modeste Système solaire, dans sa galaxie perdue au sein d’un Univers à l’insondable démesure ? Avec, au programme, ses crises, ses rebondissements existentiels et notre espèce en protagoniste majeur des temps modernes : voilà bien le plus grand chef-d’œuvre dramaturgique possible. Or, la fameuse accroche nous fait défaut… Personne n’a été capable de percer les secrets de ces prémices, le début de la grande aventure de la vie – que personne, d’ailleurs, ne sait vraiment non plus définir.
Déjà très émouvant
Cause perdue ? Non, car un témoin incontournable de l’affaire sort de l’ombre : LUCA (pour Last Universal Common Ancestor), le dernier ancêtre commun aux mammouths, aux microbes, aux artichauts et à tout ce qui s’agite en ce bas monde. Cet être fantasmatique semblait devoir rester à jamais inaccessible et vaporeux – pas de quoi nourrir une bonne accroche. Mais les scientifiques ont de la ressource. “Ces dernières années, j’ai vu l’intérêt grandir avec les résultats qui se multiplient dans le domaine, s’enthousiasme Savio Torres de Farias, de l’université fédérale de Paraiba, au Brésil. Notre compréhension des origines de la vie se développe : je suis sûr que grâce à l’émergence de nouvelles technologies et l’accès à toujours plus de génomes, on aura bientôt de nouvelles données et des travaux inédits sur LUCA !”
LUCA est souvent représenté comme une sorte d’organisme solitaire, vivant dans un monde sans vie… On en est loin !
Davide Pisani, phylogénéticien à l’université de Bristol
Le portrait de notre ancêtre qui a été publié cet été par une équipe de l’université de Bristol est déjà très émouvant, avec son lot de surprises sur son âge, son ADN et son environnement présomptifs. “LUCA est souvent représenté comme une sorte d’organisme solitaire, vivant dans un monde sans vie… On en est loin !, souligne Davide Pisani, phylogénéticien à l’université de Bristol. L’aspect le plus étonnant de notre étude n’est pas tant l’identification d’un gène précis que la combinaison de la présence et de l’absence d’association de gènes qui évoque un écosystème assez riche, très tôt dans l’histoire de la vie.”
Fantômes théoriques
Savio Torres de Farias admire la prouesse : “Une des annonces les plus intéressantes concerne la complexité proposée du génome. Deux choses m’ont particulièrement frappé : la datation, qui fait remonter cette complexité à très loin, 4,2 milliards d’années ; et la présence d’un système de défense contre les virus avec des éléments du système Crispr, ce qui suggère que ces groupes étaient contemporains.” “Ça a été ma principale surprise”, avoue aussi Edmund Moody, spécialiste en phylogénomique à l’université de Bristol et principal auteur de l’étude.
Depuis, ces résultats sont scrutés, discutés, critiqués, comparés ou plébiscités par la communauté scientifique, preuve de la délicatesse et des enjeux de l’exercice. Essayer de retrouver LUCA est en effet plus compliqué que de remonter sa propre généalogie sur quelques générations – il s’agirait ici plutôt de mille milliards de générations, si tant est qu’une telle estimation à travers les éons et les espèces ait un sens. Il s’agit surtout de plonger dans les méandres les plus brumeux de l’évolution, et du concept d’évolution lui-même.
Un jalon
Car avant d’essayer d’imaginer à quoi LUCA pouvait ressembler, il faut déjà avoir prouvé que la vie n’apparaît pas toute seule à tout bout de champ (la génération spontanée ne fut réfutée qu’en 1864 par Louis Pasteur), et que ses membres font partie d’une même lignée (un morceau de bravoure théorique qui relie l’évolution darwinienne publiée en 1859 à l’universalité de l’ADN et du code génétique découverte un siècle plus tard). Dans les années 1970, tout commence à s’assembler. Le microbiologiste Carl Woese imagine une population d’organismes primitifs grouillant à la base de l’arbre du vivant en construction, qui ne maîtrisent ni leur composition ni leur morphologie, et ne sont encore guère plus que des fantômes théoriques, flous, primitifs et incomplets. Des LUCA avant l’heure, que personne ne peut encore définir.
C’est un excellent travail, un véritable tour de force
Eugene Koonin, biologiste, Centre national pour l’information biotechnologique
“À l’entrée dans l’ère de la génomique, la biologie passe à un niveau supérieur, retrace Luis José Delaye Arredondo, du Centre de recherche et d’études avancées de l’Institut national polytechnique, au Mexique. Comparer l’ADN des organismes devient peu à peu possible, et on va commencer à tenter de déduire la nature de cet ancêtre… Un article publié en 1996 par Eugene Koonin estimant le contenu génétique minimal d’une cellule à 256 gènes sera un jalon clé. Et, au même moment, le terme de LUCA est posé.” Les vraies questions peuvent émerger : LUCA ressemblait-il à cette cellule minimale ? De quoi était-il capable ? Quel âge a-t-il ? Était-il seul ? Où vivait-il ? Et de quoi ?
Marché noir génétique
Le problème, c’est qu’au même moment, les biologistes prennent conscience de l’ampleur d’un phénomène appelé “transfert de gènes horizontal” : chez les micro-organismes, on s’échange du matériel génétique directement entre voisins, et pas seulement d’une génération à l’autre (transfert vertical) selon les lois de l’hérédité, les seules qui permettent d’établir un arbre généalogique. Avec un tel marché noir génétique, comment savoir de qui vient un bout d’ADN ? Ces “bruits génétiques parasites”peuvent non seulement empêcher de remonter à LUCA via l’analyse de génomes modernes, mais aussi rendre caduque cette notion d’ancêtre commun qui commençait à s’installer.
Le concept lucasien aurait pu s’effondrer ; il en est au contraire sorti renforcé et riche de nouvelles techniques. “Mon groupe était pionnier de l’analyse de ce problème, se rappelle William Martin, de l’université de Düsseldorf, en Allemagne. En 2016, nous avons brisé un plafond de verre en identifiant 355 gènes qui remontaient à LUCA, contre à peine quelques dizaines précédemment.”
Une ruse toute simple
“Cet article a fait beaucoup de bruit, et tous n’étaient pas d’accord avec ses conclusions, se rappelle Luis José Delaye Arredondo. Aujourd’hui l’équipe d’Edmund Moody estime que notre ancêtre commun pourrait être encore plus complexe ! Nous avons besoin de ce type de travaux pour approcher la véritable nature de LUCA.”
Dans les deux études, les chercheurs ont traqué chez une sélection de bactéries et d’archées des gènes dotés d’un lignage traçable sur des milliards d’années et épargné par ces fameux transferts latéraux – nous autres, avec nos grosses cellules à noyau plus récentes, sommes exclus du panel. “Nous avons utilisé les arbres évolutifs de milliers de gènes que nous avons cherché à faire correspondre avec l’arbre généalogique darwinien des espèces… ce qui ne peut se faire qu’avec des modèles informatiques complexes du fait des nombreux transferts de gènes horizontaux !”, précise Edmund Moody.
L’idée est de voir si ces deux types d’arbres racontent la même histoire. Si un gène migre d’une espèce à une autre, son arbre n’aura pas les mêmes ramifications que celui de l’organisme dont il est issu – sa ramure empruntera plutôt ses motifs à celles des diverses espèces par lesquelles il sera passé. Une ruse toute simple qui permet la réalisation d’un arbre fiable, qui plus est calé avec les dates fournies par les fossiles disponibles.
“Moitié vivant”
William Martin, en 2016, a traqué des familles spécifiques de gènes codants présents chez au moins deux familles de bactéries et d’archées (correspondant à plus de 286 000 protéines, chez 1 847 bactéries et 134 archées). Edmund Moody, cette année, s’est appuyé sur un plus grand nombre de génomes entiers (issus de 350 bactéries et 350 archées), profitant de l’avancée des techniques de séquençage et de modélisation.
Le chercheur a en plus manœuvré pour contourner les ratés de l’horloge moléculaire. Pour mémoire, tout ADN accumule de façon raisonnablement constante des mutations au fil du temps, que l’horloge utilise pour mesurer la divergence entre deux individus, espèces ou autres et, partant, estimer l’âge de leur ancêtre commun. Un principe d’une élégante simplicité, malheureusement invalide au niveau des racines de l’arbre qu’elle contribue à dessiner du fait de l’entassement local des approximations de calcul.
Vertigineuse datation
“Nous avons utilisé des gènes qui existent en deux copies dans un génome, et dont la duplication date d’avant la naissance de LUCA. Laracine des arbres de ces gènes correspond ainsi à leur duplication et non à LUCA lui-même, qui apparaît plus loin dans l’arbre et sur autant de branches qu’il y a de copies, explique Davide Pisani. Cette méthode présente deux avantages : nous éliminons LUCA de la racine, ce qui réduit les erreurs d’estimation de l’âge ; et nous avons plusieurs nœuds ‘LUCA’ que nous pouvons comparer. Un résultat où les âges obtenus sont différents sera rejeté parce qu’incorrect.” D’où la confiance qu’ils affichent pour leur vertigineuse datation, à 4,2 milliards d’années.
Nous voulons tous la même chose : savoir comment tout a commencé
William Martin, biologiste de l’évolution, université de Düsseldorf
“Il s’agit d’un excellent travail, un véritable tour de force, appuie Eugene Koonin, du Centre national pour l’information biotechnologique, aux États-Unis, qui travaille notamment sur les virus qui auraient pu infecter LUCA. Si les résultats sur la complexité de LUCA ne sont pas totalement inédits, ils sont rendus convaincants par la méthode de reconstruction des génomes ancestraux. Et leurs hypothèses sur l’écologie de la communauté microbienne primitive sont plausibles.”
D’autres scientifiques interprètent différemment les choses. “Le nouvel article n’identifie ‘réellement’ que 399 gènes de LUCA. Le chiffre de 2 600 et quelques annoncé résulte d’une extrapolation qui ne permet pas de déterminer leurs fonctions, souligne William Martin. Sachant qu’une cellule a besoin de 1 500 gènes pour être vivante et libre, LUCA pourrait n’être qu’à “moitié vivant” et avoir besoin de son environnement, en l’occurrence les cheminées hydrothermales, pour obtenir de quoi constituer ses membranes, générer son énergie, etc.”
Tout un écosystème primitif
L’équipe d’Edmund Moody envisage pour sa part que ces carences dans le métabolisme de LUCA soient plutôt comblées par des interactions avec d’autres entités biologiques, possiblement beaucoup plus simples et archaïques…
Alors, à quel point faut-il pousser le curseur de la complexité de LUCA ? Est-ce un “demi-vivant” ou le chantre précoce de la modernité biologique ? La question, fondamentale, reste ouverte : “Si l’on suppose que LUCA était déjà une cellule libre, on passe à côté de toutes les fascinantes réactions chimiques qui ont été nécessaires pour l’obtenir à partir de roches et d’eau sur la Terre primitive”, pointe William Martin.
La réponse s’éclaircira peut-être avec les avancées techniques, comme l’expérimentation en laboratoire. Sûrement aussi avec le tracé des arbres retraçant l’évolution de génomes entiers qui, contrairement à ceux établis avec les gènes ou les espèces, ne sont pas brouillés par les transferts horizontaux. “Nous les utilisons pour essayer d’établir un ‘réseau du vivant’, plus à même de reconstruire l’histoire du monde microbien”, indique Christos Ouzounis, co-inventeur de l’acronyme LUCA et bio-informaticien à l’université Aristote de Thessalonique.
Au-delà de LUCA
Et on ne parle là que d’information génétique. Dans le vivant, celle-ci ne va pas sans matière protéique : savoir qui des gènes ou des protéines est apparu en premier est d’ailleurs une autre version du dilemme de l’œuf ou la poule, chacun ayant besoin de l’autre pour être assemblé. Encore peu développée, l’analyse des protéines promet pourtant d’être aussi parlante que celle de l’ADN. Ce peut être via des arbres phylogénétiques, mais pas seulement. L’explosion des capacités de modélisation permet de tester d’hypothétiques configurations moléculaires 3D ancestrales, leurs interactions entre elles ou avec différents milieux possibles de la Terre primitive. De quoi scruter LUCA de toutes parts.
Cela veut dire que certains de nos gènes sont plus vieux que n’importe quel continent, océan ou quoi que ce soit d’autre sur la planète
Christos Ouzounis, bio-informaticien, université Aristote de Thessalonique
Et il est un autre champ d’exploration qui s’ouvre : celui qui va… au-delà de LUCA. “Notre étude indique qu’il y a une ‘préhistoire’ à LUCA, qui était juste un membre d’un écosystème complexe – peut-être le plus chanceux, en tout cas celui dont la descendance ne s’est pas éteinte”, note Davide Pisani. “Il existe en effet une énorme différence entre l’origine de la vie et LUCA, sourit Eugene Koonin. LUCA est un stade d’évolution très avancé, très éloigné de l’origine de la vie…” Avoir enfin son portrait pourrait offrir un marchepied vers plus vieux encore : “Vers les événements qui ont préparé les systèmes biologiques qui allaient eux-mêmes conduire à la formation des premiers organismes… tous les processus nécessaires à l’émergence de la vie telle qu’on la voit désormais”, espère Savio Torres de Farias. Vers les “premiers ancêtres”, donc, ceux qui sont à la frontière de la vie, là où la matière, peu à peu, s’est animée.
Les premiers gènes
Sans doute l’acteur majeur de ce prologue à l’accroche est-il d’ailleurs déjà identifié : il pourrait s’agir des fascinants ribosomes. Nichés en chaque cellule, procaryote (sans noyau) comme eucaryote (avec noyau), ce sont eux qui assurent la traduction entre le langage des gènes et celui des protéines par le biais du code génétique – unissant par sa seule présence l’information et la matière. Cet assemblage complexe est le cœur de toute machine biologique, et certaines des séquences génétiques les plus anciennes identifiées lui appartiennent…
À tous les niveaux, les indices de cette vie antédiluvienne sont désormais légion. Il faut “juste” être capables de les découvrir à travers les branches entremêlées des arbres phylogénétiques de la forêt du vivant… Disséminés entre les lettres du texte génétique d’une bactérie, d’une archée, ou dans notre propre génome, se cachent des fragments plus vieux que LUCA, potentiellement issus de ces lignées parallèles disparues avec qui il a partagé la planète dans sa jeunesse.
La clé
“Un pourcentage non négligeable de notre génome remonte à des milliards d’années. C’est plus vieux que n’importe quel continent, océan, montagnes ou quoi que ce soit d’autre, rappelle Christos Ouzounis. Certains de nos gènes sont les plus anciennes structures qui existent sur la planète à notre connaissance !”
Que pourrait bien nous dire une base de données regroupant les premiers gènes apparus sur Terre ? Il y a une dizaine d’années, une “LUCApedia” avait été mise en place, et devrait être réactualisée sous peu. La communauté scientifique plaide également pour la création d’un équivalent pour ses protéines, un protéome – son “virome” est, lui, patiemment complété par Eugene Koonin.
“Nous voulons tous la même chose : savoir comment tout a commencé, résume William Martin. Nous savons déjà beaucoup, mais retrouver l’histoire complète va demander un peu de biologie, de chimie organique, de chimie physique, de géochimie, de compréhension des principes de l’évolution et du bon sens ! La véritable clé, c’est l’origine du code génétique et je pense que sur ce point, nous sommes plus proches du dénouement que beaucoup ne le pensent… »
Peut-être possédons-nous finalement déjà assez d’indices pour l’écrire, cette fameuse accroche.