Aussi diversifiée que possible telle qu’elle est la vie sur Terre – qu’il s’agisse d’un jaguar chassant un cerf en Amazonie, d’une orchidée grimpant en spirale autour d’un arbre au Congo, de cellules primitives poussant dans des sources chaudes bouillantes au Canada ou d’un agent de change sirotant un café à Wall Street – au niveau génétique, tout joue selon les mêmes règles. Quatre lettres chimiques, ou bases nucléotidiques, forment 64 “mots” de trois lettres appelés codons, dont chacun représente l’un des 20 acides aminés. Lorsque les acides aminés sont enchaînés conformément à ces instructions codées, ils forment les protéines caractéristiques de chaque espèce. À quelques rares exceptions près, tous les génomes codent les informations de manière identique.
Pourtant, dans une nouvelle étude publiée le mois dernier dans eLife, un groupe de chercheurs du Massachusetts Institute of Technology et de l’Université de Yale a montré qu’il est possible de modifier l’une de ces règles séculaires et de créer un code génétique plus vaste et entièrement nouveau, construit autour de mots à codons plus longs. En principe, leur découverte indique l’une des nombreuses façons d’étendre le code génétique dans un système plus polyvalent que les biologistes synthétiques pourraient utiliser pour créer des cellules avec de nouvelles biochimies qui fabriquent des protéines que l’on ne trouve nulle part dans la nature. Mais les travaux ont également montré qu’un code génétique étendu est entravé par sa propre complexité, devenant moins efficace et même étonnamment moins capable à certains égards – des limitations qui suggèrent pourquoi la vie n’a peut-être pas favorisé les codons plus longs en premier lieu.
On ne sait pas ce que ces découvertes signifient pour la façon dont la vie ailleurs dans l’univers pourrait être encodée, mais cela implique que notre propre code génétique a évolué pour n’être ni trop compliqué ni trop restrictif, mais juste ce qu’il faut – et a ensuite gouverné la vie pendant des milliards d’années par la suite comme ce que Francis Crick a appelé un “accident gelé”. La nature a opté pour ce code Goldilocks, disent les auteurs, parce qu’il était simple et suffisant pour ses objectifs, et non parce que d’autres codes étaient irréalisables.
Par exemple, avec des codons à quatre lettres (quadruplets), il existe 256 possibilités uniques, et pas seulement 64, ce qui pourrait sembler avantageux pour la vie car cela ouvrirait la possibilité de coder plus de 20 acides aminés et un éventail de protéines astronomiquement plus diversifié. Des études antérieures de biologie synthétique, et même certaines de ces rares exceptions dans la nature, ont montré qu’il est parfois possible d’augmenter le code génétique avec quelques codons quadruplets, mais jusqu’à présent, personne ne s’est jamais attaqué à la création d’un système génétique entièrement quadruplé pour voir comment il se compare au codon triplet normal.
“C’était une étude qui posait cette question très sincèrement”, a déclaré Erika Alden DeBenedictis, l’auteur principal du nouvel article, qui était doctorant au MIT pendant le projet et est actuellement postdoctoral à l’Université de Washington.
S’étendre sur la nature
Pour tester un code génétique quadruplet-codon, DeBenedictis et ses collègues ont dû modifier certaines des biochimies les plus fondamentales de la vie. Lorsqu’une cellule fabrique des protéines, des extraits de son information génétique sont d’abord transcrits en molécules d’ARN messager (ARNm). Les organites appelés ribosomes lisent ensuite les codons de ces ARNm et les associent aux « anti-codons » complémentaires des molécules d’ARN de transfert (ARNt), dont chacun porte un acide aminé spécifié de manière unique dans sa queue. Les ribosomes relient les acides aminés en une chaîne en croissance qui finit par se replier en une protéine fonctionnelle. Une fois leur travail terminé et la protéine traduite, les ARNm sont dégradés pour être recyclés et les ARNt usés sont rechargés en acides aminés par les enzymes synthétases.
Les chercheurs ont modifié les ARNt de la bactérie Escherichia coli pour avoir des anti-codons quadruplés. Après avoir soumis les gènes d’E. coli à diverses mutations, ils ont testé si les cellules pouvaient traduire avec succès un code quadruplet, et si une telle traduction entraînerait des effets toxiques ou des défauts de fitness. Ils ont découvert que tous les ARNt modifiés pouvaient se lier à des codons quadruplés, ce qui a montré qu'”il n’y a rien de mal biophysiquement à faire une traduction avec cette taille de codon plus grande”, a déclaré DeBenedictis.
Mais ils ont également découvert que les synthétases ne reconnaissaient que neuf des 20 anticodons quadruplés, de sorte qu’ils ne pouvaient pas recharger le reste avec de nouveaux acides aminés. Avoir neuf acides aminés qui peuvent être traduits avec un codon quadruplet dans une certaine mesure, c’est “à la fois beaucoup et un peu”, a déclaré DeBenedictis. “C’est beaucoup d’acides aminés pour quelque chose dont la nature n’a jamais besoin pour fonctionner.” Mais c’est un peu parce que l’incapacité à traduire 11 acides aminés essentiels limite strictement le vocabulaire chimique avec lequel la vie doit jouer.