Les origines
C'est au cours de la deuxième moitié du dix neuvième siècle que l’ADN fut identifié pour la première fois. F. Miescher, un biochimiste suisse élève du célèbre professeur Hoppé-Sayler, isola en 1869 à partir des noyaux des cellules du pus une substance jusque là inconnue qu'il nomma d’abord nucléine.
Il montra qu’elle contient du phosphore, contrairement à la plupart des molécules biologiques connues à cette époque. La caractérisation dans la composition chimique de la nucléine d’un sucre, le désoxyribose, et la reconnaissance de son caractère acide conduisirent à l’appeler ensuite acide désoxyribonucléique (ADN) mais son rôle biologique et sa structure restèrent encore longtemps inconnus et il fallu plus d’un siècle de recherches pour les établir.
En 1912, un physicien allemand, Max von Laue (1879-1960) avait découvert que les cristaux diffractent les rayons X et donnent alors sur une pellicule photographique une image formée d’un ensemble de taches symétriques car les rayons X ont des longueurs d'onde du même ordre de grandeur que les distances entre atomes. Cette découverte donna naissance à une nouvelle discipline, la radiocristallographie, qui permet par l’analyse de la distribution des taches de diffraction, de préciser la position des atomes dans le cristal. Deux physiciens anglais, le père et le fils Bragg, purent ainsi établir en 1914 la structure d'un cristal simple, celui de chlorure de sodium et reçurent le prix Nobel de physique en 1915. Le fils, sir Lawrence, créa ensuite à Cambridge un laboratoire spécialement destiné à l’étude des molécules biologiques. Le physicien britannique W. Astbury (1898-1961) fut le premier à étudier l’ADN par radiocristallographie X dans les années 1930 et à établir que sa structure présente la forme d’un long filament. Il inventa aussi le terme de biologie moléculaire et montra que l’ADN comporte une succession de bases empilées régulièrement dont il détermina sans se tromper l’espacement égal à 0,34 nm.
Vers la compréhension du rôle de l’ADN
En 1932, un microbiologiste anglais, Fred Griffith, qui recherchait un vaccin contre la pneumonie, démontra que des pneumocoques tués par la chaleur pouvaient transmettre certains de leurs caractères, notamment leur virulence, à des souches de pneumocoques vivants non virulents. Cette découverte était tellement incroyable à l’époque que Griffith attendit quatre ans avant de publier ses résultats. Seul le transfert d'une substance chimique entre des bactéries mortes et des bactéries vivantes pouvait expliquer cette transformation. Ce fut Oswald Avery qui, en 1944, réussit à démontrer que la substance responsable de cette transformation est l'ADN. Tous les biologistes étaient alors convaincus que la transmission des caractères héréditaires d'une génération à l'autre dépend des protéines. Aussi, les résultats d'Avery représentaient-ils une véritable révolution conceptuelle et ils suscitèrent une vague de travaux sans équivalent dans l'histoire de la biologie.
L’ADN, une molécule informative
À la fin de la seconde guerre mondiale, on connaissait les lois formelles de la transmission des caractères héréditaires établies par G. Mendel (1822-1884) dès le dix-neuvième siècle. On savait également, depuis les travaux sur la drosophile de T. H. Morgan (1866-1945), prix Nobel 1933, que des particules matérielles, les gènes, situés à un emplacement déterminé des chromosomes, portent l’information génétique contenue dans les cellules. R. Feulgen et H. Rossenbeck avaient montré en 1924 que les chromosomes contiennent de l’ADN et dans son livre What is Life publié en 1944, le physicien E. Schrödinger pouvait écrire : « la fibre chromosomique contient, chiffré dans une sorte de code miniature, tout le devenir d’un organisme, de son développement, de son fonctionnement ». Il était ainsi le premier à poser le problème central de la biologie en termes d’information codée. Toutefois, on ignorait encore à l’époque les mécanismes moléculaires fondamentaux permettant d’expliquer à la fois la diversité incroyable du vivant (des dizaines de millions d’espèces différentes de bactéries, de végétaux et d’animaux ont existé depuis l’apparition de la vie il y a 3,5 milliards d’années) et sa stupéfiante unité (biochimie largement commune, structure cellulaire universelle, structures anatomiques et mécanismes physiologiques en nombre restreint).
Quand physiciens et biologistes collaborent
C’est à la même époque que se mirent en place les premières collaborations entre physiciens et biologistes. Le physicien allemand Max Delbrück (1906-1981), notamment, s’associa ainsi avec les biologistes Timoféeff-Ressovsky et Zimmer pour étudier les mutations des gènes de la drosophile. Contraint de quitter l’Allemagne en 1937 comme tous les scientifiques d’origine juive, il monta en 1940 une équipe de recherche aux États-Unis avec le microbiologiste italien Salvador Luria (1912-1991). Appelé plus tard le « groupe du phage », c’était un groupe ouvert constitué autour d’un noyau d’une quinzaine de chercheurs. Au fil des années, quelques dizaines de chercheurs y collaborèrent dont plusieurs futurs prix Nobel. Les bactériophages constituent un modèle pratique en génétique car ce sont des virus parasites de bactéries faciles à cultiver sur des cultures bactériennes. Ils se multiplient en quelques dizaines de minutes à l’intérieur de la bactérie hôte en donnant des centaines de nouvelles particules virales infectantes et il est donc aisé d’obtenir de nombreuses générations en peu de temps. Les techniques mises au point à cette occasion permirent de décrypter certains des mécanismes les plus fondamentaux du vivant faisant du colibacille et des bactériophages des modèles de référence en biologie. Delbrück et Luria reçurent le prix Nobel en 1969 mais bien d’autres membres de leur groupe l’obtinrent avant eux.
La double hélice
En 1949, en utilisant la chromatographie sur papier, Chargaff et Davidson purent montrer que les molécules d’ADN comportent autant de thymine que d'adénine et autant de guanine que de cytosine. La radiocristallographie X fut utilisée à la même période par M. Wilkins et R. Franklin au King's College de Londres pour étudier l’ADN mais les structures proposées alors présentaient toujours quelque défaut les rendant incompatibles avec les données expérimentales. Cependant, en 1953, J. D. Watson et F. Crick réussirent à faire la synthèse des informations fournies par les différentes techniques d'analyse et réalisèrent un modèle moléculaire de l'ADN compatible avec l'ensemble des résultats publiés. Ils reçurent le prix Nobel avec M. Wilkins en 1962.
Vers le décryptage du code
En 1952, Hershey et Chase montrèrent que c’est l’ADN du phage et non son enveloppe protéique qui transmet l’information virale à l’intérieur de la bactérie où elle est dupliquée et exprimée. Les derniers sceptiques se convainquirent dès lors que l’ADN est bien le support chimique universel des gènes. En outre, la structure en double hélice proposée par J. D. Watson et F. Crick permettait de comprendre comment s’effectue la réplication du message génétique au sein des cellules et F. Crick put formuler en 1958 ce qu’il appela le « dogme central de la biologie moléculaire » : l’information génétique est transmise des acides nucléiques aux protéines et l’ADN n’est que le support moléculaire d’une information qui s’exprime à travers les protéines, notamment enzymatiques, comme l’avaient montré dès 1941 les recherches de G. Beadle (1903-1989), E. Tatum (1909-1975) et J. Lederberg (né en 1925), lauréats du Prix Nobel en 1958. Leurs travaux sur les mutants de la moisissure Neurospora crassa sont résumés par l’aphorisme célèbre : « un gène, une enzyme ». Toutefois, les résultats obtenus par H. Fraenkel-Conrat et G. S. Schramm sur le virus de la mosaïque du tabac prouvèrent que l’ARN peut lui aussi servir de dépositaire de l’information génétique. Entre 1953 et 1963, les progrès furent rapides. S. Benzer, un membre du groupe du phage, montra que le gène recouvre en fait plusieurs entités qui ne coïncident pas : l’unité de mutation et de recombinaison génétique est le nucléotide tandis que l’unité de fonction est le segment polynucléotidique qui code une protéine. Les enzymes qui assurent la biosynthèse de l’ADN et des ARN furent isolées en 1956 par les américains S. Ochoa (né en 1905) et A. Kornberg (né en 1918) qui reçurent le prix Nobel en 1959. Cette découverte ouvrait la voie à la synthèse de polynucléotides. En 1957, les ARN de transfert furent identifiés par M. B. Hoagland et la première protéine produite in vitro à partir d’un ARN dans un système acellulaire fut obtenue en 1961 par M. Nirenberg. Le groupe de F. Crick démontra à la même époque que les unités de code de l’ADN (les codons) sont formées de la succession de trois nucléotides. La même année, le code génétique commença à être déchiffré, travail qui fut terminé en moins de trois ans et valut le prix Nobel en 1968 à M. Nirenberg (né en 1927), G. Khorana (né en 1922) et R. Holley (né en 1922).
L’expression du génome
Cependant, les gènes ne sont pas des entités autonomes et leur fonctionnement intégré au sein de chaque cellule est étroitement contrôlé par d’autres gènes codant des protéines régulatrices. Ainsi s’explique l’adaptation du métabolisme des bactéries au substrat présent dans leur milieu comme l’établirent en 1961 deux anciens membres du groupe du phage, Jacques Monod (1910-1976) et François Jacob (né en 1920) qui postulèrent également l’existence d’ARN messagers intermédiaires entre l’ADN et les protéines. Ils reçurent le prix Nobel en 1965 avec André Lwoff (1920-1994). L’année suivante, confirmant avec éclat le modèle de l’opéron, W. Gilbert (né en 1932) isolait la protéine répresseur de l’opéron lactose. Ce biochimiste productif, physicien à l’origine, mit également au point dans les années 1970 une méthode de séquençage de l’ADN qui lui vaudra de partager le prix Nobel de chimie en 1980 avec P. Berg (né en 1926) et F. Sanger (né en 1918). Ce dernier l’avait d’ailleurs déjà obtenu en 1958 pour avoir inventé une méthode de séquençage des protéines avec laquelle il avait établi la séquence des acides aminés de l’insuline.
La naissance de l’ingénierie génétique
Au milieu des années 1960, le fonctionnement intime de la cellule au niveau moléculaire était donc largement décrypté et l’on avait compris que le code génétique est universel à de très rares exceptions près. Cette propriété rendait théoriquement possible l’expression d’un gène étranger par une cellule et laissait entrevoir en outre la possibilité d’intervenir directement sur le génome, notamment pour corriger les erreurs à l’origine des maladies génétiques que l’on commençait à identifier en nombre croissant. Pour cela, de nouveaux outils capables d’opérer sur des molécules et non plus seulement sur des cellules et des organes étaient nécessaires. En 1965, W. Arber (né en 1929), D. Nathans (né en 1928) et H. Smith (né en 1931) qui étudiaient le phénomène de restriction identifièrent de nouvelles enzymes dites endonucléases de restriction, ce qui leur valut le prix Nobel en 1978. Les enzymes de restriction, dont plusieurs centaines sont disponibles aujourd’hui dans le commerce spécialisé, sont produites par les bactéries lorsqu’elles sont infectées par un bactériophage. Mais, contrairement aux Dnases connues jusque là qui coupent l’ADN au hasard, les Dnases de restriction dégradent l’ADN du phage en le coupant au niveau de courtes séquences qu’elles reconnaissent spécifiquement. Cette propriété en fait des outils de choix permettant de découper l’ADN pratiquement où l’on veut non seulement pour isoler des gènes, mais aussi pour les insérer dans des phages ou des plasmides qui se révélèrent d’excellents vecteurs pour multiplier des gènes étrangers. Dès lors, la biologie moléculaire devenait opératoire. En outre, H. M. Temin (né en 1934) et D. Baltimore (né en 1938), alors qu’ils travaillaient sur le virus du sarcome de Rous (dont l’étude avait valu à F. P. Rous 1878-1970 le prix Nobel en 1966) identifièrent en 1970 la transcriptase inverse une enzyme capable de faire une copie ADN à partir d’une matrice ARN. Avec cette enzyme, il est possible de synthétiser in vitro des gènes fonctionnels à partir de leur ARN messager isolé de cellules actives. Leurs travaux sur les virus furent récompensés par le prix Nobel en 1975 avec ceux de R. Dulbecco (né en 1914) qui avait mis au point les méthodes de culture des virus animaux. En 1971, les premiers vecteurs comportant un gène étranger furent fabriqués par H. Boyer (né en 1936), P. Berg (né en 1926) et S. Cohen (né en 1922) et une véritable ingénierie génétique put alors se développer. On ne tarda pas à qualifier les nouvelles technologies de l’ADN recombinant de manipulations génétiques et, en 1974, la prestigieuse revue internationale Science publiait une lettre de P. Berg cosignée par onze biologistes parmi les plus célèbres réclamant un moratoire sur certaines manipulations génétiques. Il faut souligner qu’il s’agissait d’une démarche spontanée ayant pour origine des praticiens de la biologie moléculaire craignant les dangers potentiels de microorganismes génétiquement transformés et non du résultat de pressions exercées par d’autres secteurs de la société. En 1975, quelque 150 biologistes, dont la plupart des chercheurs impliqués dans ce type de travaux, se réunirent à Asilomar en Californie où ils levèrent le moratoire tout en décidant un ensemble de règles pour encadrer les travaux. Des règles similaires furent reprises l’année suivante par les National Institutes of Health américains pour encadrer les recherches menées sur fonds fédéraux ainsi que par les Britanniques et les Français qui instituèrent une autorité de contrôle. Désormais, débordant le cadre des laboratoires, le débat était devenu public mais les recherches se poursuivirent et, la même année, E. M. Southern mit au point une technique, le Southern blot, permettant l’identification de séquences d’ADN par hybridation de sondes radioactives avec l’ADN génomique fragmenté, trié et dénaturé.
L’ère industrielle et le séquençage des génomes
La première protéine humaine produite par génie génétique avec un gène humain de synthèse introduit dans une bactérie fut la somatostatine obtenue en 1977 par H. Boyer et S. Cohen travaillant désormais pour Genentech, première firme privée à se lancer dans l’ingénierie génétique. Ensuite, la production de protéines humaines par des colibacilles modifiés puis par des levures va devenir presque routinière et sera suivie par la transformation de cellules végétales et animales avec des gènes étrangers. En outre, à la suite des travaux de Palmiter et Brinster, on put dès le début des années 1980 obtenir des organismes pluricellulaires transgéniques, animaux ou végétaux qui possèdent un ou plusieurs gènes étrangers dans leur patrimoine génétique. En 1983, K. Mullis inventa la PCR (polymerase chain reaction), une technique d’amplification exponentielle de l’ADN permettant d’obtenir in vitro de très grandes quantités d’ADN à partir, théoriquement, d’une seule molécule d’ADN. Cette technique fut rendue très performante par l’utilisation de la Taq polymérase, une ADN polymérase stable à haute température provenant de bactéries vivant à 100 °C. En utilisant de manière complémentaire PCR, enzymes de restriction et Southern blot, il devint dès lors possible d’établir des empreintes génétiques pour identifier sans erreur les personnes à partir d’un échantillon d’ADN. Ces technologies furent introduites en médecine légale à partir de 1987 lorsque A. Jeffreys mit au point une méthode de comparaison des ADN par leur polymorphisme de longueur des fragments de restriction. On put alors envisager également de séquencer le génome humain à partir de bibliothèques d’ADN. En effet, M. Olson et D. Burke parvinrent à la fin des années 1980 à cloner des fragments d’ADN de grande taille (250 kb) en construisant des chromosomes artificiels de levure. La technique fut ensuite améliorée pour permettre de cloner des fragments ayant jusqu’à 2 millions de paires de bases. Le génome put être ainsi balisé dans ses grandes lignes ce qui accéléra considérablement au début des années 1990 l’identification des gènes de plusieurs espèces et leur séquençage. Aujourd’hui, les travaux de séquençage sont très nombreux et la séquence complète du génome de nombreuses espèces a été établie, notamment celle de divers virus, de nombreuses bactéries pathogènes ou non, de la levure (1997), du nématode Coenorhabditis elegans (1998), de la drosophile (2000). La dernière séquence complète publiée en décembre 2000 est celle de la plante modèle, Arabidopsis thaliana et l’on annonce celle du génome humain pour 2002 ou 2003, c’est à dire avec plusieurs années d’avance sur les prévisions faites au début des années 1980 lors du lancement du programme international de séquençage du génome humain. En outre, certains essais de thérapie génique ont commencé à se révéler concluants et l’on s’attend à des progrès rapides tant sur le plan fondamental que sur celui des applications médicales.