En cas d'usage de ces textes en vue de citations,
merci de bien vouloir mentionner leur source (site histcnrs), ses auteurs et leurs dates de réalisation
Entretien avec Bernard Dujon à l'Institut Pasteur
18 nov. 2019, J-FPicard (source :
https://www.histcnrs.fr/temoignages.html)
B. Dujon et P. Slonimski, colloque sur la génétique mitochondriale, Pise, 1973
Dans mon enfance, j’étais attiré par la nature, l'émerveillement de son
réveil au printemps, les plantes, les animaux.... Si j’ai pu faire de
la biologie c’est donc un mélange de choix personnels et de chance.
J'ai commencé mes études supérieures à la Faculté des sciences de
Paris. Au bout d'un an, il y avait un concours d’entrée à l’ENS pour
les étudiants de propédeutique bien classés en fin d’année. J'ai
postulé et j'ai eu la chance d’entrer à l’ENS un an après mon bac.
Normalement la filière vers l’ENS passait par deux années ou trois de
‘prépas’ que je ne voulais pas suivre car je les trouvais ennuyeuses.
Je suis donc devenu normalien (1966 -1970). A l’époque, il n’y
avait pas de cours de génétique à l’ENS et c’est à Jussieu que j’ai
découvert la discipline en suivant les cours de Piotr Slonimski,
Madeleine Gans et Philippe Vigier qui avaient monté un certificat dans
ce que l’on appelait alors « licence » (actuel M1). Je m’intéressais
aux mécanismes fondamentaux de la vie et je trouvais que la génétique
posait des questions plus fondamentales que les autres branches de la
biologie et offrait un cadre théorique plus clair pour s’y attaquer.
C’était l’année universitaire 1967-68 et les examens de printemps
avaient été reportés en septembre. J’avais postulé au DEA de génétique
(actuel M2) qui débutait donc quelques jours seulement après l’examen
du certificat de génétique. Ayant pas trop mal réussi cet examen
(j’étais classé premier et les collègues m’ont raconté plus tard que
Piotr Slonimski avait fait circuler ma copie dans son labo, je n’en
savais rien), j’ai donc été accepté au DEA de Génétique qui commençait
en septembre 1968. La date a son importance pour comprendre l’esprit
qui y régnait.
Le Centre de génétique moléculaire du CNRS
Après cette intense année universitaire, j’ai cherché un labo pour
préparer une thèse et c’est comme cela que je me suis retrouvé au
‘Centre de génétique moléculaire’ (CGM) du CNRS en septembre 1969 dans
l’équipe de recherche de Piotr Slonimski. Mais, étant en quatrième et
dernière année de l'ENS, j’étais supposé préparer l'agrégation. L’Ecole
ne rigolait pas avec ça car les élèves étaient censés devenir des
enseignants et l’agrégation offrait prestige et sécurité. Choisir de
préparer une thèse sans passer d’abord l’agrégation était considéré
comme très risqué et il fallait une autorisation spéciale. Piotr
Slonimski a du alors promettre au directeur de l'Ecole que je
soutiendrai une thèse de 3ème cycle avant ma sortie de l’ENS,
c’est-à-dire en un an. Tâche impossible et promesse vite oubliée. En
fait, j'ai soutenu directement une thèse d'Etat, mais quelques années
plus tard, en 1976. Heureusement, dès ma sortie de l’ENS, en septembre
1970, j’ai eu la chance immense d’être recruté par le CNRS comme
stagiaire de recherche, ce qui m’assurait un minimum de revenus
réguliers alors que j’étais encore doctorant.
Le CGM venait d'être terminé deux ans auparavant. Le bâtiment était
tout neuf et Piotr Slonimski cherchait à constituer une équipe de
généticiens. Dans l’air du temps, il a recruté des jeunes ‘soixante
huitards’, évidemment assez gauchos. J’ai été recruté en même temps que
Monique Bolotin. L’année précédente cela avait été Pierre Netter et
Dario Coen, et encore avant Jean Deutsch et Eric Petrochilo. Soit 6
étudiants du DEA de génétique recrutés dans la même équipe en trois
ans. L’atmosphère était à la contestation. Cette fine équipe a
d’ailleurs été qualifiée récemment de ‘pieds nickelés’ par Pierre
Netter. Jean Deutsch et Eric Petrochilo, les « anciens »,
menaient la troupe, ils passaient beaucoup de temps à distribuer des
tracts à la cantine. Cela semblait amuser un peu Slonimski, mais pas
trop quand même. Lorsque je suis arrivé au CGM, il m'a placé dans une
pièce où il y avait deux armoires métalliques empilées l'une sur
l'autre. Curieux ! "Débarassez-moi de ce merdier..." me dit-il.
En fait, la pièce avait été occupée par un autre normalien plus ancien
que moi (Philippe Clertant) encore plus gauchiste que les autres et que
Piotr venait de virer. Les armoires métalliques étaient sa façon de se
protéger des incursions du « patron » dans le labo.
Dans les années 1950, aux côtés de Boris Ephrussi au ‘Labo de génétique
physiologique’, Piotr Slonimski avait découvert que les mutants ‘petite
colonie’ de la levure (Saccharomyces cerevisiae) ne respiraient pas car
ils étaient déficients pour certains cytochromes. Plus tard, avec
Fred Sherman, il avait réussi à isoler les premiers mutants du
cytochrome c nécessaire à la chaine respiratoire. Or, chez les mutants
‘petite colonie’ il y avait toujours du cytochrome c, sauf qu'il ne
fonctionnait plus car c’étaient d’autres cytochromes qui manquaient. Et
pour augmenter le mystère, Slonimski et Sherman avaient trouvé deux
gènes différents (ISO 1 et ISO 2) codant pour un même cytochrome.
Ceci ne collait pas avec la génétique. A l'époque, on avait un gène
pour un produit (enzyme, protéine). Si ce gène mutait on avait un
mutant négatif. Avec deux gènes pour la même chose, rien ne devait se
passer. Donc comment persistaient-ils ? Dans ce cas précis, on
s’aperçut plus tard qu’il existait des régulations différentes. Mais au
sens large, ce problème des gènes dupliqués est resté incompris pendant
des années, jusqu'à ce que la génomique fournisse l'explication d'un
phénomène très général. Car les génomes ne sont jamais à l’équilibre
optimal. Il y a constamment des duplications et des pertes de gènes au
cours des générations successives. Mais au cours des années 1970 au
CGM, on s’intéressait surtout à autre chose. C’est l'époque ou la
génétique des mitochondries naissait lorsque l’on a commencé nos
croisements pour essayer de comprendre l'hérédité des gènes
mitochondriaux de la levure.
La génétique mitochondriale
J'ai eu de la chance d’arriver au laboratoire au moment où
venaient d’être isolés les premiers mutants mitochondriaux qui
conféraient des résistances aux antibiotiques (érythromycine et
chloramphenicol). A l’époque, nous ne savions rien du rôle génétique
des mitochondries. On savait qu'elles contenaient de l'ADN qui était
altéré chez les mutants ‘petite colonie’ puisque, peu de temps
auparavant, Jean-Claude Mounolou avait pu mesurer sa densité grâce à
des manips complexes (gradients de chlorure de césium). Mais nous
ignorions le rôle de cet ADN dans l'expression génétique
mitochondriale. Nous avions seulement ces premiers marqueurs de
résistance aux antibiotiques qui nous permettaient de faire des
croisements. Et qui, par le plus grand des hasards, devaient nous
amener à la découverte des introns mobiles plusieurs années plus tard
(les introns sont des segments internes des ARN éliminés par épissage
dont les séquences se retrouvent donc au niveau des gènes). L’hérédité
de nos marqueurs était affectée par cette présence insoupçonnée d'un
intron mobile. Mais on ne comprenait rien à ce phénomène. Dans les
nombreuses discussions que nous avions avec Piotr Slonimski, il
s’agissait de lui trouver un nom. Nos discussions avaient souvent lieu
à l'heure du déjeuner au moment où Piotr (qui n'était pas un lève-tôt)
arrivait au CGM alors que les ‘pieds nickelés’ commençaient à avoir
faim. Un jour, je me rappelle que Jean Deutsch a dit : «On a déjà
‘alpha’ pour le type sexuel des levures, on va appeler ‘omega’ ce
phénomène mitochondrial et on va bouffer sinon la cantine va fermer !».
C'est comme ça que l'on a baptisé un nouveau locus ‘omega’. Totalement
mystérieux et qui a occupé une partie importante de ma thèse. Car
j'avais trouvé au cours de ma première année de recherche que, si
j'isolais des mutants du locus chloramphénicol (de sensible à résistant
ou l’inverse) en partant de souches omega-, la moitié d’entre eux
étaient également mutants pour le locus omega. Comme s’il
disparaissait. Si je partais de souches omega+, cela n'arrivait
jamais. En bons généticiens, on pensait avoir deux allèles + et - ,
mais l'un mutait pour aboutir à l'absence totale d'allèle. Ce n'était
pas très lumineux comme affaire. Il s’agissait en réalité de deux
idiomorphes (deux formes alternatives au même locus, comme les allèles
mais d’origine et de nature distinctes contrairement aux allèles). Dans
un labo voisin, François Michel, un autre étudiant normalien, faisait
la cartographie de l’ADN mitochondrial en utilisant des techniques
compliquées de température de fusion de l’ADN selon sa composition en
GC (les régions de l’ADN mitochondrial de levure sont extrêmement
hétérogènes en composition). Avec mes mutants, on s’était aperçu de
l’existence d’un petit segment supplémentaire d’ADN dans les souches
omega+. Mais on avait du mal à l’expliquer car à l'époque, on était nul
en biologie moléculaire.
Pratiquement, c'est moi qui ai introduit les premiers enzymes de
restriction au CGM. Je les avais ramenés de Suisse après un stage EMBO
à Bâle en 1976. Je me rappelle avoir montré un petit tube plastique à
Piotr dans lequel on faisait les réactions en disant que : "ce serait
pratique d’utiliser ce truc au CGM ". Sa réponse était en gros, «
Ouais, bof! Bon achetez en pour vous si vous voulez, mais je n'en vois
pas bien l'intérêt". Il s’agissait des premiers microtubes Eppendorf.
En fait, le CGM n'avait pas suivi les progrès techniques de la biologie
moléculaire pure et dure tels qu’ils se développaient ailleurs.
Pourtant, ayant débuté sa carrière comme biochimiste avant de venir à
la génétique sous l'influence de Boris Ephrussi, Piotr Slonimski aurait
dû être sensible à l’émergence des techniques de la biologie
moléculaire, or cela n'a pas été le cas.
Harvard
En 1978, je suis parti à Harvard chez Walter Gilbert afin de m’initier
aux premières méthodes de séquençage de l'ADN. J’étais persuadé que,
sans une approche moléculaire de la génétique on n'arriverait jamais à
étudier cet ADN mitochondrial. Là, je me suis trouvé plongé dans
l’effervescence intellectuelle et technique des premiers travaux sur le
clonage des gènes qui allaient marquer le reste de ma carrière. Me
consacrant d’abord à mes mutants omega, je découvris la présence d’un
intron chez les souches omega+ mais cet intron était très particulier
car il contenait une phase ouverte de lecture. C’était une découverte
parfaitement inattendue. A la suite de Walter Gilbert, on définissait
les introns comme des segments internes d'ARN éliminés lors des
réactions d’épissage. On ne pensait pas qu’ils puissent coder
pour quoi que ce soit. Or, dans mon intron, il y avait une phase de
lecture codant pour une magnifique protéine, mais totalement inconnue
et de composition bizarre en acides aminés. L'hypothèse qu’il
s'agissait d'un enzyme à l'origine du biais de la transmission
héréditaire des marqueurs mitochondriaux était tentante. Mais comment
la démontrer ? Le produit protéique de l’intron n’avait jamais été
visualisé, laissant peu d’espoir de purification. Le code génétique
mitochondrial n’est pas universel, interdisant l’expression
hétérologue. Et le phénotype n’apparait que dans les croisements,
rendant extrêmement difficile l’isolement de mutants.
J’aurais pu rentrer à Gif pour tenter de résoudre ces problèmes. Mais
c’est alors que la situation s’est un peu compliquée. L’équipe de Piotr
Slonimski à Gif était arrivé à la conclusion que d'autres gènes
mitochondriaux avaient aussi des introns grâce à des tests de
complémentation fonctionnelle entre mutants. Ces gènes
apparaissaient comme des mosaïques de régions appartenant à un cistron
(un ensemble de complémentation) ou à un autre. Au plan de la
génétique, ces résultats étaient spectaculaires car ils montraient que
des gènes pouvaient être enchevêtrés fonctionnellement les uns dans les
autres. Mais l'explication moléculaire manquait, en particulier en ce
qui concernait l’épissage de ces introns. Or, à cette même époque, un
jeune doctorant de Walter Gilbert, George Church, venait d’émettre
l'hypothèse que l’épissage de ces introns dépendait de protéines que,
par analogie avec l’intron omega, ils étaient supposés coder,
expliquant les résultats de complémentation entre mutants. Mais les
séquences de ces introns n’étaient pas encore disponibles, ce qui n’a
pas empêché Piotr Slonimski qui connaissait le détail de mes résultats
sur l’intron oméga (que je lui avais envoyé avec mon rapport annuel
d’activité au CNRS), de publier alors immédiatement l’idée que
l’épissage des introns mitochondriaux dépendait des protéines qu’ils
codent. Sur le coup, l'affaire m'a laissé un gout amer et j’ai prolongé
mon séjour à Harvard d’une année travaillant, en collaboration avec
Hugues Blanc alors à Stanford, sur les mutants ‘petite colonie’ et
réfléchissant à comment utiliser la diversité génétique au sein des
populations naturelles en complément des méthodes de la génétique
moléculaire. Walter Gilbert reçu le prix Nobel de Chimie en octobre
1980.
Les introns mitochondriaux
Quand je suis revenu à Gif au printemps 1981, j'ai monté une petite
équipe avec François Michel, qui bouclait l'écriture de sa thèse sur la
fusion thermique de l'ADN, et avec Hugues Blanc qui revenait de
Stanford où il avait travaillé sur l’ADN mitochondrial de mammifères.
J’ai recruté un premier doctorant, Alain Jacquier (qui m’a ensuite
suivi à Pasteur) et d’autres étudiants, stagiaires et visiteurs sont
ensuite venus renforcer cette fine équipe dont les relations avec Piotr
Slonimski étaient compliquées. C’était un caractère complexe. Faire une
thèse avec lui, c'était formidable, on discutait beaucoup et tout
allait très bien. Mais à partir du moment où on était docteur, on
devenait une sorte de compétiteur susceptible de lui porter ombrage. Je
voulais continuer à travailler sur les introns mitochondriaux, en
particulier avec l’intron omega qui montrait ce phénomène que l’on
appellerait maintenant gene drive, et sur lesquels bien des découvertes
restaient à faire. Avec les premières séquences disponibles, François
Michel avait commencé à rechercher des structures secondaires possibles
pour ces ARN. Je me souviens de sa soutenance de thèse en 1982. Dans sa
présentation orale, il a évoqué son modèle des introns codants qui ne
figurait pas dans son manuscrit de thèse. Les autres membres du jury,
très intéressés, ont demandé à Piotr: "Vous étiez au courant de ce truc
là?". Or, il ne l'était pas ! Le lendemain on se fait convoquer dans le
bureau directorial pour se faire passer un savon : "On ne peut pas se
comporter comme ça ... On va vous foutre à la porte !" Au CGM, il
était interdit de découvrir sans en parler d’abord au « patron » !
L’affaire a fini par s’arranger. En ce qui me concerne, j’ai réussi à
démontrer que la protéine codée par l’intron omega était une
endonucléase d'un type nouveau. Des enzymes un peu bizarres avec une
spécificité de reconnaissance de l’ADN d’une vingtaine de nucléotides
(deux tours d’hélice) alors que, jusque-là, les sites de reconnaissance
des enzymes bactériennes ne dépassaient pas 6 nucléotides
(exceptionnellement 8). Cette endonucléase expliquait le mécanisme de
gene drive, que j’avais baptisé Intron Homing. J’avais donc
clairement établi le fait qu’un intron mobile codait pour une
endonuclease coupant l’ADN, sans action directe sur l’ARN (et donc sur
l’épissage de cet intron qui s’est d’ailleurs révèlé ensuite être un
excellent ribozyme). Cette protéine reçue ensuite le nom de
‘I-Sce I’ avec le préfixe ‘I’ pour Intron. Des phenomènes semblables
dans d’autres organismes devaient suivre trois ans plus tard. C’est
ainsi qu’une nouvelle catégorie d’enzymes est née en 1989, que l’on
appelle maintenant homing endonucleases. Pendant ce temps, François
Michel avait réussi à modéliser les structures bidimensionnelles de ces
introns, montrant l’existence de deux groupes distincts (groupe I et
II) qui constituent les machineries catalytiques de l’ARN. Notre petite
équipe avait donc un modèle cohérent expliquant l’existence de ces
introns par l’apport de nucléases protéiques qui les insèrent dans les
gènes récepteurs sans perturber le fonctionnement de ceux-ci grâce à la
catalyse de l’épissage par l’ARN. Mais les choses devaient
rapidement changer. Hugues Blanc décéda tragiquement dans un
accident de circulation. Le séquençage des gènes s’accélerait. On
commençait à entendre parler de génomes. L’exceptionnel spécificité de
clivage de l’ADN par I-Sce I me poussait à imaginer une ingéniérie des
génomes (ce qui n'était pas encore dans l'air du temps) mais poursuivre
de tels travaux au CGM devenait de plus en plus difficile, surtout que
ma charge de travail était devenue énorme (voir ci-dessous). Si je
voulais continuer, il fallait partir comme l’ont d’ailleurs fait mes
collègues Claude Jacq ou François Caron à peu près à la même époque que
moi.
L’Université Pierre et Marie Curie et l’Institut Pasteur
En effet, peu de temps après mon retour en France en 1981 comme chargé
de recherche au CNRS, j’avais fait acte de candidature dans
l’Enseignement supérieur (incité par Piotr Slonimski). J’ai été nommé
professeur à l’Université Pierre et Marie Curie (Paris VI) par un
décrêt du président de la République signé le premier avril 1983.
Les railleurs apprécieront ! J’ai donc quitté le CNRS alors
que je venais juste de passer DR2. A cette époque, l’université
mettait presque une année avant de payer ses professeurs (les choses se
sont beaucoup améliorées ensuite). J'avais deux enfants à charge, un
troisième en route et ma femme ne travaillait pas. Heureusement que le
CNRS avait oublié d'arrêter mon salaire. J'ai pu vivre comme cela
pendant presque un an. Quand l’université m’a enfin payé, j’ai
remboursé le CNRS. A l'époque, j'étais un peu fou. J'avais choisi de
faire mes cours tard le soir. J'arrivais à Jussieu à 18 h. et finissais
à 21 h. De plus, comme j’arrivais difficilement à faire vire ma famille
avec mon salaire de jeune Professeur, j'avais pris un job
d’enseignant à temps partiel à l’Ecole Polytechnique en plus de mon
emploi principal à l’Université et de mes recherches au laboratoire.
Bref, je travaillais comme un malade et je ne voyais même plus grandir
mes enfants. Cela devait durer jusqu’en 1987, moment où je suis parti à
l’Institut Pasteur pour y établir un nouveau laboratoire tout en
conservant mon poste de Professeur à l’Université Pierre et Marie
Curie. Dans le système de Pasteur, j’étais un OREX (chercheur détaché
d’un organisme extérieur).
Toujours intéressé par les introns des groupes I et II, leurs origines
et leurs mécanismes d’actions, j’avais gardé l’idée que les nouvelles
endonucléases introniques allaient nous permettre de découper des
génomes de manière spécifique, in vitro et in vivo. J'ai donc lancé un
programme d'ingéniérie génétique (synthèse de gènes, essais in vitro
puis in vivo) en commençant avec les levures. Puis assez rapidement,
j'ai établit une collaboration avec une équipe à l'étage en dessous qui
travaillait sur la souris, celle de Jean-François Nicolas. Avec deux
thésards, Arnaud Perrin (dans mon labo) et André Choulika (chez
Nicolas) on a réussi une ingéniérie génétique dans des cellules de
souris avec mon endonucléase de levure bricolée artificiellement. Peu
de temps après, la même chose a été réalisée sur des plantes en
collaboration avec un laboratoire suisse (Holger Puchta chez Barbara
Hohn). De plus, comme avec ma levure j'étais capable d'insérer dans les
chromosomes des sites artificiels de mon endonucléase I-Sce I,
j’avais imaginé une nouvelle méthode pour cartographier ce génome qui
allait se révéler utile pour le séquençage intégral de la levure.
Quand je suis arrivé à l’Institut Pasteur, à la fin des années 1980,
l’Institut était à peu près la moitié de ce qu'il est devenu au cours
de sa forte expansion des années 1990 (environ 2500 personnes sur le
campus aujourd’hui). Au fil du temps, les relations Pasteur - Paris VI
se sont un peu effilochées. Aujourd’hui, il n’y a plus
d’enseignants de Paris VI dans les laboratoires de Pasteur (mais encore
beaucoup de doctorants), alors qu'il y en a beaucoup de Paris VII
(Denis Diderot). J’étais le dernier Professeur de Paris VI à travailler
sur le campus de Pasteur.
A mon arrivée à l’Institut Pasteur, j’ai rejoint le ‘Département de
biologie moléculaire’ qu’avaient fondé François Jacob et Jacques Monod.
Toujours actif, François Jacob animait l'esprit du département, le seul
organisé sous cette forme au sein de l’Institut à cette époque. Les
autres ‘unités de recherche’ (UR), chacune dirigée par un chef, étaient
directement rattachées au directeur général de l'Institut, Maxime
Schwartz qui venait de succéder à Raymond Dedonder. L'intérêt d’une
organisation en départements est de permettre des discussions entre
équipes voisines, de savoir ce que chacun fait, de susciter des
collaborations comme je l’avais fait avec JF. Nicolas. Au sein du
département de biologie moléculaire, les moyens étaient distribués de
manière ouverte et équitable (ce qui me changeait un peu du CGM).
Quand il a pris la direction de l’Institut Pasteur, Maxime Schwartz a
organisé le fonctionnement interne en départements de recherche qui
correspondaient essentiellement chacun à un bâtiment (au moins pour les
plus récents) ce qui facilitait beaucoup la gestion (coincidence entre
les locaux et le fonctionnement des laboratoires) mais aboutissait
souvent à une hétérogénéité scientifique interne. Vers la fin de son
mandat, il a souhaité réorganiser les départements de recherche sur des
bases thématiques en ignorant largement les localisations des
laboratoires et c’est Philippe Kourilsky qui a réalisé ce changement.
Il a alors créé une douzaine de départements thématiques. L’intitulé
‘biologie moléculaire’ a disparu puisqu’on y trouvait des gens qui
faisaient de la microbiologie, de la biologie structurale, des
neurosciences, de la biologie du développement animal qui se sont
séparés en différents départements. Avec Antoine Danchin, nous avons
obtenu l’ouverture d’un département intitulé 'Structure et dynamique
des génomes' en 2000. Il a très bien marché et s’est vite
agrandi. Philippe Kourilsky lui-même avait d’ailleurs créé le
‘Département d'immunologie’ auparavant (il travaillait sur le complexe
majeur d'histocompatibilité, MHC). Maxime Schwartz et lui-même
faisaient partie de la petite troupe de polytechniciens que Jacques
Monod avait recruté à Pasteur, considérant les autres étudiants comme
trop médiocres. Philippe Kourilsky retenait surtout de la génétique sa
dimension d’outil. Son aspect proprement scientifique ne l’intéressait
guère mais il a quand même créé notre Département. Quelques années plus
tard, quand j’ai été nommé à la direction scientifique de l'Institut
Pasteur en 2006, Alice Dautry m’a demandé de moderniser les
départements thématiques en les rationalisant sur des bases un peu plus
scientifiques. Pour des raisons historiques il y avait plusieurs
départements où l’on faisait de la microbiologie. Pareil pour la
virologie. J'ai passé pas mal de temps à fouiller les organigrammes,
discuter avec les collègues pour savoir qui faisait réellement quoi et
quels étaient leurs désirs. Bref, j’ai changé certains contours et
appellations des départements de recherche. Notre département est
devenu 'Génome et génétique'. L’opposition était entre ceux qui
voulaient maintenir l'esprit d'origine de l’Institut, essentiellement
la microbiologie, l’immunologie et les maladies infectieuses, et ceux
qui contribuaient à l’émergence de nouvelles disciplines, biologie du
développement, génétique, génomique, biologie cellulaire, neuroscience,
informatique, utiles à un grand Institut de recherche biologique
modernes. Finalement, je crois avoir assez bien réussi cette
réorganisation. A quelques détails près, ces départements existent
toujours aujourd’hui.
Le séquençage de la levure
J’en reviens à mes débuts de pasteurien. Peu après mon arrivée à
l’Institut (1988), j’ai reçu un appel d’André Goffeau, Professeur à
l’Université de Louvain-la-Neuve en Belgique, qui avait obtenu de la
Commission européenne la responsabilité de démarrer le séquençage du
génome de la levure Saccharomyces cerevisiae. Il me demandait si je
voulais participer. André Goffeau était un fantastique manager, il a
organisé les choses de manière très simple. La première tâche
consistait à séquencer le chromosome 3 de la levure. Pour mon
laboratoire, cela représentait 10 kilobases. On avait deux ans pour le
faire. On a terminé en un mois. En fait, pour moi au début séquençer un
morceau du ch¬romosome 3 était une activité un peu marginale. Mon
principal intérêt était d’explorer les possibilités offertes par les
capacités exceptionnelles de I-Sce I pour cartographier les génomes¬.
Une trentaine de labos étaient impliqués dans le séquençage du
chromosome 3. Au bout d’un an, seulement trois avaient fait leur job de
séquençage. Les autres découvraient un peu l’ADN ! Le CGM a
participé à cette phase, mais Piotr Slonimski s’intéressait surtout à
l’analyse fonctionnelle des quelques 150 gènes du chromosome 3. A
l’issue de cette première année, André Goffeau nous a demandé qui
voulait continuer. J'ai répondu présent et j'ai proposé de faire le
chromosome 11. Les gens se sont demandé pourquoi Dujon prenait le 11.
Connaissait-il un secret sur ce chromosome ? En fait la raison était
très simple, avec ma méthode de cartographie, c'était le plus facile
d'accès. Sur les électrophorèses en champ pulsé, il était au
milieu des gels, bien séparé des autres chromosomes. A cette époqie, on
ne faisait pas du séquençage ‘shotgun’ comme maintenant. On faisait les
cartes des chromosomes pour y placer les clones correspondant aux
différents segments. On distribuait ensuite ces clones entre les
laboratoires participants qui faisaient les séquences, puis on
assemblait les séquences. Incidemment, je signale que Craig Venter est
celui qui a inventé la stratégie ‘shotgun’ avec laquelle il a assemblé
sa version du génome humain. Il avait commencé sur une bactérie, avant
de passer à la Drosophile, puis à l'homme. Il faut dire aussi que
l'informatique a beaucoup progressé avec les années, ce qui a permis
ces assemblages de nombre considérables de petites séquences. Nous au
labo, nous avions utilisé une stratégie ‘shotgun’ pour nos premiers 10
kb de la levure, mais on n'aurait jamais eu les outils informatiques
adéquats pour passer à l’ensemble d’un génome. Donc on avait besoin
d'une carte physique à haute résolution, la carte génétique ne
suffisait pas. J’ai publié la séquence du chromosome 11 de levure dans
Nature dès 1994. C’était le deuxième chromosome européen après le
chromosome 3 publié aussi dans Nature en 1992. Les Américains
commençaient à rire jaune. Le chromosome 2 a été publié à la fin de
cette même année par H. Feldmann qui travaillait en parallele avec moi
et est devenu un très bon copain. Indépendemment, Mark Johnston, un
jeune Américain de Saint Louis, MO, publiait la séquence du chromosome
8. Fin 1994, on avait donc les séquences de quatre chromosomes de
levure sur les 16. André Goffeau voulait mener le programme européen
rapidement à son terme. C’est comme ça que j'ai récupéré la
coordination du chromosome 15. Francis Galibert, qui avait travaillé
avec Fred Sanger, celle du chromosome 10. Claude Jacq qui venait du CGM
et était parti à l’ENS, coordonnait le chromosome 4, Hervé
Tettelin, un étudiant de Goffeau en stage dans mon laboratoire, le
chromosome 7, Peter Philippsen du Biozentrum de Bâle, le chromosome 14,
tandis que les autres chromosomes étaient coordonnés par des
laboratoires Canadien, Japonnais, Anglais ou Américains ou étaient
répartis entre plusieurs participants. Certains
laboratoires allemands se sont montrés très efficaces pour le
séquençage. D’autres aussi. Avec ce programme, j’avais noué un réseau
de connaissances et de collaborations dans toute l'Europe. C’étaient
les grandes heures de la Commission européenne sous la présidence de
Jacques Delors. La séquence complète de la levure Saccharomyces
cerevisiae a été terminée dès 1996. C’était le premier organisme
eucaryote séquencé (A. Goffeau, B.G. Barrell, H. Bussey, R.W. Davis, B.
Dujon, H. Feldmann, F. Galibert, J.D. Hoheisel, C. Jacq, M. Johnston,
E.J. Louis, H.W. Mewes, Y. Murakami, P. Philippsen, H. Tettelin et S.G.
Oliver, « Life with 6000 genes », Science, vol. 274, 1996, p.
563-567). A cette époque, on n’imaginait pas encore clairement le
développement qu’allait prendre la génomique. On avait un génome de
référence, celui d’une souche de laboratoire, et personne n’imaginait
le besoin de séquencer d’autres levures avant longtemps.
Les vertus de la génomique comparative
Suite au séquençage de la levure, la DG XII avait décidé de lancer un
programme général d'analyse fonctionnelle des gènes de levures. La
majorité des levuristes n’étaient intéressés que par les séquences
codantes, beaucoup moins par les approches destinées à appréhender le
génome dans son ensemble. Le programme européen ne pouvait évidemment
pas englober toutes les questions posées par la biologie moléculaire
dans une durée limitée. Or, les gens s’intéressaient aux fonctions
qu’ils étudiaient, transport des protéines, transcription de l'ARN, etc
.., et très peu s'intéressaient réellement à la génomique. En plus, le
séquençage de la levure avait représenté un gros boulot et beaucoup de
gens le voyaient comme un aboutissement. Or une séquence est un début,
pas une fin en soi. Ils ne comprenaient pas l'intérêt de faire du
comparatif. Un premier génome seul n'apporte rien, sauf qu’il en faut
nécessairement un. Mais on ne commence à comprendre les choses que
lorqu’il y en a un deuxième. La génétique ne commence que lorsqu’il y a
variation. Aux débuts du séquençage de la levure S. cerevisiae, on
n'avait aucune hypothèse. A partir du moment où on en a eu deux, les
choses changent. On a trop d’hypothèses. La deuxième levure
séquencée (six ans plus tard) fut Schizosaccharomyces pombe, autre bête
de laboratoire. Malheureusement, les deux levures sont tellement
éloignées évolutivement que la comparaison de leurs génomes est peu
informative. En fait, la génomique comparative des levures n'a commencé
à se développer qu'au milieu des années 2000.
C’est la même chose pour le génome humain. Lors de l'annonce de son
aboutissement en 2001, il avait été fait deux fois puisque ‘Celera’
était en compétition contre le consortium international. Mais il
restait environ 300 000 trous dans la séquence. Il fallut trois ans de
plus pour que le consortium international termine le boulot. Mais
il ne s’agissait encore que d’une référence arbitraire et il fallut
attendre plusieurs années avant que des génomes individuels soient
séquencés, permettant les premières comparaisons. Aujourd’hui, on en a
des centaines de milliers. A Pasteur, il n’y avait pas beaucoup
d’intérêt pour la génomique à ses débuts. Beaucoup me disaient que ce
n'était pas un truc intéressant. D'abord le séquençage lui-même était
perçu comme une tâche répétitive, bête sur le plan expérimental (ce qui
était faux, il était en pleine évolution). Mais plus fondamentalement,
on disait que le séquençage des génomes n’était pas de la recherche
fondée sur des hypothèses, méthode privilégiée des biologistes et
considérée par certains comme la seule possible. Etablir des
hypothèses, faire des déductions qui doivent être vérifiées
expérimentalement afin de nourrir de nouvelles hypothèses, et ainsi de
suite ... L 'influence intellectuelle des débuts de la biologie
moléculaire se faisait sentir. Jacques Monod disait : « tout ce
qui est vrai pour les bactéries, l'est pour les éléphants» car il
cherchait à travailler sur les mécanismes universels. Cela ne servait à
rien de regarder la biodiversité. La biologie moléculaire est née comme
ça, elle a vécu comme ça et a perdu ensuite de son influence suite à
cette erreur. Sans perdre de vue l’intérêt de l’universel, la
biodiversité étant là, il faut l'exploiter pour bâtir des hypothèses
comme le montre le formidable développement de la génomique actuelle.
A ce sujet, le monde politique ne s’est pas révélé très brillant en
privilégiant les recherches finalisées à la simple curiosité
scientifique, celle qui est à l'origine des découvertes inattendues et
des changements majeurs. Prenez l'exemple des enzymes de restrictions,
c'est en explorant des phénomènes incompréhensibles de restriction
d’hôtes chez les bactériophages que Werner Arber a ouvert la voie à la
découverte des endonucléases qui ont bouleversé la génétique
moléculaire. C’est en observant la nature, que l’on a le plus de
chances de tomber sur des phénomènes inattendus dont l’interprétation
est source de découvertes fondamentales. Or les financements actuels
favorisent la recherche de ce que l'on connait déjà. Surtout avec
l’activité de tous ces comités théodules chargés de faire l'évaluation
de la recherche. En 1986, avec mon endonucléase I-Sce I , j'avais
fait une demande de soutien à l'INSERM pour me lancer (déjà !) dans de
l'ingéniérie génétique. Bien ambitieux. Refus immédiat. Pourquoi pas.
Mais le motif était extraordinaire: on ne peut pas faire ce que
personne n’a fait avant vous ! C'est le syndrome du type qui cherche
ses clés sous le réverbère parce que c’est là qu’il y a de la lumière.
La tendance actuelle est aussi un peu la faute de beaucoup de
scientifiques toujours prompts à dire "... oui mais ça va servir pour
telle maladie". Ce qui évidemment ne se produit pas (au moins dans les
délais prévus) et use l’argument. Les services de communications sont
d'ailleurs également fautifs de ce travers, celui de Pasteur mais c'est
pareil à l'Académie ou ailleurs. La biologie souffre de sa proximité
évidente avec la médecine. Il est facile à la partie médicale
d’expliquer qu'elle est indispensable, ce qui n’est pas faux. Mais de
là à lui réserver l’essentiel des moyens, il y a une marge. Au début de
la génomique vers la fin des années 1990, si les médecins avaient
obtenu tout ce qu’ils voulaient, ils n'auraient évidemment par séquencé
le génome humain. D’autant qu’il faut se souvenir que le séquençage
coutait trés cher à l'époque.
Espèces et génotypes
Comme je l’ai déjà dit, le génome humain de référence obtenu en 2001
par le Human genome program, ne permettait pas à lui seul de poser les
questions qui nécessitent de voir des différences. La génétique
n'existe que par l’existence de variations. Sans variation, pas de
génétique. De la même façon, le programme de séquençage de la levure
terminé, beaucoup de gens voulaient passer à ce qu’ils appelaient la «
post-génomique » qui consistait en réalité à appliquer des méthodes
anciennes sur une séquence nouvelle pour espérer trouver les fonctions
des gènes. A cette époque, Jean Weissenbach au Génoscope avait un point
de vue différent. Il avait compris l’intérêt heuristique de la
génomique comparative (qui n’avait pas encore commencé). Ainsi, il
avait entrepris le séquençage du Tetraodon, un poisson, dans le but de
faciliter l’interprétation du génome humain (dont il a séquence le
chromosome 14 avec très peu de trous car il a utilisé des 'BAC', des
clones bactériens avec des inserts de 50 à 100 kb, correctement
cartographiés). Lors d’une rencontre à Bruxelles, où je lui demandais
ce qu’il penserait de l’exploration génomique d’autres espèces de
levure que ‘S. cerevisiae’, il me répondit avec sa manière
directe : « qu’est-ce qu’une espèce de levures ? ». Question
pertinente. Personne ne le savait (et on le sait encore moins
aujourd’hui). En fait, j’avais posé cette question parce qu’un
séquençage très partiel de ‘Kluyveromyces lactis’ fait dans mon
laboratoire montrait des différences suffisantes avec ‘S. cerevisiae’
pour que l’on tente ce genre d’investigation à plus grande échelle. Le
Génoscope pouvait m’offrir 50 000 séquences de levures obtenues par la
méthode Sanger. Nous étions encore très loin du séquençage à haut débit
mais ceci nous permettait d’explorer différents génomes de
levures. C’est un autre point sur lequel il convient d’insister,
l'évolution des technologies change la nature des questions que l’on
peut aborder. C’est vrai pour la génétique comme pour toute la biologie
(pour ne pas parler de la médecine). C’est ainsi que grâce au
Génoscope, nous avons pu commencer à comparer des levures au niveau de
leurs génomes, ce qui impliquait naturellement leur évolution. Ensuite,
avec des séquences intégrales de quelques espèces choisies pour
représenter différentes branches évolutives déduites de nos résultats
préliminaires, nous avons cherché à savoir comment avaient évolué les
génomes de levures, autrement dit à reconstruire leur histoire. Nous
avons exploré des levures de la famille ‘Saccharomycetaceae’ qui,
contrairement à S. cerevisiae, n’avaient pas hérité de duplication du
génome. On les a qualifié espèces ‘protoploïdes’. Indépendemment,
le séquençage de ‘Millerozyma sorbitophila’ nous a révélé un phénomène
d’hybridations entre espèces différentes, en cours d’évolution.
Avec d’autres résultats du même type obtenu plus tard, on peut en
conclure que les incompatibilités génétiques entre espèces postulées
par Bateson, Dobzhanski et Müller pour expliquer la spéciation
demeurent un phénomène exceptionnel. A l’inverse, on constate que les
acquisitions génétiques horizontales sont une source importante
d’innovations phénotypiques pouvant engendrer de nouvelles lignées. La
barrière entre espèces semble donc perméable et, à la limite, on
pourrait en conclure qu’il n'existe pas d'espèces. Dans le cas des
levures, on voit maintenant des échanges génétiques dans tous les sens.
Evidemment, il reste des groupes d'organismes marqués par leur
ressemblance phénotypique. Mais en élargissant la recherche à des
ensembles plus large, il n’est pas rare de trouver des
intermédiaires. ‘Homo sapiens’ est un modèle du genre. Notre génome est
issu de plusieurs populations ancestrales distinctes. De même, dans un
très beau papier récent comparant les génomes de jaguars, léopards et
lions, trois espèces apparemment bien distinguables de félins, on
s'aperçoit que chaque génome porte des gènes provenant des autres
génomes. Conclusion, ces bestioles réussissent à maintenir un flux
génétique entre elles alors que leur reproduction est uniquement
sexuée. En plus de la transmission verticale des gènes, chaque
organisme est soumis à une sorte de flux génétique horizontal
permanent. Les introns mobiles de mes mitochondries et leurs
endonucléases en sont des exemples. Avec des confrères de l’Académie,
nous sommes en train de préparer un colloque sur le génome humain où ce
sujet d’échanges génétiques entre populations sera abordé. Loin des
ruptures nettes entre races humaines distinctes comme beaucoup de gens
l’imaginent, la génétique nous montre des gradients alléliques
entremêlés de manière très complexe entre populations.
Comment naissent les gènes ?
Au delà de ces échanges, la deuxième chose qui m'intéresse actuellement
concerne la manière dont les gènes naissent. Selon l’idée
(déjà un peu ancienne) de Susomo Ohno la duplication des gènes
offre un mécansisme principal de formation de nouveaux gènes. Un gène
se duplique en deux copies qui, chacune, vivent leur vie en
subissant des modifications divergentes. Ainsi de suite. Depuis
longtemps, je pensais qu'il y avait quelque chose en plus et je me
demandais si l’on pouvait faire des gènes à partir de rien.
C’est-à-dire à partir de séquences préexistantes qui ne sont pas des
gènes actifs. On connait la réponse de Jacques Monod et des débuts de
la biologie moléculaire: on ne peut pas, la probabilité est trop
faible. Or aujourd'hui, on sait que c’est faux. La nature nous montre
une dynamique de formation de nouveaux gènes, assez intense en
réalité. Avec énormément de ratés certes, mais on constate que
pas mal de gènes n'existaient pas chez les ancêtres se sont formés avec
le temps. D’autre part, on sait aujourd’hui synthétiser des gènes même
si la chimie que nous employons ne ressemble pas à celle que la nature
a utilisé. A l'origine des gènes, il y avait très vraisemblablement
l'ARN. Mais dans les organismes modernes, les gènes transmis à la
génération suivante sont de l'ADN. Le second est une copie du premier,
mais les propriétés physico-chimiques de l’ADN sont complètement
différentes de celles de l’ARN (simplement par élimination d’un atome
d’oxygène sur le carbone 2’ du ribose). De là, naquit la possibilité de
former de longs polymères stables (millions de nucléotides) et donc des
chromosomes, ce que les ARN ne peuvent pas faire. L'avantage est tel
que tous les organismes cellulaires actuels (virus mis à part) ont
hérité de cette capacité de transmettre de manière fiable de longs
segments d'information génétique à leur descendance sous forme d’ADN.
Mais depuis les débuts de la vie, les ARN ont eux aussi un peu évolué
(je prépare une étude à ce sujet). Les premiers polymères capables de
véhiculer une information génétique restent mystérieux. Le ribose est
un sucre simple, présent dans l’univers. Fabriquer des nucléotides à
partir du ribose n'est peut-être pas très compliqué. Evidemment, il
faut du phosphate. Mais il peut sortir des volcans. Et à partir du
moment où le ribose peut-être abondamment phosphorylé, on peut imaginer
qu’il commence à réagir avec des bases azotées. Pour démarrer un
premier code génétique, il fallait une macromolécule qui puisse faire
suffisamment de combinaisons de séquences pour permettre le décodage de
quelques acides aminés. Pas forcément beaucoup. Actuellement, je suis
en train d’examiner comment on pourrait démarrer un code génétique avec
seulement trois bases azotées permettant deux types d’appariements: une
liaison forte et une faible. Les propriétés de ce proto-code par
rapport au code actuel sont assez remarquables. On trouve les acides
aminés qui devaient exister avant l'oxygénation de l’atmosphère
terrestre. Les autres acides aminés auraient été recrutés ensuite pour
leur capacité à former des peptides plus résistants à l’oxydation. En
effet, les géologues s’accordent pour considérer qu'il y a un peu plus
de deux milliards d'années, la teneur en oxygène atmosphérique a
commencé à monter. Or, avant ce premier pic on a trouvé des
fossiles datant de 2,1 milliards d'années de grande taille comme s’il
s’agissait d’organismes pluricellulaires. L’arrivée de l'oxygène
gazeux, résultant probablement de la photosynthèse, n'a pas dû se
passer dans le calme. Je n'aurais pas aimé être là ! C’est un gaz très
toxique. Toute la biochimie de la vie d’alors a dû s'adapter
(probablement relativement rapidement) au passage d'un milieu réducteur
à un milieu oxydant. Bien pire que le changement climatique dont on
parle aujourd'hui ! Probablement que peu d’organismes ont
survécu. Peut-être que les rares cellules qui avaient des
proto-mitochondries ont été avantagées car les mitochondries consomment
l'oxygène en produisant de l’eau et en permettant à la cellule de
relacher du gaz carbonique (CO2). Ça explique peut-être l’origine des
cellules eucaryotes ? On est dans un domaine de pures spéculations sans
être certain de pouvoir le faire progresser un jour de manière
significative. Mais c’est fascinant pour un biologiste en fin de
carrière. J’ai la chance de pouvoir m’amuser avec ces élucubrations.
© Illustrations : CNRS images - Conception graphique : Karine Gay