Henri ATLAN
La fin du « tout génétique » ? Vers de nouveaux paradigmes en biologie — (INRA Editions, Sciences en question, 1999)
p.87. En biologie, il y a sous-détermination des théories par les faits, un trait caractéristique des systèmes vraiment complexes.
p.25. La complexité par le bruit : Dans le transfert entre ADN et protéines, ou dans la réplication, se produisent des erreurs, comme du ‘bruit’ dans une voie de communication. Ces erreurs peuvent produire un effet négatif qui, selon le formalisme de Shannon, se traduit par la soustraction d’une quantité d’information transmise. Mais si au lieu de considérer la transmission de l’information depuis son origine jusqu’à son arrivée, on envisage maintenant la quantité d’information totale contenue dans l’ensemble du système dont cette voie de transmission n’est qu’une partie, la quantité d’information produite par le bruit vient s’ajouter, et non se soustraire. Il y a introduction d’une variabilité nouvelle, une diversité par rapport à ce qui se passerait en l’absence d’erreurs. Cette diversité peut évidemment être source de mauvais fonctionnements et entraîner des effets négatifs, mais dans certains cas (une forte redondance de départ est nécessaire, et elle diminue), elle peut au contraire être source d’une augmentation de complexité, éventuellement fonctionnelle, avec au total un effet positif pour le système. Ex. : les mutations sont source de l’augmentation progressive de la diversité et de la complexité des êtres vivants; la maturation du système immunitaire: son répertoire est accru par les mutations somatiques et réarrangements chromosomiques aléatoires au cours de la maturation des lymphocytes; bruit développemental.
p. 19. Le « tout génétique » : (tout se réduit finalement à la source, l’ADN)
1/ Dogme central de la Biologie Moléculaire : 1 gène <-> 1 enzyme <-> 1 fonction. Or plusieurs gènes peuvent contribuer à l’expression d’un caractère, et un gène peut participer à l’expression de plusieurs caractères.
2/ Dogme central de la Biologie Structurale : 1 séquence protéique unidimensionnelle <-> 1 structure reployée tridimensionnelle unique <-> 1 fonction (activité enzymatique). Or ce cas serait plutôt l’exception. Contre-ex. de la protéine-prion (hérédité épigénétique).
3/ a) L’ADN est assimilable à une séquence binaire; et b) tout programme séquentiel d’ordinateur est réductible à une séquence binaire => les déterminations génétiques fonctionnent comme un programme d’ordinateur inscrit dans l’ADN. Or faut pas décoder ! L’erreur de raisonnement consiste à tenir pour vrai la réciproque de la proposition b. Toute séquence binaire n’est pas nécessairement un programme.
Codage ≠ Programmation. Un code est une correspondance statique qui permet de passer d’une structure à une autre. Un programme est quelque chose de dynamique, qui détermine une succession d’événements dont chacun est déterminé par un précédent.
Personne n’a trouvé dans l’ADN cette structure logique de programme. Les séquences codantes sont traduites en protéines par l’intermédiaire du code génétique. C’est plutôt une mémoire génétique qu’un programme génétique dont il faudrait parler. Peu de syntaxe, pas de sémantique, pas de structure de langage ??? Alors est-ce que l’ADN est un ensemble de données ?
Attention la théorie de la complexité des algorithmes dit qu’il n’y a pas de différence fondamentale entre programme et données. Effectivement dans les systèmes artificiels, construits intentionnellement, la signification est toujours exogène; en programmation elle est déjà là, implicite. La signification n’est pas une propriété intrinsèque du programme. Mais dans la nature la signification n’est pas définie de l’extérieur. L’objet biologique produit son propre objectif, ou ce qui y ressemble quand on décrit son activité en termes de fonctions. Donc si nous utilisons une métaphore informatique en parlant du génome, faisons la différence entre programme et données. Le programme d’un objet biologique explicite sa finalité apparente et définit une classe d’objets partageant même structure et même finalité (cf. aussi Maturana et Varela : le programme serait-il une organisation ?). Les données spécifient un objet particulier dans cette catégorie. Ex. « 0011000011 » a pour programme « dédouble chaque bit » et pour données « 01001 ». Ce programme permet de produire en outre beaucoup de séquences différentes appartenant à la catégorie des séquences constituées par des doublons.
Pour les objets biologiques, il faut redéfinir la complexité algorithmique en séparant la partie programme de la partie données : c’est la « complexité avec signification » ou « sophistication » (Atlan & Koppel, 1990). C’est la longueur minimale de la partie programme de la description minimale.
Si l’ADN est un programme, la machinerie cellulaire (le réseau de réactions biochimiques et de transports) a le rôle de l’interpréteur. Si l’ADN représente les données, la machinerie cellulaire est un programme distribué (jeu de la vie, réseau de neurones ?), une « machine d’états » dont les propriétés principales sont les suivantes:
- l’état d’une cellule est l’ensemble des concentrations de ses constituants dans ses microcompartiments;
- un réseau de réactions biochimiques et de transports déplace la cellule d’un état à un autre dans le temps;
- l’activité des protéines est à la fois un déterminant et un effet de l’état cellulaire;
- la mémoire est codée non seulement dans des structures statiques, mais aussi dans des états stables dynamiques, normaux ou pathologiques, transmis lors des divisions cellulaires. La vérité est entre les deux. Il y aurait un balancement de l’un à l’autre à des échelles de temps différentes. Sur qq min à qq heures, la machinerie cellulaire traite les données produites par les gènes actifs programme et atteint un état stable fonctionnel. Sur qq heures à qq jours ou plus, certains états stables du réseau (programme) modifient l’état d’activité différentielle des gènes (données). D’où une nouvelle structure du réseau, qui produit un nouvel état stable,… Le réseau est évolutif.
Réseaux épigénétiques : (boucles de rétroaction, réseaux d’interactions)
La complexité des voies de signalisation et de régulation du vivant et l’organisation de ces voies en réseaux rendent très difficile la détermination du rôle particulier de chaque gène (Morange M.).
Sur ce flot d’informations existent quelques boucles : ex. certaines protéines déterminent l’état d’activité de l’ADN. Entre les protéines et les fonctions, il y a des réseaux dans lesquels la fonction n’est pas le résultat d’une seule protéine, mais de l’interaction de plusieurs protéines. Enfin ces réseaux ont eux-mêmes un effet rétroactif sur l’état d’activité des ADN et ARN.
Hérédité épigénétique : la cellule de peau qui se divise pour donner deux cellules de peau (somatique); méthylation de l’ADN ou empreinte génomique (germinal aussi); développement embryonnaire (celui-ci est bien l’expression d’un programme, mais pas seulement génétique, certainement épigénétique, sinon comment expliquer que les mêmes gènes du développement donnent une mouche ou une souris; de plus c’est l’espace entier de l’oeuf, comme la grille du jeu de la vie, où est localisé le programme de développement, moyennant des règles du jeu qui sont les lois physicochimiques, et des conditions initiales qui sont le génome et le réseau biochimique); la protéine-prion. Une telle transmission peut s’observer chaque fois qu’existe une boucle de rétroaction positive. Pour une boucle simple, il y aura 2 états stables. Ainsi ce qui est transmis au moment d’une division cellulaire, ce n’est pas seulement la structure d’un gène mais aussi son état d’activité, qui lui-même dépend de boucles incluant les produits du gène (Atlan H., 1999, INRA Éditions).
p.58. Préformation et épigenèse : L’effet Réverbère (en pleine nuit, le fou cherche ses clés sous le réverbère, alors qu’il sait les avoir perdues ailleurs, sous le prétexte que c’est là qu’il y a de la lumière).
De même, de très nombreux programmes de recherche sont développés là où sont disponibles de nouvelles techniques, que l’on exploite au maximum. Depuis les grands développements de la technologie des ADN, il est effectivement beaucoup plus facile de connaître la structure des gènes que les mécanismes de l’épigenèse, qui sont plus compliqués à appréhender. Ce que l’on sait faire le plus facilement aujourd’hui, c’est repérer ce que l’on appelle des « déterminismes génétiques ». Il ne se passe pas de semaine qu’on n’identifie de nouveaux gènes donnés pour responsables de l’apparition de caractères normaux ou pathologiques. Il y aurait évidemment beaucoup à dire sur le manque de rigueur qui entache trop souvent la manière dont cette identification est établie, en général à partir de corrélations statistiques approximatives, sans qu’aucune relation causale soit démontrée. Mais c’est beaucoup plus facile à faire que d’analyser des déterminismes épigénétiques qui font appel nécessairement à une multiplicité de facteurs causaux intriqués les uns dans les autres. Le résultat, c’est que l’on assiste à un retour du préformationnisme extrême, sous forme d’un nouvel avatar, pour lequel tout est contenu dans les gènes. La métaphore du programme génétique renforce évidemment ce nouveau réductionnisme. D’où l’utilité des métaphores alternatives comme celle de l’auto-organisation appliquée à l’épigenèse, par exemple, qui, tirées à la fois de la cinétique chimique et de la dynamique des systèmes complexes, peuvent contribuer à empêcher ce retour du balancier vers une interprétation préformationniste extrême.
