|
|||||||||||||||||||||||||||||||||||||||||||||||||
|
Créé le 18 octobre 2005
Introduction à la taxonomie et à la classification des procaryotes (bactéries)
Voir aussi les fichiers suivants :
Note: Dans ce fichier, les termes de bactérie et de procaryote sont considérés comme synonymes.
I - Les différents rangs hiérarchiques II - Les différentes approches taxonomiques 1) Détermination du G + C p. cent 2) Les hybridations d'acides nucléiques 3) Etude de diverses séquences génétiques a) Comparaison d'organismes phylogéniquement éloignés b) Comparaison d'organismes proches E - Taxonomie mixte et consensuelle (polyphasic taxonomy) III - Définitions des groupes taxonomiques A - Définition d'une espèce bactérienne C - Définition d'un rang hiérarchique supérieur au genre D - Définition d'une sous-espèce E - Définition des taxons d'un rang hiérarchique inférieur à la sous-espèce IV - Classification de la deuxième édition du Bergey's Manual of Systematic Bacteriology
La taxonomie est la science qui permet de classer rationnellement les organismes vivants en groupes d'affinité ou taxons. La taxonomie et la nomenclature sont les deux disciplines de la systématique dont la principale application est l'identification. La taxonomie, et d'une manière générale la systématique, sont parfois considérées comme des sciences vieillottes alors que de nos jours elles font appel aux techniques les plus modernes. Il n'existe pas de classification officielle des procaryotes pour trois raisons principales :
(i) Une classification est faite pour le bactériologiste et non pour les bactéries. C'est dire qu'une classification n'est pas obligatoirement élaborée sur la base des seuls critères scientifiques. La taxonomie poursuit des buts pratiques et plusieurs classifications peuvent coexister.
(ii) La taxonomie est une science dynamique, elle est sujette à de nombreux changements en fonction des données disponibles et des théories retenues*. Aussi, les opinions des bactériologistes sont divergentes. Dans le passé, la taxonomie reposait principalement sur des caractères phénotypiques. Actuellement, la classification fait souvent appel à des critères génétiques (hybridation ADN-ADN, séquençage des ADNr 16S, séquençage de divers gènes...).
(iii) L'absence de définition précise des rangs hiérarchiques est un obstacle majeur à une taxonomie universelle (Cf. infra).
I - Les différents rangs hiérarchiques Le monde des procaryotes est divisé en deux domaines (ou empires) : les Archaea (ou Archaeobacteria) et les Bacteria (ou Eubacteria). En théorie, au sein de chacun de ces domaines, on reconnaît les groupes hiérarchiques suivants : phylums (ou divisions), classes, sous-classes, ordres, sous-ordres, familles, sous-familles, tribus, sous-tribus, genres, sous-genres, espèces et sous-espèces. Des rangs hiérarchiques inférieurs à la sous-espèce sont également reconnus pour certaines espèces bactériennes.
A titre d'exemples, les classifications de Pseudomonas syringae pathovar Savastanoi et de Corynebacterium afermentans sous-espèce lipophilum, sont présentées ci-dessous (classification du "Bergey's Manual of Systematic Bacteriology" à l'exception du rang hiérarchique tribu) :
Pour chacun des rangs hiérarchiques, une nomenclature type doit être désignée :
L'importance de la nomenclature type est considérable car le nom d'un taxon reste en permanence attaché à sa nomenclature type si bien que le nom du taxon doit être changé si la nomenclature type est exclue du taxon.
II - Les différentes approches taxonomiques
Depuis la classification proposée par Cohn en 1872 et jusqu'au début des années 1960, toute la taxonomie bactérienne reposait sur une classification phénotypique. La classification phénotypique utilise un faible nombre de caractères considérés comme importants tels que la morphologie, la présence d'une spore, la mise en évidence d'un caractère biochimique jugé essentiel... Une classification phénotypique a l'inconvénient de ne refléter qu'une quantité d'information réduite. De plus le choix des critères qualifiés "d'importants" est subjectif et il peut varier d'un auteur à un autre ce qui est une source potentielle d'instabilité.
En 1763, le botaniste français Adanson proposait une méthode de classification qui tenait compte de l'ensemble des caractères d'un organisme. En 1957, Sneath applique une méthode similaire aux bactéries et développe une taxonomie qualifiée de numérique ou d'adansonienne. De manière schématique, la méthode consiste à étudier, pour chaque souche, plus d'une centaine de caractères morphologiques, biochimiques, culturaux, présence ou absence d'un constituant cellulaire particulier (un acide gras membranaire, une protéine, une quinone...) et à attribuer le même poids à chacun des caractères qui sont codés 1 (présence du caractère) ou 0 (absence du caractère). Le but recherché est de rassembler dans une classe de similitude les individus les plus semblables. Même en multipliant le nombre de caractères étudiés (jusqu'à 300 dans certaines études), la taxonomie numérique n'évalue que 5 à 20 p. cent du potentiel génétique d'une bactérie.
La chimiotaxonomie se base sur l'étude de constituants cellulaires. Les plus utilisés sont le peptidoglycane (voir le fichier ¤ "Classification des peptidoglycanes selon Schleifer et Kandler") , les quinones (présence de ménaquinones ou d'ubiquinones), les lipides polaires (utilisés par exemple pour la taxonomie du phylum des Actinobacteria) et les acides mycoliques (taxonomie des genres Corynebacterium, Dietzia, Gordonia, Nocardia, Rhodococcus et Tsukamurella).
1) Détermination du G + C p. cent En 1949, Chargaff et al. montrent que le contenu en bases puriques (G = guanine, A = adénine) et en bases pyrimidiques (C = cytosine, T = thymine) de l'ADN pouvait varier, mais qu'il était relativement constant pour les individus d'une même espèce. Le contenu en base d'un ADN est exprimé par le G + C p. cent qui est défini ainsi (chaque base étant exprimée par sa concentration molaire) : G + C p. cent = (G + C) x 100 / (A + T + G + C). La détermination du G + C p. cent est généralement réalisée par des techniques de dénaturation thermique qui sont de réalisation délicate, qui nécessitent de grandes quantités d'ADN et qui sont peu reproductibles. Fournier et al. (2006) ont montré que la valeur du G + C p. cent du gène de ménage ftsY (gène présent en un seul exemplaire, ne semblant pas pouvoir se transmettre sur un mode horizontal et codant pour une GTPase) était comparable à la valeur du G + C p. cent du génome bactérien. La détermination de la valeur du G + C p. cent du gène ftsY est une technique rapide, reproductible, nécessitant peu d'ADN, ne nécessitant pas un équipement spécial (le séquençage d'un gène est actuellement réalisable par de nombreux laboratoires) et pouvant être réalisée sur des bactéries non cultivables.
Chez les procaryotes, les valeurs du G + C p. cent sont très dispersées et elles varient de 25 p. cent à 75 p. cent. Actuellement, on admet que des bactéries dont les G + C diffèrent de plus de 5 p. cent ne devraient pas appartenir à une même espèce et que des bactéries dont les G + C diffèrent de plus de 10 p. cent ne devraient pas appartenir à un même genre.
2) Les hybridations d'acides nucléiques
Les hybridations ADN-ADN se sont révélées essentielles pour la définition d'une espèce bactérienne (Cf. infra). Leurs réalisations n'ont été possibles qu'après la découverte par Marmur et al. (1961) du phénomène de renaturation de l'ADN.
Les hybridations ADN-ADN, utilisées en bactériologie, sont réalisées à partir d'un mélange de deux ADN dénaturés provenant de deux bactéries différentes. Dans ces conditions, on obtient d'autant plus de duplex hétérologues que les séquences d'ADN des micro-organismes sont proches. Dans les techniques classiques l'un des ADN est généralement marqué par un isotope radioactif ou par une enzyme afin de reconnaître la provenance de chaque brin d'ADN dans les hybrides. Les techniques plus modernes, comme celles faisant appel à la spectrophotométrie, ne nécessitent pas de marquage, mais elles ne permettent pas de calculer un DTm(e) (Cf. infra). La température optimale de renaturation (Tor) est toujours inférieure à la température de dénaturation (Tm). En pratique, Tor est choisie à 20-30 °C en dessous de Tm soit environ 60 °C pour les entérobactéries. Pour éviter la réassociation des brins d'ADN marqués, on travaille avec des concentrations d'ADN non marqué environ 1000 à 5000 fois plus importantes.
En fonction des similitudes de séquence, deux types de duplex hétérologues peuvent se former :
La solidité et donc la spécificité des hybrides est appréciée par la mesure de la stabilité thermique. La technique consiste à étudier la cinétique de dénaturation des hybrides lorsque la température est augmentée au-dessus de Tor. On appelle Tm(e) (thermal elution midpoint) la température de demi-dénaturation de l'hybride, c'est à dire la température pour laquelle 50 p. cent de la radioactivité (ou de l'activité enzymatique) est éluée du duplex.
Dans les conditions optimales d'hybridation, deux ADN doivent posséder au moins 80 p. cent de séquences complémentaires pour pouvoir se réassocier. Ce fait explique que les hybridations ADN-ADN ne peuvent être utilisées pour comparer des bactéries très différentes. Elles sont utilisées pour définir les espèces et dans une moindre mesure les genres. En revanche, elles n'ont que peu d'utilité pour classer des bactéries dans un rang hiérarchique supérieur au genre. Les techniques d'hybridation ont également été appliquées à l'hybridation ADN-ARNr. L'hybridation ADN-ARNr a été employée pour placer des procaryotes dans un rang hiérarchique supérieur à l'espèce. Elles ont permis de dégager le concept de superfamille, terme proposé par De Ley pour rassembler des taxons à un niveau supragénérique. Les hybridations ADN-ARNr ont été remplacées par l'établissement de dictionnaires d'oligonucléotides puis par le séquençage des ADNr 16S (Cf. infra). Aussi, seuls des résultats présentés dans des publications antérieures à 1995 ont été obtenus à l'aide de cette technique.
3) Etude de diverses séquences génétiques Pour comparer des organismes phylogéniquement très éloignés il faut utiliser des séquences qui restent sensiblement conservées durant des centaines de millions d'années, tandis que la comparaison d'organismes proches requiert l'étude de séquences où des mutations se seront accumulées en quelques millions d'années.
Comme la taxonomie phénotypique, la taxonomie reposant sur l'étude des séquences génétiques a l'inconvénient d'être subjective et les résultats obtenus peuvent être variables selon les séquences génétiques étudiées.
a) Comparaison d'organismes phylogéniquement éloignés
En 1983, Kimura a émis le concept d'horloge "évolutionnaire" : la vitesse de l'évolution est constante, les mutations qui surviennent dans le génome n'ont pas nécessairement de conséquences phénotypiques, mais elles sont étroitement corrélées avec le temps. Comme le souligne Woese, l'évolution a un rythme quasi indépendant des changements de phénotypes (théorie neutraliste de l'évolution). Dans ces conditions, il est possible de construire un arbre généalogique (phylogénique) en utilisant des méthodes mathématiques et en respectant quelques règles.
Les ARNr (ARN ribosomaux) ont été choisis en taxonomie pour trois raisons principales :
Les ARNr s'associent à des protéines pour former les ribosomes qui, chez les procaryotes, sont constitués d'une sous-unité 30S et d'une sous-unité 50S. La sous-unité 30S d'un ribosome contient de l'ARNr 16S et la sous-unité 50S contient de l'ARNr 5S et de l'ARNr 23S. L'ARNr 5S est formé d'environ 120 nucléotides, l'ARNr 16S d'environ 1 540 nucléotides et l'ARNr 23S comprend environ 2 900 nucléotides. Tous les ARNr sont monocaténaires sauf dans quelques régions où se forment des boucles par appariement de bases complémentaires situées sur la même chaîne.
L'établissement de dictionnaires d'oligonucléotides, initialisé par Fox et Woese, a été riche d'applications. L'ARNr 16S est digéré par la ribonucléase T1 pour donner naissance à des oligonucléotides pouvant contenir jusqu'à 20 bases et se terminant toujours par un résidu guanyl. Ces oligonucléotides sont suffisamment courts pour pouvoir être séquencés. Seuls sont retenus les oligonucléotides formés de plus de 6 nucléotides car il y a peu de chance pour que la séquence qui les caractérise soit représentée plus d'une fois dans la molécule d'ARNr 16S. Lorsque les ARNr 16S de deux bactéries contiennent un ou plusieurs oligonucléotides semblables, ces deux bactéries sont apparentées. Plus le nombre d'oligonucléotides semblables est élevé, plus l'homologie est grande. En ne retenant que les oligonucléotides comprenant au moins 6 nucléotides, il est possible de constituer un dictionnaire des oligonucléotides. La majorité des dictionnaires comprend entre 60 et 70 oligonucléotides. Pour comparer entre elles deux bactéries A et B, on calcule un coefficient de similarité (ou coefficient d'association) : SAB = 2NAB / NA + NB où NAB est le nombre de nucléotides dans les oligonucléotides communs aux deux bactéries, NA est le nombre total des nucléotides dans le dictionnaire de la souche A et NB est le nombre total des nucléotides dans le dictionnaire de la souche B. A l'aide de méthodes statistiques et informatiques, il est possible de construire un arbre généalogique montrant les parentés et filiations.
Actuellement, ces dictionnaires sont supplantés par le séquençage des ARNr ou le séquençage des gènes codant pour les ARNr (ADNr). Les séquences sont disponibles dans des bases de données consultables sur Internet. Il en va de même pour les programmes informatiques indispensables à l'alignement des séquences, au traitement des données et à la construction des arbres phylogéniques.
Il est également possible de rechercher des séquences (ou oligonucléotides) signatures (séquences correspondant à des oligonucléotides présents dans un groupe phylogénique donné mais absent dans la plupart des autres groupes). La caractérisation des séquences signatures est utile pour placer des souches dans un rang hiérarchique supérieur au genre.
b) Comparaison d'organismes proches Des gènes, autres que ceux codant pour les ARNr 16S, peuvent être séquencés. Le séquençage d'un "gène de ménage" (housekeeping gene, gène qui assure les fonctions indispensables à la vie de tous les types de cellules) ou de plusieurs "gènes de ménage" (MLSA ou MultiLocus Sequence Analysis) ont été largement utilisés pour classer des espèces au sein de genres bactériens (Cf. infra).
E - Taxonomie mixte et consensuelle (polyphasic taxonomy) Les termes de "polyphasic taxonomy" ont été introduits en 1970 par Colwell pour faire référence à une classification qui tient compte d'un maximum de données : données génétiques, données phénotypiques, données chimiotaxonomiques, données écologiques... De nos jours, l'expression "polyphasic taxonomy" sous-entend également que cette classification est susceptible d'avoir l'agrément d'un maximum de bactériologistes. C'est pourquoi nous avons choisi de traduire "polyphasic taxonomy" par "taxonomie mixte et consensuelle".
III - Définitions des groupes taxonomiques
A - Définition d'une espèce bactérienne L'espèce constitue l'unité de base ou le maillon essentiel de la classification bactérienne. La définition classique d'une espèce biologique n'est pas applicable aux procaryotes et les bactériologistes ont dû élaborer une définition originale de l'espèce ! En bactériologie, une espèce est constituée par sa souche type et par l'ensemble des souches considérées comme suffisamment proches de la souche type pour être incluses au sein de la même espèce. Une souche est constituée par une succession de cultures dérivées d'une culture pure (le plus souvent une colonie parfaitement isolée). Une souche (notamment une souche type ou une souche de référence) est généralement conservée dans une collection qui lui attribue un code d'identification. Le nombre de cellules ayant permis la constitution de la culture pure (la formation d'une colonie isolée) est le plus souvent inconnu si bien que, contrairement à ce qui est parfois écrit, une souche n'est pas obligatoirement un clone (population de cellules dérivée d'une unique cellule). D'ailleurs, d'après l'Appendice 10 du Code de Nomenclature, la plupart des souches bactériennes ne sont pas connues pour être des clones.
Contrairement à une idée répandue, la souche type (à ne pas confondre avec une souche de référence) n'est pas nécessairement la souche la plus représentative de l'espèce (ou de la sous-espèce).
La définition de l'espèce diffère selon les critères retenus pour apprécier la similitude des souches (caractères phénotypiques, caractères génétiques, constitution chimique ...), ce qui a conduit à constituer des comités internationaux chargés de définir des critères et de proposer une définition de l'espèce. En dépit de ces efforts, il convient de remarquer qu'il n'existe aucune définition universellement admise de l'espèce bactérienne.
Pour ces deux comités, la définition de l'espèce se base sur les homologies ADN-ADN. Une espèce est définie génétiquement (genomospecies) comme le rassemblement de souches ayant des relations ADN-ADN qui se traduisent à la fois par des valeurs d'hybridation supérieures ou égales à 70 p. cent et par une valeur DTm(e) inférieure ou égale à 5 °C.
Selon Stackebrandt, un pourcentage d'hybridation d'au moins 70 correspond à une identité de séquence d'au moins 96 p. cent. En d'autres termes, les séquences des ADN des souches d'une même espèce peuvent différer de 4 p. cent. Si on considère que le génome de Escherichia coli est constitué de 4 millions de bases, deux souches peuvent présenter 161 600 nucléotides différents ce qui explique la variabilité phénotypique observée entre les souches de Escherichia coli et, d'une manière générale, entre les souches d'une même espèce.
Lorsque les ARNr 16S de deux souches présentent moins de 97 p. cent d'homologie, les deux souches appartiennent à deux espèces différentes (les pourcentages d'hybridation ADN-ADN seront toujours inférieurs à 70 et même, généralement, à 60). En revanche, si le pourcentage d'homologie est supérieur à 97, il est impossible de conclure.
Lorsqu'une genomospecies a été individualisée, il devient possible de rechercher des caractères permettant de la distinguer des autres genomospecies. Si la genomospecies peut être facilement identifiée elle reçoit un nom et elle devient une espèce. En revanche, si aucun caractère ne permet d'identifier facilement la genomospecies, elle demeure innomée.
Cette définition de l'espèce bactérienne est beaucoup plus large que celle utilisée pour les organismes eucaryotes. Ainsi, si la définition d'une espèce bactérienne était appliquée aux mammifères, l'homme et le chimpanzé constitueraient une unique espèce (pourcentage d'hybridation ADN-ADN de 98,4) et il en irait de même pour l'homme et les lémuriens (pourcentage d'hybridation ADN-ADN de 78).
Les hybridations ADN-ADN étant des techniques lourdes et délicates à réaliser, le comité présidé par Stackebrandt encourage l'utilisation d'autres techniques (séquençage de divers gènes de ménage, séquençage de l'espace intergénique 16S-23S, analyse électrophorétique des protéines, MLEE, AFLP, RAPD...) à condition que les résultats obtenus soient comparables à ceux des hybridations ADN-ADN. Quelques exemples sont donnés ci-dessous.
Pour les bactéries d'intérêt médical ou vétérinaire l'écologie et/ou le pouvoir pathogène peuvent prendre le pas sur les critères génétiques ce qui peut conduire à conserver des nomenclatures distinctes pour des taxons très proches sur le plan génétique. Cette recommandation va dans le sens de la règle 56a (5) du Code de Nomenclature qui définit la notion de nomen periculosum (voir le chapitre ¤ "Les dérogations aux règles du Code de Nomenclature" in ¤ "La nomenclature bactérienne").
Toutes les espèces sont classées dans des genres ce qui permet d'appliquer à la systématique bactérienne la nomenclature "binomiale" préconisée par Carl von Linné. Avec l'espèce, le genre est donc le rang hiérarchique le plus important. La définition d'un genre donné par Cowan en 1968 est la suivante : "...one of the basic ranks in the hierarchical systems used in biology, and probably the highest rank with any significance in microbiology. In position between family and species, it is best considered as a collection of species with many characters in common; unfortunately no one has indicated the extent of this sharing of characters, and it is purely a matter of personal judgement...as to what constitutes a genus. ... the genus is a subjective concept without any foundation in fact." Depuis 1968, aucune définition satisfaisante d'un genre n'a été formulée et, comme le soulignent Brenner, Staley et Krieg (2001), une telle définition n'existera peut-être jamais. La proposition d'un nouveau genre repose en grande partie sur des critères subjectifs. Un bactériologiste pourra individualiser plusieurs genres pour accueillir des espèces bactériennes alors que pour un autre bactériologiste les mêmes espèces doivent être regroupées dans un genre unique.
De manière idéale, un genre devrait rassembler des espèces génétiquement et phénotypiquement apparentées et il devrait pouvoir être identifié sur la base de ses caractères phénotypiques.
En cas de divergence entre les critères génétiques et phénotypiques, Brenner et al. (1984) estiment que la priorité doit être donnée aux caractères phénotypiques. Pour ces auteurs, le genre est un rang hiérarchique ayant, avant tout, une utilité pratique et dont la finalité est de permettre à un bactériologiste d'établir un diagnostic.
Certains genres bactériens sont très hétérogènes. Ainsi, au sein du genre Clostridium, les séquences des ARNr 16S de Clostridium tetani et de Clostridium innocuum diffèrent de 20 p. cent. Avec une telle valeur, toutes les espèces de la famille des Enterobacteriaceae ainsi que les genres Vibrio, Aeromonas, Haemophilus et Pasteurella appartiendraient à un unique genre.
C - Définition d'un rang hiérarchique supérieur au genre Le regroupement de plusieurs genres au sein d'une famille, d'un sous-ordre, d'un ordre, d'une sous-classe ou d'une classe repose sur des arguments encore moins solides que ceux qui président au rassemblement des espèces dans un genre. De ce fait, certains taxonomistes sont très réticents au placement des genres dans un de ces rangs hiérarchiques. Dans la deuxième édition du "Bergey's Manual of Systematic Bacteriology", les taxons d'un rang hiérarchique supérieur au genre sont constitués sur la base des séquences des ARNr 16S.
D - Définition d'une sous-espèce La sous-espèce occupe l'échelon le plus bas des rangs hiérarchiques réglementés par le Code de Nomenclature. Comme le font remarquer Brenner, Staley et Krieg (2001), il n'existe aucun critère objectif permettant de définir une sous-espèce et la division d'une espèce en sous-espèces dépend du bon vouloir d'un taxonomiste.
Selon Staley et Krieg (1984), la notion de sous-espèce devrait reposer sur la mise en évidence de petites variations phénotypiques ou sur la présence de critères génétiques (homologies ADN-ADN et/ou stabilité thermique des hybrides) permettant de diviser les souches d'une espèce en deux ou plusieurs sous-espèces.
Pour Brenner et al. (2001) il est également possible de proposer des sous-espèces lorsque plusieurs genomospecies ne peuvent être différenciées par leurs caractères phénotypiques et si l'une de ces genomospecies porte déjà un nom.
E - Définition des taxons d'un rang hiérarchique inférieur à la sous-espèce
Selon l'appendice 10 du Code de Nomenclature, les définitions des principaux taxons d'un rang hiérarchique inférieur à la sous-espèce sont les suivantes :
IV - Classification de la deuxième édition du Bergey's Manual of Systematic Bacteriology Même s'il n'existe pas de taxonomie officielle des procaryotes, il existe une classification utilisée par la majorité des bactériologistes. La classification qui fait habituellement référence est celle du "Bergey's Manual of Systematic Bacteriology". Cette classification a pour but de refléter la phylogénie des procaryotes et, pour les taxons d'un rang hiérarchique supérieur au genre, elle est basée principalement, voire exclusivement, sur les séquences des ADNr 16S.
La classification adoptée par le Bergey's Manual est librement disponible sur Internet, mais la dernière mise à jour remonte au mois de mai 2004.
Une classification complète et mise à jour tous les mois est disponible dans le fichier Classification of domains and phyla - Hierarchical classification of prokaryotes in List of Procaryotic Names with Standing in Nomenclature.
AVIS JURIDIQUE IMPORTANT : Les informations qui figurent sur ce site sont soumises à une clause de non responsabilité et sont protégées par un copyright.
*
|
|||||||||||||||||||||||||||||||||||||||||||||||||