Utilisateur:Wikimavi2014/Sequençage nouvelle generation

L’explosion de la demande en séquençage de l’ADN à bas coût (et la demande de rapidité) a amené au développement de méthodes de séquençage à haut débit (ou Next-gen-sequencing). Apparue sur le marché en 2007 Les séquenceurs dits de « nouvelle » génération permettent la lecture de plusieurs millions de séquences en parallèle, dans des temps et des coûts beaucoup moins importants qu’avec les anciennes méthodes de séquençage.

Les Méthodes de séquençage à haut débit : modifier

Le séquençage à haut débit se fait globalement en 3 grandes étapes :

  • Préparation et amplification des molécules d’ADN à analyse (amplification non nécessaire pour les techniques de 3ème génération)
  • Incorporation des bases complémentaires du brin à séquencer
  • Lecture et décodage de la séquence

Plusieurs technologies permettent le séquençage à haut débit dont voilà les principales variantes :

  • La synthèse analysée en temps réel : génération de la base de manière controlée et analyse du résultat au fur et à mesure. Principe retrouvé dans le Pyroséquençage et le séquençage par terminateur réversible. Les bases intégrées sont identifiées par fluorescence, ou par les résidus de cette intégration, les pyrophosphates (avec la méthode 454, par fluorescence) ou les ions hydrogène (avec la méthode de Ion Torrent).
  • La synthèse réalisée en temps réel : variante des méthodes précédentes, il s’agit de synthèse réalisée à la même vitesse que dans le vivant et observée au fur et à mesure par différents moyens (fluorescence ou captation électrique). On trouve des méthodes de ce genre chez Pacific Biosciences et BioNano Genomics.
  • Besoin ou non d'amplification : certaines méthodes impliquent l’amplification des brins d’ADN avant le séquençage, d’autres non, comme le SMRT de Pacific Bioscience. D’où un gain de temps.


Pyroséquençage 454 (Roches) modifier

 
Pyrogram

Le pyroséquençage et en particulier la techinique de séquençage 454 à été développée par 454 Life Sciences et a été acquise par Roches Diagnostics. Cette technique se base sur le « séquençage par synthèse » et sur l’amplification de l’ADN par PCR en émulsion et sur le pyroséquençage. Elle se repose sur la libération de pyrophosphate lors de l’incorporation de nucléotides lors de la synthèse de l’ADN. La séquence d’ADN souhaitée est déterminée par la lumière émise lors de l’incorporation du nucléotide complémentaire au moment de la synthèse. La lumière est captée par un Capteur CCD (Charge Coupled Device) et est reproduite sous forme d’un pic sous le pyrogramme. L’intensité du signal lumineux et donc la hauteur du pic définit le nombre de nucléotides du même type incorporés en même temps. On déduit donc la séquence à partir de la taille des pics obtenus.

A titre d'exemple, le GS-FLX 454, développé par Roche, réalise 1 000 000 lectures de 400 bases environ, et 400 000 000 bases sont obtenues toutes les 10 heures.

Séquençage à l’aide de terminateurs réversibles (Illumina) modifier

 
An Illumina HiSeq 2500 sequencer

Solexa (maintenant part d’Illumina) a développé un système de séquençage par terminateur réversible. L’amplification de l’échantillon à analyser plutôt que de s’effectuer en solution se fait sur un support solide. La réaction est alors réalisée sur le support où l’ADN a été amplifié. Elle se déroule position par position en ajoutant un mélange contenant toutes les bases associées chacune à un fluorophore différent. L’extrémité des bases étant protégées on n’a pas d’addition de bases supplémentaires à chaque cycle d’incorporation. Une lecture laser permet de détecter simultanément toutes les positions incorporée.A la fin de chaque cycle de lecture on enlève par ultra-violets le terminateur de la base ajoutée afin de passer à l’ajout de la base suivante. On effectue donc la lecture cycle après cycle. La préparation de chaque plaque dure environ trois heures, et il est possible de séquencer 10 millions de brins par centimètre carré. Le système le plus récent d’Illumina (la HiSeq 2500) permettrait de séquencer 120 gigabases en 27 heures, auxquelles s’ajouteraient 20 heures de traitement informatique. Grâce à la très importante amplification du signal, le taux d’erreur (qui peut être élevé) est compensé par sa redondance.

Le Séquençage par ligation (SOLID technology de Life Technologies) modifier

La technologie SOLID est issue de la société Agencourt Personal Genomics et a été acquise par Applied Biosystem en 2006, elle-même fusionnée ensuite avec Life Technologies. SOLID veut dire ”Sequencing by Oligonucleotide Ligation and Detection”. Le processus démarre un peu comme pour le pyroséquençage mode 454 Roche, à savoir qu’une bibliothèque de brins d’ADN est associée à une microbille magnétique qui fait ici 1 micron d’épaisseur via un adaptateur (petit brin d’ADN) et que chaque brin est multiplié par emPCR. Le résultat est fixé sur une plaque de verre et non dans des micro-cuves. Chaque brin est associé à une amorce pour pouvoir initialiser sa réplication.

C’est alors qu’a lieu une série d’opérations chimiques de réplication des brins d’ADN et de détection au fur et à mesure les bases qui sont ajoutées. Il s’appuie sur la ligation, un processus habituellement utilisé pour la réparation (automatique) de l’ADN des cellules, notamment lors de sa réplication (naturelle). Une protéine complexe, la ligase, est capable de raccommoder des morceaux d’ADN les uns aux autres.

Le processus consiste à ajouter par ligase et de manière répétitive, des blocs de 8 bases avec une paire de bases qui correspondront aux deux suivantes à synthétiser dans chaque brin d’ADN à séquencer (parmi 16 possibles, 4×4), précédée de trois bases degenerate et suivie de trois bases universelles et d’un marqueur au fluor qui seront éliminées. Des bases degenerate et universelles ? Il s’agit de bases qui sont capables de s’apparier avec n’importe laquelle des quatre bases de l’ADN. Comme la deoxyinosine, une base G sans son amine (NH2).

Les 16 paires de bases différentes que l’on va assembler à l’ADN à séquencer sont marquées par fluorescence. On utilise seulement quatre couleurs différentes car il est délicat d’en utiliser plus en biochimie. Ce qui veut dire que la détection de la couleur donne une information partielle sur la nature de la paire de bases détectée. L’astuce consiste à ajouter donc pas à pas des séries de paires de bases détectées par fluorescence suivies de 3 bases universelles, d’enlever le tout et de recommencer l’opération quatre fois en la décalant d’une base, grâce à des amorces de taille différente (de 1 à 4 bases en moins que la première). Cela permet par recoupement d’identifier les bases de l’ADN et qui plus est, de les mesurer chacune deux fois. Ce qui réduit le niveau des erreurs de lecture à 1 pour 1000, soit dix fois mieux que dans le pyroséquençage. C’est l’aspect le plus différenciant de cette technologique.

Séquençage par semi-conducteur (Ion Torrent / Life Technologies) modifier

Ion Torrent ne se base pas sur la détection de fluorescence de nucléotides ou de leur résidus, mais sur la détection d'ions H+ dégagés lors de la polymérisation de l'ADN. Avec la technologie actuelle En un seul batch de deux heures, on peut séquencer des brins d’ADN de 100 bases en moyenne. Ce qui donne 66 Giga bases. Comme le génome humain en comporte 3, cela donne un taux de couverture de plus de 30x, ce qui est excellent mais qui sous-entend un taux d’erreurs significatif. Il est notamment lié au nombre relativement restreint de bases que les brins analysés peuvent comporter (100 à 200). Plus il est faible, plus il est difficile de reconstituer le puzzle de l’ADN par traitement numérique.

Applications du séquençage à haut débit modifier

Le champ d’application de ces nouvelles méthodes de séquençage est très vaste. En effet à partir du moment où il est possible d’obtenir une molécule d’ADN, le séquençage à haut débit peut-être utilisé. Grâce à la capacité de ces machines à fournir de grandes quantités de séquences ou de travailler sur un grand nombre d’échantillons en parallèle, ces outils permettent de couvrir plusieurs technologies différentes employées jusqu’à maintenant comme les puces à ADN, le séquençage classique de Sanger ou la PCR quantitative à haut débit. Les applications disponibles avec le séquençage à haut débit peuvent globalement se regrouper en 3 grandes catégories : le séquençage de novo, le reséquençage et les analyses fonctionnelles.

  • le séquençage de novo: c'est à dire le séquençage de génomes inconnus. Pour avoir des versions du génome de bonne qualité, on combine en général plusieurs méthodes de séquençage. Ce séquençage est utilisé entre autre dans le domaine médicale pour découvrir les génomes d'agents pathogènes inconnus ou de nouveaux virus.
  • Le reséquençage : Utilisé lorsque la séquence du génome de référence est déjà connue afin de connaître les variations génomiques de l'échantillion étudié. Ces techniques on vocation à préciser des diagnostics de façon préventive ou a caractériser une pathologie déjà déclarée. Il est par exemple possible d'effectuer un diagnostic prénatal pour certaines maladies génétiques. Le reséquençage à haut débit peut également servir pour caractériser des agents pathogènes de manière beaucoup plus rapide que le séquençage classique. Ce qui peut être crucial dans le cas de situation d'urgences.
  • Les analyses fonctionnelles : Le dernier champ d’application des méthodes de séquençage à haut débit concerne la

génomique fonctionnelle. Le but n'étant ici pas de connaître la séquence d'ADN exacte mais de quantifier les quantités d'ARN qui s'exprime dans la cellule afin de déterminer par exemple les effets de molécules thérapeutiques lors de traitements.


Avantages et limitations modifier

Les avantages du NGS sont sa très grande sensibilité, sa vitesse et son prix de moins en moins élevé qui permette d'imaginer son application en diagnostic. Cependant, on a encore des limites qui sont la quantité de données recueillies qui sont très grande et demande l'intervention d'un bio-informaticien. La technologie est encore jeune et la gestion des données n'est pas encore bien maîtrisée et encore moins automatisée. De plus ces techniques étant nouvelles nous n'avons pas encore le recul nécessaire pour obtenir des résultats fiables car les modèles statistiques à appliquer aux données ne sont pas encore déterminés sans ambiguïtés. Enfin il est désormais possible d'avoir accès au génome complet d'un individu ce qui pose des interrogations sur les aspects éthiques qui doivent donc être envisagés et débattus.On vient de le voir, les méthodes de séquençage à haut débit sont porteuses de grands espoirs en terme d’innovations médicales, pharmacologiques et toxicologiques. Cependant, les difficultés soulevées par l’analyse et le traitement des données produites sont quasiment aussi importantes et nécessitent une attention particulière de tous les décideurs dans le domaine de la santé.

Notes et références modifier

http://www.lps.ens.fr/recherche/biophysique-ADN/dna1.html

police-scientifique2012.webnode.fr

http://www.futura-sciences.com/fr/definition/t/medecine-2/d/adn_87/

http://www.oezratty.net/wordpress/2012/technologies-sequencage-gnome-humain-3/

http://www.oezratty.net/wordpress/2012/technologies-sequencage-gnome-humain-4/

http://biologie.univ-mrs.fr/upload/p211/CoursSeqAssemblageM1_2011?.pdf

http://www.pyrosequencing.com/DynPage?.aspx?id=7454

http://fr-fr.invitrogen.com/site/fr/fr/home/Products-and-Services/Applications/Sequencing/Semiconductor-Sequencing/publications.html

http://www.pnas.org/content/103/52/19635.full

http://www.nanoporetech.com/technology/analytes-and-applications-dna-rna-proteins/dna-an-introduction-to-nanopore-sequencing