Utilisateur:Tyroide/Brouillon

Méthode SAM

modifier

Introduction

modifier

Contexte Biologique

modifier

Mesure de l'expression d'un gène

modifier

Protocole de la méthode SAM

modifier

La population étudiée est composée de deux sous-populations, l'une est la population de référence et l'autre est celle qui possède la caractéristique dont nous cherchons les gènes responsables. Sur l'ensemble de cette population, on mesure l'expression d'un grand nombre de gènes, on obtient aisi une base de donnée qui pour chaque individu nous donne l'expression de nombreux gènes.

En raison de la difficulté de recueillir de telles informations, le nombre d'individus est souvent faible, les données fournies avec l'implémentation R de la méthode SAM portent sur 3051 expressions de gènes mesurées sur 38 personnes.

La méthode SAM cherche à voir les gènes qui sont en moyenne différentiellement exprimés entre les deux populations. Il est envisageable d'effectuer gène à gène un test de Fisher pour tester l'égalité des moyennes. Cependant, le nombre de gènes testés rend l'erreur de première espèce inacceptable : si des 3000 tests de Fisher sont effectués indépendament à un niveau de 5% il y aura en moyenne 150 erreurs! Il faut donc effectuer ces 3000 tests parallèlements.



Détermination des gènes différentiellement exprimés

modifier

Détermination de la distribution sous hypothèses nulles

modifier

Q-value et gènes pivots

modifier

Chain Ladder

modifier

Format des donées

modifier

Méthodes de prévision

modifier