K-médoïdes

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Le partitionnement en k-médoïdes est une méthode de partitionnement plus robuste vis-à-vis des données aberrantes (outliers) que celle des k-moyennes (k-means). La différence majeure avec les k-moyennes est que le point central d'une classe est un point du jeu de données (médoïde^[2]). En statistique, le médoïde d'une classe est défini comme le point de la classe dont la dissimilarité moyenne avec tous les autres points de la classe est minimale, c'est-à-dire qu'il s'agit du point le plus central de la classe.

Algorithme

En général, le problème des k-médoïdes est NP-difficile à résoudre exactement. Il existe donc de nombreuses solutions heuristiques.

L'algorithme PAM^[3] (Partitioning Around Medoids) est l'un des premiers algorithmes introduits pour résoudre le problème de k-médoïdes.

Voir aussi

K-moyennes

Références

↑ The illustration was prepared with the Java applet, E.M. Mirkes, K-means and K-medoids: applet. University of Leicester, 2011.
↑ Stéphane Tufféry, Data Mining et statistique décisionnelle, Éditions Technip, page 244
↑ (en) Leonard Kaufman et Peter J. Rousseeuw, « Partitioning Around Medoids (Program PAM) », Wiley Series in Probability and Statistics,‎ 8 mars 1990 (ISBN 978-0-470-31680-1, DOI 10.1002/9780470316801.ch2)

Bibliographie

Portail de l'informatique théorique

[1] The illustration was prepared with the Java applet, E.M. Mirkes, K-means and K-medoids: applet. University of Leicester, 2011.

[2] Stéphane Tufféry, Data Mining et statistique décisionnelle, Éditions Technip, page 244

[3] (en) Leonard Kaufman et Peter J. Rousseeuw, « Partitioning Around Medoids (Program PAM) », Wiley Series in Probability and Statistics,‎ 8 mars 1990 (ISBN 978-0-470-31680-1, DOI 10.1002/9780470316801.ch2)

[2]

[1]

[3]