Tri par paquets

algorithme de tri

Le tri par paquets est un algorithme de tri qui fonctionne sur des nombres réels appartenant à un intervalle borné fixé à l'avance.

Tri par paquets
Problèmes liés
Structure des données
Basé sur
Pigeonhole sort (en)Voir et modifier les données sur Wikidata
Complexité en temps
Pire cas
Voir et modifier les données sur Wikidata
Complexité en espace
Pire cas
Voir et modifier les données sur Wikidata
Moyenne
Voir et modifier les données sur Wikidata

Le principe de ce tri consiste à partitionner régulièrement l'intervalle d'entrée en autant de sous-intervalles que l'entrée comporte d'éléments à trier, et à distribuer les données selon leur valeurs en autant de paquets correspondant à ces sous-intervalles. Les paquets sont alors triés séparément à l'aide d'un autre algorithme de tri.

Si les nombres en entrée sont uniformément distribués dans l'intervalle initial, alors la complexité temporelle moyenne du tri par paquets est linéaire, et ce quel que soit l'algorithme de tri auxiliaire utilisé.

Description de l'algorithme modifier

Le tri par paquets prend en entrée un tableau T de n nombres réels appartenant à un intervalle [a, b[. Le déroulement de l'algorithme est le suivant :

  • Créer n listes   appelées paquets. Le paquet   est associé à l'intervalle  .
  • Pour chaque élément T[i] :
    • Calculer l'intervalle   dans lequel il se trouve :  , où la notation   désigne la partie entière inférieure.
    • Ajouter T[i] à  .
  • Trier chaque liste  , par exemple avec un tri par insertion.
  • Renvoyer la concaténation des listes  .

Complexité modifier

Dans le pire cas, les   nombres de l'entrée se trouvent dans le même sous-intervalle et sont tous placés dans le même paquet. Ainsi, la complexité en temps dans le pire cas est égale à la complexité dans le pire cas de l'algorithme auxiliaire, par exemple   avec un tri par insertion et   avec un tri fusion.

Comme il y a autant de paquets que de nombres, la taille moyenne de chaque paquet est 1. En utilisant l'hypothèse de distribution uniforme, on peut aussi démontrer que le temps moyen pour trier un paquet est  , et ce, que l'on utilise un algorithme de tri en   ou  [1]. Par conséquent, la complexité en moyenne de l'algorithme complet est  .


Notes et références modifier