Codage unaire
Le codage unaire est un codage entropique utilisé essentiellement en compression de données et s'appuyant sur la base 1.
Principe
modifierChaque symbole est assimilé à un entier naturel et est représenté par occurrences de (la représentation de l'entier naturel en base 1) suivies d'un faisant office de délimiteur. Le codage unaire produit donc un code préfixe.
Base 1 | Unaire | Binaire (sur 8 bits) |
Décimal | Nombre de Church |
---|---|---|---|---|
0 | 0000 0000 | 0 | λ f · λ x · x | |
1 | 10 | 0000 0001 | 1 | λ f · λ x · f x |
11 | 110 | 0000 0010 | 2 | λ f · λ x · f (f x) |
111 | 1110 | 0000 0011 | 3 | λ f · λ x · f (f (f x)) |
1111 | 1 1110 | 0000 0100 | 4 | λ f · λ x · f (f (f (f x))) |
1 1111 | 11 1110 | 0000 0101 | 5 | λ f · λ x · f (f (f (f (f x)))) |
Longueur du code
modifierLa longueur du code unaire associé à un entier naturel peut être exprimée par :
Optimalité
modifierLe codage unaire est optimal au niveau du symbole pour coder une source dont la distribution est non uniforme et suit la loi de probabilité :
Autrement dit, ce code est optimal lorsque la probabilité de coder un est de , celle de coder un de , celle de coder un de ...
Dans ce cas, le code produit est identique au code de Shannon-Fano ou au code de Huffman équivalent. Un codage arithmétique, optimal au niveau du bit, pourra cependant produire un code encore plus court.
Utilisations
modifierLe codage unaire est rarement utilisé seul, un codage de Huffman étant dans le pire des cas aussi efficace et dans tous les autres cas meilleurs.
Il demeure cependant intéressant du fait de sa simplicité et de sa rapidité, et est notamment utilisé pour le codage du quotient lors d'un codage de Golomb ou d'un codage de Rice. Ces deux techniques sont d'ailleurs équivalentes au codage unaire lorsque leur paramètre est 1.
Le codage unaire sert également pour coder le nombre de bits nécessaires pour coder un entier en binaire lors d'un codage gamma (et aussi, du coup, lors d'un codage delta).
Analogies
modifierLa représentation des entiers naturels par le codage de Church, utilisé en lambda-calcul est assimilable à un codage unaire.