Problème du char d'assaut allemand

problème mathématique

Le problème du char d'assaut allemand réfère à une estimation de la valeur maximale d'une loi uniforme discrète à partir d'un échantillonnage sans remplacement. Il tire son nom de son application par les Alliés de la Seconde Guerre mondiale afin d'estimer la production de chars d'assaut allemands.

Lors de la Seconde Guerre mondiale, la production de char d'assaut allemand, tels le Panzerkampfwagen V Panther, a été estimée par les Alliés grâce à des méthodes statistiques.

Le problème peut être abordé selon les approches d'inférence fréquentiste (en) ou bayésienne.

Selon l'approche fréquentiste, le nombre total () est fonction du nombre d'échantillons () et de la valeur de l'échantillon le plus élevé () selon la relation suivante :

Hypothèses de départModifier

On suppose que l'ennemi produit une série de chars immatriculés par des entiers en commençant par le chiffre 1. En plus de cela, quelle que soit la date de production du char, ses années de service, ou encore son numéro de série, la distribution des numéros d'immatriculation est considérée comme étant uniforme dès l'instant où on mène l'analyse.

ExempleModifier

En supposant que k=4, et que les numéros de série relevés sont les suivants : 19, 40, 42 et 60. Le plus grand numéro de série relevé est m=60. On pose N, le nombre inconnu de chars.

La formule d'estimation du nombre total de chars selon l'approche fréquentiste est la suivante :

 

Tandis qu'en suivant l'approche bayésienne propose cette fonction de masse (probabilités) pour estimer le nombre total de chars :

 

grâce à laquelle on peut estimer le nombre total chars par la méthode suivante :

 

La distribution comporte une asymétrie (statistiques) positive puisqu'il y a au moins 60 chars.

HistoireModifier

 
Panzerkampfwagen V Panther chargés pour le transport sur la ligne de front (1943).

Lors de la Seconde Guerre mondiale, les Alliés ont tenté de déterminer l'étendue de la production allemande d'armement. Pour ce faire, ils ont utilisé deux approches : la collecte d'informations par les services de renseignements et l'utilisation des probabilités et statistiques.

La seconde approche permettait d'estimer le nombre de chars d'assaut allemand à l'aide des numéros de série des chars capturés ou détruits. Ces derniers, recoupés avec les numéros des châssis, moteurs, roues et pneus, ont permis d'établir une séquence de production[1],[2],[3].

Selon les services de renseignements Alliés, la production de chars d'assaut allemand était d'environ 1 400 unités par mois entre et . Selon les estimations statistiques, le chiffre était plutôt de 246 par mois. Après la guerre, les cahiers de production allemands ont été saisis et donnaient une valeur de 245 chars par mois[2].

Estimations de la production allemande[4],[5]
Mois Estimation statistique Estimation par les services de renseignements Selon les archives allemandes
169 1 000 122
244 1 550 271
327 1 550 342

Autres applicationsModifier

 
Le problème du char d'assaut allemand a également été utilisé pour l'estimation de la production de fusées V2.

Toujours lors de la Seconde Guerre mondiale, le même modèle a permis d'estimer la production de fusées V2[6].

L'approche a également été utilisée pour l'estimation de production de chars Merkava israéliens[7].

Analyse fréquentisteModifier

L'estimateur sans biais de variance minimale pour une estimation ponctuelle du nombre total de chars   est donné par

 

m est le plus grand numéro de série observé et k est le nombre de chars observé (la taille de l'échantillon). On remarque que, une fois observé, un numéro de série n'a aucune chance d'être à nouveau observé.

Cet estimateur a une variance de

 .

En conséquence l'écart-type est approximativement égal à l'écart moyen entre deux observations, c'est-à-dire N/k.

Cette formule d’estimation de N peut être comprise intuitivement comme prenant comme estimation initiale le numéro de série le plus élevé (car étant l'estimateur du maximum de vraisemblance), et en y ajoutant l'écart moyen pour compenser le biais négatif lié à l'utilisation du maximum de l'échantillon m en tant qu'estimateur du maximum de la population totale N. En effet,

 .

Notes et référencesModifier

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « German tank problem » (voir la liste des auteurs).
  1. Ruggles et Brodie 1947, p. ?.
  2. a et b (en) Gavyn Davies, « How a statistical formula won the war », The Guardian, .
  3. (en) Robert Matthews, « Data sleuths go to war, sidebar in feature 'Hidden truths' », New Scientist,‎ (lire en ligne [archive du ]).
  4. Ruggles et Brodie 1947, p. 89.
  5. (en) « Order Statistics », sur randomservices.org (consulté le ).
  6. Ruggles et Brodie 1947, p. 90–91.
  7. Johnson 1994.

BibliographieModifier

  : document utilisé comme source pour la rédaction de cet article.

  • (en) R. W. Johnson, « Estimating the Size of a Population », Teaching Statistics, vol. 16, no 2,‎ , p. 50–52 (DOI 10.1111/j.1467-9639.1994.tb00688.x.).  
  • (en) R. Ruggles et H. Brodie, « An Empirical Approach to Economic Intelligence in World War II », Journal of the American Statistical Association, vol. 42, no 237,‎ , p. 72-91 (DOI 10.1080/01621459.1947.10501915).  

Voir aussiModifier

Articles connexesModifier

Liens externesModifier