Loi de Zipf

Loi de Zipf
Image illustrative de l’article Loi de Zipf
Fonction de masse
pour N = 10 dans un repère log-log. L'axe horizontal est l'indice k (la fonction est discrète, les droites de couleur n'indiquent pas de continuité).
Image illustrative de l’article Loi de Zipf
Fonction de répartition
pour N = 10. L'axe horizontal est l'indice k (la fonction est discrète, les courbes de couleur n'indiquent pas de continuité).

Paramètres
Support
Fonction de masse
Fonction de répartition
Espérance
Mode
Entropie
Fonction génératrice des moments
Fonction caractéristique

La loi de Zipf est une observation empirique concernant la fréquence des mots dans un texte. Elle a pris le nom de son auteur, George Kingsley Zipf (1902-1950). Cette loi a d'abord été formulée par Jean-Baptiste Estoup[1] et a été par la suite démontrée à partir de formules de Shannon par Benoît Mandelbrot. Elle est parfois utilisée en dehors de ce contexte, par exemple au sujet de la taille et du nombre des villes dans chaque pays, lorsque cette loi semble mieux répondre aux chiffres que la distribution de Pareto[2].

  1. Micheline Petruszewycz, « L'histoire de la loi d'Estoup-Zipf : documents » [archive du ] [PDF], (consulté le ), p. 41-56.
  2. Benoît Mandelbrot, Logique, langage et théorie de l'information, Paris, Presses universitaires de France, (lire en ligne [PDF]), « Étude de la loi d'Estoup et de Zipf : fréquences des mots dans le discours », p. 22-53.

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search