Une loi pour les gouverner tous (assez facile)


Imaginiez que vous notiez toutes les longueurs (en kilomètres) des rivières de France dans un carnet.

Chose curieuse : il y a nettement plus de longueurs qui commencent par 1 que par 2. Et nettement plus qui commencent par 2 que par 3 et ainsi de suite.

Bah, normal !, me direz-vous : il y a beaucoup plus de petits cours d'eau que de longs !

L'argument ne tient pas car, plus petits que les fleuves de 100 à 199 km, il y a tous les fleuves de 20 à 99 km qui sont encore plus nombreux et dont la longueur ne commence pas par 1.

Peut-être est-ce parce que vous avez noté les longueurs en kilomètres ? Qu'à cela ne tienne ! Mettez-vous à la sauce anglaise et mesurez-les en miles : le même phénomène se reproduit ! La répartition semble indépendante de l'unité de mesure.

Cela est intéressant. Car si l'on prend, non plus un kilomètre, mais 500 mètres comme unité de mesure, alors tous les chiffres qui décrivent les longueurs vont doubler.

En particulier, les longueurs exprimées en unités de 500 m ne commencent par 1 que si les longueurs en kilomètre commencent par 5, 6, 7, 8 ou 9.

Il faudrait donc, pour que la répartition soit insensible à l'unité de mesure, qu'il y ait autant de longueurs commençant par 1 que de longueurs commençant par un chiffre supérieur ou égal à 5. On commence à entrevoir le déséquilibre mentionné plus haut.

D'autres considérations liées à cette invariance, et que je ne détaillerai pas, amènent à considérer qu'il n'existe qu'une seule loi de répartition qui vérifie cela : la loi de Benford.

Elle fournit ces répartitions :

Faites la somme de pourcentages en face de 5 à 9 : vous obtiendrez bien le pourcentage en face de 1.

Saurez-vous trouver d'autres sommes qui concordent ? À quel multiplicateur correspond chacune ?

Cette loi fonctionne très bien pour décrire certaines listes, comme les longueurs des rivières, les tailles de fichiers informatiques, les numéros de rues des adresses de vos contacts, les taxes payées par les contribuables (elle est d'ailleurs utilisée pour détecter des fraudes).

Elle est en revanche inadaptée pour d'autres répartitions telles que, bien sûr, le Q.I. des humains...

 

Je vous laisse méditer là-dessus...

 

Pour ceux qui veulent aller plus loin :

https://fr.wikipedia.org/wiki/Loi_de_Benford

 



 

Commentaires

  1. Intéressant ! Peut-on en savoir un peu plus sur l'histoire ? Le comment et le pourquoi ? Et qui est Benford ?
    En tout cas merci pour ces pépites très instructives !

    RépondreSupprimer
    Réponses
    1. C'est l'astronome Simon Newcomb, et non Franck Benford, qui a découvert cette loi, à la fin du 19e siècle. Savez-vous comment ? Il avait au départ noté que les tables de logarithmes étaient plus usées dans les premières pages !

      L'Histoire n'est pas toujours juste qui a permis à Benford de donner son nom à la loi en 1938 après qu'il eut fait la même constatation que Newcomb.

      Supprimer
    2. Est ce la meme loi ou un dérivé qui décrit l'utilisation des mots dans la langue francaise ?
      Le premier mot est deux fois plus utilisé que le second mot. le second mot est deux fois plus utilisé que le troisième ... etc ?

      Supprimer
    3. Je pense qu'il faudrait plutôt cette fois chercher du côté de la loi de Zipf !
      https://fr.wikipedia.org/wiki/Loi_de_Zipf

      Supprimer

Enregistrer un commentaire

Posts les plus consultés de ce blog

Intégrammes (très difficile)

Le taux de connerie (très facile)

Réjouissons-nous avec le jour (facile)