Notes sur la fonction de Benford, Notes de Mathématiques. Université des Sciences et Technologies de Lille (Lille I)
Caroline_lez
Caroline_lez13 January 2014

Notes sur la fonction de Benford, Notes de Mathématiques. Université des Sciences et Technologies de Lille (Lille I)

PDF (122.5 KB)
4 pages
189Numéro de visites
Description
Notes de mathématique sur la fonction de Benford. Les principaux thèmes abordés sont les suivants: la "fonction de Benford" (ou "loi de Benford"), l'intégrale.
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document
Aperçu3 pages / 4
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document

Fonction de Benford.

Cette distribution aurait été découverte une première fois en 1881 par Simon Newcomb, un

astronome américain, après qu'il se fut aperçu de l'usure (et donc de l'utilisation) préférentielle des

premières pages des tables de logarithmes (alors compilées dans des ouvrages). Frank Benford,

aux alentours de 1938, remarqua à son tour cette usure inégale, crut être le premier à formuler

cette loi qui porte indûment son nom aujourd'hui et arriva aux même résultats après avoir

répertorié des dizaines de milliers de données (longueurs de fleuves, cours de la bourse, etc).

Seule explication possible : nous avons plus souvent besoin d'extraire le logarithme de chiffres

commençant par 1 que de chiffres commençant par 9, ce qui implique que les premiers sont "plus

nombreux" que les seconds.

Bien que cette idée lui paraisse tout à fait invraisemblable, Benford entreprend de vérifier son

hypothèse. Rien de plus simple : il se procure des tables de valeurs numériques, et calcule le

pourcentage d'apparition du chiffre le plus à gauche (première décimale). Les résultats qu'il

obtient confirment son intuition:

Chiffre initial Probabilité d'apparition

1 30.1 %

2 17.6 %

3 12.5 %

4 9.7 %

5 7.9 %

6 6.7 %

7 5.8 %

8 5.1 %

Tableau: 7.7 - Probabilité d'appartion d'un chiffre

selon la loi de Benford

A partir de ces données, Benford trouve

expérimentalement que la probabilité qu'un nombre commence par le chiffre n (excepté 0) est

(nous allons le démontrer plus loin) donnée par la relation :

(7.499)

appelée "fonction de Benford" (ou "loi de Benford").

Exemple:

Voici un tracé de la fonction précédente :

(7.500)

Il convient de préciser que cette loi ne s'applique qu'à des listes de valeurs "naturelles", c'est-à-

dire à des chiffres ayant une signification physique. Elle ne fonctionne évidemment pas sur une

liste de chiffres tirés au hasard.

La loi de Benford a été testée sur toutes sortes de tables : longueur des fleuves du globe,

superficie des pays, résultat des élections, liste des prix de l'épicerie du coin... Elle se vérifie à

presque tous les coups.

Elle est évidemment indépendante de l'unité choisie. Si l'on prend par exemple la liste des prix

d'un supermarché, elle fonctionne aussi bien avec les valeurs exprimées en Francs qu'avec les

mêmes prix convertis en Euros.

9 4.6 %

Cet étrange phénomène est resté peu étudié et inexpliqué jusqu'à une époque assez récente. Puis

une démonstration générale en a été donnée en 1996, qui fait appel au théorème de la limite

centrale.

Aussi surprenant que cela puisse paraître, cette loi a trouvé une application : le fisc l'utilise aux

Etats-Unis pour détecter les fausses déclarations. Le principe est basé sur la restriction vue plus

haut : la loi de Benford ne s'applique que sur des valeurs ayant une signification physique.

S'il existe une distribution de probabilité universelle P(n) sur de tels nombres, ils doivent êtres

invariants sous un changement d'échelle tel que:

(7.501)

Si :

(7.502)

alors:

(7.503)

et la normalisation de la distribution donne:

(7.504)

si nous dérivons par rapport à nous obtenons :

(7.505)

en posant nous avons :

(7.506)

Cette équation différentielle a pour solution:

(7.507)

Cette fonction, n'est pas en premier lieu à proprement parler une fonction de distribution de

probabilité (elle diverge) et deuxièmement, les lois de la physique et humaines imposent des

limites.

Nous devons donc comparer cette distribution par rapport à une référence arbitraire. Ainsi, si le

nombre décimal étudié contient plusieurs puissance de 10 (10 au total: 0,1,2,3,4,5,6,7,9) la

probabilité que le premier chiffre non nul (décimal) soit D est donné par la distribution

logarithmique:

(7.508)

Les bornes de l'intégrale sont de 1 à 10 puisque la valeur nulle est interdite.

L'intégrale du dénominateur donne:

(7.509)

L'intégrale du numérateur donne:

(7.510)

Ce qui nous donne finalement:

(7.511)

De par les propriétés des logarithmes (voir le chapitre d'Analyse fonctionnelle) nous avons :

(7.512)

Cependant, la loi de Benford ne s'applique pas uniquement aux données invariantes par

changement d'échelle mais également à des nombres de provenant de sources quelconques.

Expliquer ce cas implique une investigation plus rigoureuse en utilisant le théorème de la limite

centrale. Cette démonstration a été effectuée seulement en 1996 par T. Hill par une approche

utilisant la distribution des distributions.

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome