LEY DE BENFORD
los números suelen comenzar más frecuentemente por «1» que por cualquier otro dígito
Historia
Quien primero se dio cuenta de este fenómeno fue en 1881 el matemático y astrónomo Simon Newcomb. Un día, Newcomb estaba usando un libro de logaritmos y se dio cuenta de que las páginas del libro estaban más viejas y usadas cuanto más cercanas estaban del principio. Ten en cuenta que por aquella época, las tablas de logaritmos eran el libro de cabecera de cualquier manipulador de cifras, se empleaban, entre otras cosas para multiplicaciones entre grandes números. Actualmente equivaldría a examinar el desgaste de la tecla "1" en cajas registradoras o calculadoras ¿A qué se debía? Sólo podía tener una explicación: a lo largo de los años había consultado mucho más el logaritmo de los números que comenzaban por 1 que de los que comenzaban por números más altos.
Nuestro astrónomo dedujo que los dígitos iniciales de los números (al menos los utilizados en su trabajo que provenían de la observación de los astros principalmente) no son equiprobables sino que el 1 aparece como dígito inicial más frecuente seguido del 2 etc. hasta el 9 que es el menos frecuente . Mediante un breve e ingenioso razonamiento, aunque sin presentar realmente un argumento formal ni fórmula matemática, Newcomb enunció verbalmente una relación o ley logarítmica: “la ley de probabilidad de ocurrencia de números es tal que las mantisas de sus logaritmos son equiprobables”.
El asunto fue rápidamente olvidado hasta 1938,
cuando Frank Benford, un físico de la compañía
General Electric, se dio cuenta del mismo patrón. Entusiasmado
por el descubrimiento, estudió 20.229 números provenientes
de 20 muestras de todo tipo: constantes y magnitudes físicas,
longitudes de ríos, estadísticas de béisbol, direcciones de
personas... incluso cifras sacadas de portadas de revistas.
A partir de los datos extraídos del mundo real, comprobó que
la probabilidad de que un número en una serie de datos comience
por el dígito d es de P[d] = log(1 + 1/d)
y postuló la llamada "ley de los números anómalos
de Benford". Según dicha ley la probabilidad
de que en una serie de muchos datos el primer digito de un
número sea 1 es del 30%, 17,6% para un 2, 12'5% para el 3
y así va decreciendo...
El análisis de Benford era una prueba de la existencia de
la ley, pero tampoco fue capaz de explicar bien por qué era
así.
El primer paso para explicar esta curiosa relación lo dio Roger Pinkham en 1961, un matemático de New Jersey. El razonamiento de Pinkham era el siguiente. Supongamos que realmente existe una ley de frecuencias de dígitos. En tal caso dicha ley debería ser universal. Tanto si calculamos los precios en euros, dólares, dinares o dracmas, o si medimos la longitud en pulgadas o metros, las proporciones de frecuencias de dígitos deberían ser las mismas. Es decir, Pinkham afirmaba que la distribución de las frecuencias de dígitos debía ser invariante frente a cambios de escala. Luego demostró que si una ley de frecuencias de dígitos era invariante frente a la escala, entonces se trataba de la Ley de Benford . La prueba aportada iba confirmando que la Ley de Benford realmente existe.
A pesar de que la ley resultaba obvia con sólo hacer algunas comprobaciones sencillas – siempre que el conjunto de datos fuera válido, porque no todos lo son. No fue hasta 1996 que un matemático llamado Ted Hill dio con una demostración matemática satisfactoria. La demostración tiene que ver con algunos teoremas del límite central y su relación con el comportamiento de las mantisas en las multiplicaciones de valores aleatorias.
La Ley de Benford es indudablemente un resultado interesante y sorprendente, pero ¿cuál es su relevancia? Un gran paso lo ha dado el Mark Nigrini, un profesor de contabilidad de Dallas, quien propone a partir de 1994 emplear el análisis de las frecuencias de los dígitos como mecanismo analítico para detectar posibles situaciones de fraude e irregularidades. Inicialmente lo aplico al estudio de datos fiscales y recientemente ha creado un programa en java para detectar en qué medida algunos datos suministrados encajan con la Ley de Benford.