Una sorprendente teoría matemática llamada Ley de Benford predice que un conjunto determinado de números, aquellos cuyos primer dígito es 1 aparecerán de forma más frecuentemente que los números que empiezan por otros dígitos. La distribución de los primeros dígitos es bastante asimétrica, la frecuencia esperada para números que empiezan por 1 es casi del 30%, para el es un poco más del 17%, para el 3 algo más del 12 % y para el resto disminuye en la misma frecuencia que ha aumentado la anterior.

Ésta ley establece que la probabilidad de que el primer dígito de una magnitud sea un dígito determinado “n” es

P(n)=Log10(1+1/n) = Log10(n+1) – Log10(n)    con n = 1,2,3,…9
(El cero no es significativo como primer dígito).

Podemos ver la tabla y gráfica de las probabilidades de ocurrencia de cada dígito en primera posición, y veremos que la unidad ocurre casi un tercio de las ocasiones, y el 9 no llega al 5%. Observamos también que es mucho más probable que el primer dígito sea impar (61%) que par (39%).

benford_1

benford_2

¿Se limita este curioso fenómeno al primer dígito?

No, realmente cada dígito tiene, en función de su posición (primero, segundo, …) una probabilidad de ocurrencia. Esto nos lleva a extender la fórmula dada anteriormente y generalizarla para cualquier conjunto de los “n” primeros dígitos,

P (n1n2 … nn) = log (1 + (1/n1n 2 … nn))

Es decir:

  • La probabilidad de que los dos primeros dígitos sean el el «3» y el «7» (37) es la fórmula log (1+(1/37)) = 1,16%;
  • La probabilidad de que los tres primeros dígitos sean el «2», «8» y «0» (280) es la fórmula  log(1+(1/280)) = 0,15%;

Se me ocurren varios ejemplos que expliquen el hecho de que el «1» como primera cifra sea más frecuente que los otros números, sacados de la vida real:

  • Comenzamos a contar desde 1 (1, 2, 3, …) hasta llegar al 9, momento en que cada cifra tiene la misma probabilidad. Pero de 10 a 19 sólo tenemos como primera cifra el 1, y sólo cuando llegamos al 99 todos las cifras tendrán la misma probabilidad de nuevo
  • Una explicación podría residir en el cambio de escala. Si todo el universo pasará al doble de tamaño del actual, todas las medidas que comiencen ahora por 1, pasarán a empezar por 2 o por 3. Aquellas que comenzaban por 2, por 4 o por 5 y así sucesivamente. Sin embargo, ahora empezarán por uno todos aquellos números que previamente empezaban por 5,6,7,8 y 9!
  • Supongamos que en correos hacen una estadística sobre los números de portal de los destinatarios de las cartas a nivel nacional, este es un típico conjunto de datos que cumple la ley de benford.
  • Imaginemos que en una ciudad se crea una calle nueva. esa calle empieza a llenarse de casas por un extremo y, la calle, va creciendo en longitud con el tiempo, los primeros portales asignados por el ayuntamiento serán el 1, 2, 3, 4 …. al principio, como se ve, las cifras más bajas tienen una probabilidad mayor de salir que las más altas. cuando llegamos al portal 9 la probabilidad se equilibra pero, en seguida, cuando se construye el edificio 10, la cifra «1» vuelve a tomar ventaja. cuando la calle tenga 19 casas todas las cifras habrán salido 2 veces menos el «1» que habrá salido 12 veces. este sesgo que hace que las cifras más bajas aparezcan más frecuentemente no se compensa nunca por lo que si elegimos una calle al azar, en el número más alto de portal de esa calle, es más probable que aparezcan «unos» que «cincos», en una proporción que tiende a la ley de benford.
  • En una ciudad artificial, que se hubiera construido racionalmente, con calles idénticas de 99 portales esto no ocurriría, pero la realidad es más compleja, y esta complejidad favorece a la ley de Benford.
  • Hay otro motivo matemático, es muy curioso ver como en distribuciones «normales», como las alturas de la gente o los CI, la ley de benford no es aplicable, aunque «reaparece» de repente si se recombinan con otros valores de forma aleatoria. Podemos decir que si un determinado fenómeno tiene n causas aleatorias y una de ellas sigue la distribución de Benford, la general también. La distribución de Benford es una especie de distribución que contamina a las demás. Así pues, cuanto más batiburrillo haya en la generación del fenómeno y más complejo e intratable sea, más fácil es que aparezca el 1 en primer lugar de los resultados obtenidos.

Durante muchos años la ley de Benford no ha sido más que una curiosidad estadística sin fundamento matemático ni aplicaciones reales. Actualmente, la ley de Benford, está firmemente basada en la teoría de la probabilidad, goza del interés del público general y presenta importantes aplicaciones, como por ejemplo:

  • Detección de irregularidades en Auditorias Internas
    El Análisis de Frecuencia Digital ha surgido en los últimos años como una potente herramienta analítica en la detección de irregularidades y fraudes, y en la categorización de grupos, sucursales, áreas o cuentas de riesgo. Se trata de un análisis cada vez más utilizado por las Direcciones de Auditoria Interna más modernas, en la lucha contra el fraude.
  • Distribuir espacio del disco duro
    Se podría ahorrar tiempo, dinero y medios si los sistemas informáticos se manejaran de forma más eficaz. Por ejemplo, para optimizar el acceso a espacio de almacenamiento en los ordenadores podemos ubicar juntos los números de acuerdo a las proporciones determinadas por la ley pues serán los datos más accedidos. Un equipo de Friburgo,  Alemania,  está trabajando en la idea de distribuir espacio del disco duro según la Ley de Benford.

 

×
A %d blogueros les gusta esto: