¿Son igual de probables todos los dígitos en una distribución de datos?: Ley de Benford
Intentaré explicar el título. Como parte de mi trabajo, busco anomalías y realizo auditorías de sistemas de información. Buscando procedimientos originales y prácticos me encontré con la Ley de Benford.
Parece que cuando se tiene en cuenta el primer dígito distinto de cero de una distribución no es igual de probable que sea el 1, o que sea el 2,... siguen la siguiente distribución:
Dígito Prob.
1 0.30103
2 0.176091
3 0.124939
4 0.09691
5 0.0791812
6 0.0669468
7 0.0579919
8 0.0511525
9 0.0457575
De éste curioso efecto se dió cuenta el astrónomo y matemático Simon Newcomb, en 1881, cuando observó que las primeras páginas de los libros con tablas de logaritmos estaban más usadas que las últimas. Las primeras son las que el primer dígito significativo es 1.
Años más tarde (1938), Frank Benford, físico, observó el mismo fenómeno y realizó una comprobación empírica sobre un total de 20.229 números agrupados en 20 muestras. Datos sobre áreas fluviales, constantes y magnitudes físicas y químicas, funciones matemáticas e incluso números de direcciones de personas. A partir de los resultados del análisis de estos datos postuló una ley de los números anómalos.
Algunos ejemplos con datos actuales son:
Datos del censo:
Cantidades de transferencias reales:
Y otros muchos ejemplos que podéis encontrar, por ejemplo, en http://www.nigrini.com/Benford's_law.htm
Parece que se cumple bastante bien.
Esta ley permite localizar datos falsos en contabilidades, fraudes en elecciones, anomalías en distribciones, y un largo etc. Parece que el ser humano suele tender a usar más los dígitos 5 o 6 cuando se inventa cifras. Están más cercanas a la mitad.
El desarrollo matemático está en Benford´s Law, y a lo que sellega es que la probabilidad de que el primer dígito (decimal) sea D viene dado por:
Os paso un enlace de una herramienta java que permite verificar el grado de cumplimiento de la ley.
Por cierto, en la segunda temporada de la serie Numb3rs hay un capítulo cuyo argumento matemático es la Ley de Benford.
2 comentarios:
Como toda ley esta debe sujetarse a ciertas restricciones, por ejemplo la ley de la gravedad no se cumple en la superficie lunar. En el caso de la Ley de Benford por ejemplo debe cumplirse que dentro de los datos no exista restricciones de numeros minimos o maximos.
Me gustan mucho los números y por eso disfruto de aprender matematica y distintas materias que los utilicen. Hoy en dia estoy haciendo mucho uso de logaritmos y por eso busco aprender bien este tema
Publicar un comentario