La paradoja del cumpleaños

¿Cómo dirías que es la probabilidad de que en un grupo de 23 personas dos de ellas celebren su cumpleaños el mismo día? Pues ahora calcúlala. ¿Coincide tu intuición con lo que dicen las matemáticas?

¿Cuántas personas necesitamos reunir para que dos de ellas coincidan en el día de su cumpleaños con una probabilidad mayor del 50%?. Piensa en una cifra antes de seguir leyendo.

Enunciado de la paradoja

La paradoja del cumpleaños establece que si hay 23 personas reunidas hay una probablidad del 50,7% de que al menos dos personas de ellas cumplan años el mismo día. Para 60 o más personas la probabilidad es mayor del 99%. Obviamente es casi del 100% para 366 personas (teniendo en cuenta los años bisiestos).

En sentido estricto esto no es una paradoja ya que no es una contradicción lógica; es una paradoja en el sentido que es una verdad matemática que contradice la común intuición. Cuando se propone este problema por primera vez y se pide una estimación sobre el tamaño mínimo que debería tener un grupo para que sea más probable que improbable que dos personas compartan el día del cumpleaños, la mayoría de las personas se equivoca por completo.
La respuesta intuitiva que se da a menudo es 183, es decir 365 dividido entre dos. La cantidad correcta no es algo a lo que la gente pueda llegar fácilmente y, ciertamente, no por intuición. Es bastante extraño que las primeras estimaciones sean inferiores a 40. Y sin embargo la respuesta es 23..

La clave para entender estas "sorprendentes" recurrencias es pensar que hay muchas posibilidades de encontrar parejas que cumplan años el mismo día.
Un análisis superficial asume que 23 días (cumpleaños de las 23 personas) es una fracción demasiado pequeña del posible número de días distintos (365) para esperar repeticiones. Y así sería si esperáramos la repetición de un día dado. Pero las repeticiones, en el caso supuesto, pueden darse entre dos días cualesquiera, con lo que éstas pueden combinarse entre sí de un número de formas que aumenta rápidamente con el número de elementos a considerar. Así:

  • Entre dos personas C1 y C2 sólo cabe una posibilidad de repetición de cumpleaños: Cl=C2.
  • Con tres ya hay tres posibilidades (Cl=C2; Cl=C3; C2=C3)
  • .
  • Con cuatro ya habría seis, (4x3)/2=6 .
  • Con un grupo de 10 personas, (10x9)/2=45 posibilidades
  • Con 23 personas, hay (23×22)/2 = 253 parejas distintas, cada uno de ellas es una candidata potencial para cumplir la paradoja
  • Y así sucesivamente, en uno de 40, ya son 780 las parejas, y 1770 si juntamos 60 personas.

No hay que malinterpretar lo que nos dice esta paradoja: Si entramos en una habitación con 22 personas, la probabilidad de que cualquiera cumpla años el mismo día que usted, no es del 50%, es mucho más baja, sólo hay un 6% de probabilidades. Esto es debido a que ahora sólo hay 22 parejas posible y se necesitan 253 personas para que haya más de un 50% de probabilidades de que esto ocurra.
El problema real de la paradoja del cumpleaños consiste en preguntar si el cumpleaños de cualquiera de las 23 personas coincide con el cumpleaños de alguna de las otras personas.

Ejemplos de coincidencias

  • En los jugadores del Osasuna (liga 2005/06) hay coincidencias de cumpleaños
  • De un total de sólo 19 monarcas españoles desde los reyes Católicos, coinciden Carlos II con Carlos IV (11 de noviembre) y José I con Juan Carlos I (5 de enero).
  • De los 40 presidentes de USA hasta Reagan: Polk y Harding nacieron un 2 de noviembre.

Puedes creer que esto puede ser casualidad o si eres mal pensado que esta preparado, por eso nada mejor que hacer un estudio probabilístico riguroso de esta paradoja

Estimación de la probabilidad

¿Cuál es la probabilidad de que en un grupo de n personas, por lo menos dos de ellas coincidan en su cumpleaños?, desechamos los años bisiestos y los gemelos, y asumimos que existen 365 cumpleaños que tienen la misma probabilidad.

Solución utilizando la regla de Laplace y la Combinatoria

El truco es calcular primero la probabilidad de n personas tengan cumpleaños diferentes

Sea el suceso A = {"al menos dos personas celebran su cumpleaños a la vez"} y su complementario                       Ac = {"no hay dos personas que celebren su cumpleaños a la vez"}

Caso particular: n=5

El número de casos posibles de celebración de cumpleaños, suponiendo el año de 365 días, es:
3655 = 6,478 × 10 12

El número de casos favorables : como la primera de las personas puede haber nacido uno de los 365 días del año, la siguiente unos de los 364 días restantes y así sucesivamente, resultan 365 × 364 × 363 × 362 × 361 = 6,303 × 10 12 casos de que no existan dos personas que hayan nacido el mismo día .
Aplicando la regla de Laplace

P(Ac) =casos favorables/casos posibles =6,303 / 6,478 = 0,973

p(A) = 1 - p(Ac) = 1 - 0,973 = 0,027

El problema puede generalizarse para una reunión de n personas. La probabilidad de que al menos dos de ellas cumplan años el mismo día es:

Para n = 23, 30 y 50 la probabilidad mencionada es: 0.51, 0.71 y 0.97 respectivamente. Como se ve, para n = 23 existe, aproximadamente, una probabilidad a la par que por lo menos coincidan dos cumpleaños, y cuando n= 50, tenemos casi la certeza de que ocurrirá la coincidencia

Numérica y gráficamente, las posibilidades de que distintos grupos de personas compartan cumpleaños son las siguientes:

n prob   n prob
5 0.027 30 0.706
10 0.117 35 0.814
15 0.253 40 0.891
18 0.347 50 0.970
20 0.411 60 0.9951
23 0.507 70 0.99916
25 0.569 80 0.99991
27 0.627 90 0.99999





Solución utilizando la regla de Laplace y la regla del producto

Otra manera de plantear el problema para que la solución no parezca tan sorprendente es que si se juntan 23 personas en una habitación, calculamos las opciones de que no compartan cumpleaños.

  • Supongamos que está solo en una habitación. Las opciones de que todos los de la habitación tengan un cumpleaños diferente son obviamente del 100% o, en el lenguaje de probabilidad,1.
  • Ahora entra otra persona. Las probabilidades de que tenga un cumpleaños distinto del nuestro son 364/365 (Vamos a ignorar los años bisiestos en este cálculo), o 0,9973, que es lo mismo que el 99,73%.
  • Entra un tercero. La probabilidad de que esa persona tenga un cumpleaños distinto del de usted y del segundo es 363/365. La probabilidad de que los tres tengan cumpleaños diferentes es 364/365 veces 363/365, o 0,9918.
  • Así que las opciones de que 23 personas tengan distintos cumpleaños son 364/365 * 363/365 * 362/365 x 361/365 x ... x 343/365, que da como resultado 0,493. Esto significa que hay un 49,3% de posibilidades de que todos los de la habitación tengan cumpleaños diferentes y, a la inversa, un 50,7% de posibilidades de que al menos dos compartan cumpleaños.

En contraste, la probabilidad que cualquiera en una habitación de n personas tengan el mismo día de cumpleaños que usted está dada por

que para n = 23 sólo da alrededor de 0,061, y se necesitaría al menos una n de 253 para dar un valor de 0,5.

Otra versión de la paradoja

Esta paradoja reviste multiples formas. Con la siguiente puedes ganar varias apuestas:
Esperar si se repiten las dos últimas cifras de la matrícula en quince automóviles anotados al azar. La probabilidad es ahora de 0,67: ganaré dos de cada tres veces, pero ganaría, como antes, en cinco de cada seis tomando diecinueve matrículas en vez de quince.

La explicación es análoga a la anterior.

El procedimiento más cómodo para calcular la probabilidad de repetición es considerar la contraria. La probabilidad de no repetición entre dos matrículas, según el teorema de las probabilidades compuestas, será:

p2 = 99/100

Ya que la segunda matrícula puede "optar" entre 99 casos favorables sobre 100 para no repetirse.En el caso de tres matrículas:

Para las 15 matrículas :

Por lo que la probabilidad de que haya al menos una repetición: q15 = 1 - 0,3313 = 0,6687

Para un número mayor de repeticiones, la probabilidad aumenta rápidamente. Así:

     q20= 0,87 ;     q25= 0,96 ;    q30= 0,99 ;

Es decir, que un número de matrículas igual al cuarto de las posibles garantiza prácticamente la repetición.

Curiosidad: al estudiar estas dos versiones de esta paradoja hemos podido combrobar que:
Cuanto mayor es el número de casos posibles considerados, menor es en términos relativos el número de elementos que hay que comparar entre sí para garantizar repeticiones

  • El número de matrículas que habría que ir cotejando para que la probabilidad de alguna repetición fuera al menos 0,50 (¡el punto donde la apuesta sería equitativa!), sería 13, lo que supone un 13 % del número de matrículas posibles
  • Sin embargo, para el caso del cumpleaños, ya vimos que esta probabilidad se alcanzaba para 23 personas, lo que, respecto a las 365 fechas posibles, supone sólo un 6,3 %.

Simulaciones de la paradoja

Simulación con Excel:

En Excel podemos generar número aleatorios con la función ALEATORIO.ENTRE(Valor inferior; Valor superior). Mira este sencillo ejemplo de Simulación con Excel», actualiza los datos todas las veces que creas necesario para poder aproximarte a la probabilidad de que en grupo de 23, 50 o 75 personas, haya coincidencias en cumpleaños. También puedes ver, en la hoja solución, la probabilidad de que en un grupo de "n" no haya coincidencia de cumpleaños


Simulaciones, en la red, con applet de Java (en inglés):

  • Un magnifico applet de Java: genera una lista al azar de cumpleaños repetidas veces, tu puedes elegir el tamaño del grupo (por defecto es 15). Te permite generar listas de 1 en 1 o de 100 en 100 con la ventaja de que como va acumulando los resultados de coincidencias, calcula la probabilidad frecuentista del experimento. Y de paso va marcando los puntos de la gráfica que relaciona el número de personas de un grupo y la probabilidad de que haya coincidencias de cumpleaños .
  • Random Birthday Applet simula al azar listas de días del año y anota coincidencias.

MINIQUEST

PowerPoint

Aplicaciones prácticas

La paradoja del cumpleaños tiene aplicaciones prácticas en el campo de la criptografía y la estadística. Nos indica, por ejemplo que para generar colisiones en una función aleatoria perfecta (en particular, funciones hash) de n bits, con una probabilidad del 50% aproximadamente, se requieren solo 2n/2 intentos.