Si lanzo una moneda (cara o cruz) 1,000,000 de veces, ¿no debería la fracción de cara y cruz aproximarse al 50% por igual?

La probabilidad de observar cualquier número particular de caras (o colas) en cualquier prueba de este tipo viene dada por la distribución binomial (ver http://en.wikipedia.org/wiki/Bin … especialmente la sección titulada “Probability Mass Function ” ) Exactamente 500,000 cabezas es el resultado de mayor probabilidad (¡aunque la probabilidad exacta es extremadamente pequeña!), Pero hay una probabilidad distinta de cero de observar entre 0 y 1,000,000 cabezas en cualquier prueba en particular.

Una forma diferente de ver esto es decir que está repitiendo una prueba de 10 vueltas 100,000 veces. Ver cómo se desarrolla el proceso de esta manera puede ser esclarecedor y, además, los números son más fáciles de calcular (los coeficientes binomiales para n = 1,000,000 requieren algunos métodos numéricos de engaño). Cuando haya terminado, esperaría tener (todos los números redondeados a enteros enteros) 98 pruebas con 0 cabezas, 977 pruebas con 1 cabeza, 4395 pruebas con 2 cabezas, 11719 pruebas con 3 cabezas, 20508 pruebas con 4 cabezas, 24609 pruebas con 5 caras, luego retrocediendo simétricamente hacia abajo para 6,7, etc. Es muy probable que los recuentos reales se reduzcan en cierto grado, pero si la moneda es justa, los números estarán bastante cerca. Cuantas más pruebas realice, más probable es que sus recuentos converjan en las proporciones proporcionadas por la distribución binomial. Visualmente, si representa gráficamente los recuentos en un histograma, a medida que avanza de 10 a 100 a 1000 repeticiones de prueba, el gráfico se acercará cada vez más a la forma exacta dada por el binomio.

Esta es una pregunta estándar de mecánica estadística que todos reciben en su primera tarea. (¡Seguro que espero hacerlo bien!)

Entonces, digamos que estamos lanzando una moneda [matemática] N [/ matemática] veces. La probabilidad de obtener cabezas [matemáticas] m [/ matemáticas] viene dada por la distribución binomial que se escribe como
[matemáticas] P (m) = {N \ elegir m} 2 ^ {- N} [/ matemáticas]
y es igual a
[matemáticas] P (m) = \ left (\ frac {1} {2} \ right) ^ {N} \ frac {N!} {m! (Nm)!} [/ Matemáticas].
Tenga en cuenta que, dado que esta es una moneda justa, la probabilidad de obtener caras [matemáticas] m [/ matemáticas] es la misma que la probabilidad de obtener colas [matemáticas] m [/ matemáticas] (que es [matemáticas] Nm [/ matemáticas] cabezas).

Para ver qué tan favorable es obtener 50% de caras y 50% de colas, consideremos expandir alrededor de 50% de caras y colas usando
[matemáticas] m = \ frac {1} {2} N + n [/ matemáticas]
La distribución binomial da
[matemáticas] P (N / 2 + n) = \ frac {N!} {(N / 2 + n)! (N / 2 -n)!} 2 ^ {- N} [/ matemáticas]
Esto no parece particularmente esclarecedor con todos esos símbolos factoriales flotando. Dado que estamos considerando muchas caras y colas, nos gustaría aproximar los factores usando funciones simples. La aproximación apropiada se llama fórmula de Stirling y viene dada por
[matemáticas] \ log N! = N \ log N -N + O (\ log N) [/ math]
que da (después de un poco de álgebra)
[matemáticas] P (N / 2 + n) \ simeq \ sqrt {\ frac {2} {\ pi \, N}} \ exp (-2n ^ 2 / N) [/ matemáticas]
Esta distribución de probabilidad es una distribución normal (el teorema del límite central levanta su cabeza) con una variación de [math] \ sigma = \ sqrt {N} / 2 [/ math]
La normalización de la distribución normal vendrá de los términos [matemática] O (\ log N) [/ matemática] en la aproximación de Stirling.

La probabilidad de obtener exactamente medias caras y medias colas para una moneda perfectamente justa es
[matemáticas] P (N / 2) = \ sqrt {\ frac {2} {\ pi \, N}} [/ matemáticas]
que es 0.08% para N = 1,000,000.

La mejor manera de determinar si una moneda es justa es decir qué rangos de caras y colas corresponden a una moneda justa. Con [matemática] N = 10 ^ 6 [/ matemática], una moneda justa probablemente dará el 67% de las veces si lanza una moneda 1000000 veces, los resultados darían entre 499,500 y 500,500 caras o colas. Para un poco más de margen, obtienes una confianza mucho mayor, por lo que si quieres determinar que una moneda es justa el 99.7% del tiempo, los resultados estarán entre 498,500 y 501,500.