He quemado 200 discos y quiero asegurarme de que estén en perfecto estado de funcionamiento. ¿Cuál es la muestra de tamaño más pequeño que podría probar para tener una confianza relativamente alta de que el 98% de todos los discos están bien / grabados correctamente?

Lamento decir que creo que las otras respuestas aquí son incorrectas, demasiado complicadas, errónea y frustrantemente doctrinarias, ¡o las tres!

Daré lo que creo que son las soluciones y luego expresaré brevemente mi frustración en la parte inferior.

Hay dos formas populares de abordar este tipo de problema:

1) Nos ponemos en el lugar del gerente de fábrica de la planta de duplicación de CD. Nuestra tarea es diseñar un procedimiento de prueba que intente rechazar cada lote de 200 CD con cinco o más errores (“lotes malos”), mientras se aprueban lotes con cuatro o menos errores (“lotes buenos”). Asumimos que podemos probar cualquier CD en particular perfectamente.

Digamos que el procedimiento tiene que ser 95% exacto, lo que significa que la fábrica solo puede aprobar por error un lote malo con una probabilidad de 5% como máximo. Elaboramos un procedimiento para probar N CD seleccionados al azar sin reemplazo (lo que significa que los N CD son distintos) del lote. Si todos los N son buenos, aprobamos el lote; de ​​lo contrario, lo rechazamos.

Pregunta : ¿Qué tan grande debe ser N para que la posibilidad de aprobar por error un lote incorrecto sea inferior al 5%?

El gerente de la fábrica razona de la siguiente manera:

  • Primero pensemos en la probabilidad de que SI todo el lote contenga CD “A” buenos y “B” malos, nuestra muestra de prueba aleatoria encontrará “a” CD buenos y “b” malos.
  • Esto será una fracción: el denominador es el número total de formas de organizar todo el lote (de CD A + B) y el numerador es el número total de formas de organizar la muestra multiplicada por el número total de formas de organizar el lote. resto del lote
  • Hay [matemáticas] A + B \ elija B [/ matemáticas] formas de organizar todo el lote, así que ese es el denominador.
  • Hay [matemáticas] a + b \ elegir b [/ matemáticas] formas de organizar la muestra.
  • Hay [matemáticas] (Aa) + (Bb) \ elegir formas Bb [/ matemáticas] para organizar la parte del lote que no es parte de la muestra.
  • Entonces, en conjunto, la probabilidad de obtener nuestra muestra {a, b} dado que la composición de todo el lote es {A, B} es: [matemática] P_ \ ell (a, b | A, B) = { {{a + b \ elegir b} {A – a + B – b \ elegir B ​​- b}} \ over {A + B \ elegir B}} [/ math].
  • Ahora que conocemos esta probabilidad, solo necesitamos encontrar la N más pequeña de tal manera que [matemática] P_ \ ell (N, 0 | 195,5) <5 \% [/ matemática].

Respuesta : 90 . Un procedimiento que muestrea 90 CD y aprueba el lote solo si encuentra cero problemas tendrá una probabilidad de 1854417/38418940 = 4.83% de aprobar por error un lote con cinco CD defectuosos. Eso cumple con nuestras limitaciones. La fábrica puede afirmar que ha verificado que el lote es bueno (es decir, cuatro o menos CD defectuosos) con un “95% de confianza”. Por supuesto, obtienes una N diferente si tienes un umbral diferente para la confianza que deseas tener.

(Nota al margen: puede preguntar, ¿qué pasa con el riesgo de rechazar por error un buen lote? Esto también es algo de lo que podemos preocuparnos e intentar optimizarlo. El procedimiento de prueba anterior funcionará muy bien si el lote no tiene CD defectuosos, pero si el lote tiene cuatro CD defectuosos y queremos aprobar el lote como deberíamos, solo lo haremos el 9% del tiempo, lo que significa que rechazamos por error el 91% de los lotes con cuatro CD defectuosos. Podríamos mejorar esto usando un procedimiento de prueba adaptativo Por ejemplo, el procedimiento es que probamos 100 CD. Si ninguno es malo, lo aprobamos. Si más de uno es malo, lo rechazamos. Pero si exactamente 1 de cada 100 fue malo, entonces volvemos y probamos otros 65 CD y aprobamos todo el lote si no más de 1. son incorrectos. Este procedimiento aún cumple con la restricción de rechazo original del 95% para lotes incorrectos, y todavía se comporta de manera idéntica para lotes sin CD defectuosos. Pero para lotes marginales (pero aún buenos), tiene un mayor tasa de aprobación, a costa de tener que probar más CD a veces. Si estamos dispuestos a hacer una suposición Sin embargo, el comportamiento de la grabadora de CD, por ejemplo, que tiene días muy buenos y días muy malos y no tenemos que preocuparnos por casos marginales como distinguir B = 4 [bueno] de B = 5 [malo], todavía podemos hacerlo mejor.)

2) La segunda forma popular de abordar este tipo de problema es ponernos en el lugar del cliente de la fábrica que acaba de recibir su entrega. Ahora no estamos interesados ​​en diseñar un procedimiento que rechace cada lote malo con al menos un 95% de probabilidad; queremos calcular la probabilidad de que nuestro lote en particular sea ​​malo.

El cliente razona de la siguiente manera:

  • “Digamos que la fábrica tiene una máquina que escupe lotes de 200 CD con B malos y A buenos, donde B se extrajo de alguna distribución de probabilidad y A + B = 200”.
  • Supongo que B se dibujó de manera uniforme entre 0 y 200 inclusive. En otras palabras, la máquina de la fábrica es realmente desordenada y es probable que me envíen un lote con 3 CD buenos y 197 malos como 3 CD malos y 197 ¡Buenos!”
  • “Ahora pruebo N CD distintos de mi lote. Cada vez que ejemplifico un CD y encuentro que es bueno, calculo la nueva distribución de probabilidad condicional en B dada mi observación”.
  • “Debido a mi suposición (subrayada anteriormente), antes de poner el ejemplo del primer CD, comenzaré con una probabilidad condicional de 5/201 de que B es menor que 5. Entonces, antes de cualquier prueba, mi probabilidad condicional de que esto es un lote malo es 97.5% “.
  • ¿Cuál es la distribución de probabilidad condicional de B después de N sorteos? Es solo [math] P_ \ ell () [/ math] desde arriba, normalizado para que la suma sobre todos los valores posibles de B sea igual a la unidad. (Esta es la aplicación del teorema de Bayes).
  • En términos matemáticos, eso significa que la probabilidad condicional de tener CD “A” bueno y “B” malo en todo el lote, dada una muestra de CD “a” bueno y “b” malo, es: [matemática] P (A , B | a, b) = \ frac {P_ \ ell (a, b | A, B)} {\ sum_ {i = 0} ^ {A + B} P_ \ ell (a, b | A + Bi, i)} [/ matemáticas]

Pregunta : ¿Cuántos CD perfectos tendría que examinar el cliente en una fila antes de que la probabilidad condicional de un lote malo caiga por debajo del 5% (recuerde que comienza en el 97.5%)?

Respuesta: 89 . Una vez que el cliente ha probado 89 CD perfectos seguidos, la probabilidad condicional de un lote incorrecto es 1294593/26266010 = 4.93%. El cliente puede afirmar que tiene “probabilidad del 95%” de que el lote es bueno (es decir, cuatro o menos CD defectuosos), dada la observación y la suposición subrayada. Por supuesto, obtendrá un número diferente si tiene un umbral diferente de cuán probable debe ser un buen lote.

===========================

Por qué esta pregunta fue frustrante:

Esta es una pregunta de probabilidad de variedad de jardín con una solución simple, una vez que aclaras lo que quieres decir matemáticamente con “razonablemente seguro”.

El enfoque n. ° 1 corresponde a los métodos estadísticos tradicionales que se perfeccionaron a principios del siglo XX. La gente a veces llama a este enfoque “frecuente”. Conduce a “valores p” e “intervalos de confianza”.

El enfoque n. ° 2 es lo que la gente llama un enfoque “bayesiano”. Aunque ridiculizado durante parte del siglo XX como “probabilidad inversa” extraña, este tipo de técnicas han resultado ser muy útiles para una amplia variedad de problemas. Conduce a “intervalos de credibilidad”. El enfoque n. ° 2 es el mismo que el recomendado por Anon User (y la fórmula aquí obtiene los mismos números que esa respuesta).

Es bueno notar que:

  • Los dos enfoques están tratando de lograr cosas diferentes . # 1 es la respuesta desde la perspectiva del gerente de la fábrica que quiere proponer un procedimiento para poner un límite superior a la tasa de aprobaciones falsas. # 2 es la respuesta desde la perspectiva del cliente de la fábrica que quiere calcular la probabilidad de un lote malo.
  • En general, ninguno de los enfoques satisfaría las limitaciones exigidas por el otro usuario.
  • Para este problema, los dos enfoques tuvieron dificultades similares en la práctica.
  • Los dos enfoques no están en desacuerdo con la “definición de probabilidad” o la “interpretación de probabilidad” o algo así. Ambas respuestas pueden derivarse matemáticamente dentro del marco de los axiomas de probabilidad.
  • El Enfoque n. ° 1 trata de cumplir una restricción para cada lote incorrecto (ya sea que tenga 5 CD defectuosos o 85 CD defectuosos): la probabilidad de aprobación debe ser inferior al 5%. Es una restricción “para todos”. No hace suposiciones sobre qué número de CD defectuosos es más o menos probable.
  • Por el contrario, el enfoque n. ° 2 tenía que suponer sobre la distribución de los CD defectuosos antes de comenzar a examinar. Asumimos una distribución uniforme aquí, pero podríamos acomodar fácilmente una suposición diferente. Cuantos más CDs examinemos, menos importa cuál sea nuestra suposición inicial: los datos comienzan a abrumar la creencia inicial.
  • A pesar de todas esas diferencias, la conclusión es que los dos métodos tienen prácticamente la misma respuesta a este problema. El procedimiento del gerente de la fábrica tendría que examinar 90 CD perfectos seguidos para tener un 95% de confianza de que el lote es bueno. El cliente tendría que examinar 89 CD perfectos seguidos para poner la probabilidad condicional de un buen lote al 95%.

Para más información: ¿Cuál es la diferencia entre estadísticos bayesianos y frecuentistas?

http://stats.stackexchange.com/q…

Es por eso que la noción de Anon de que el problema “exige un análisis bayesiano” y es “la forma” en que “debería” abordarlo me llevó a la distracción. Lo que debe calcular depende de quién es y qué quiere lograr. (¿Anon realmente piensa que las estadísticas clásicas no tienen forma de resolver estos problemas simples?)

A veces la gente trata el “bayesianismo” como si fuera una especie de religión o deporte de equipo, y no es ninguna de esas cosas.

El teorema de Bayes es un teorema elemental de teoría de la probabilidad, derivable en unos pocos pasos de los axiomas. No depende de nuestra lealtad a una escuela de análisis u otra.

La noción de que el problema “exige” un enfoque en particular cuando las dos respuestas son casi idénticas es demasiado doctrinaria. Un enfoque “bayesiano” no es una forma mágica de agregar más sofisticación a un análisis y convertir los malos datos en buenos. Todavía somos esclavos de los datos, y si tenemos suficiente, casi no importa cómo hacemos el análisis.

===

Respuesta al anónimo bayesiano:

Gracias por su respuesta. No estamos de acuerdo un poco cuando dice: “El enfoque frecuentista no incorpora ningún conocimiento de fondo. […] si desea incorporar su conocimiento de fondo, un enfoque bayesiano es la única alternativa viable”.

Esto no es exactamente correcto y, en cualquier caso, “incorporar conocimientos básicos” no es un beneficio en sí mismo. La pregunta es qué le importa y, dado eso, si su conocimiento previo cambia la respuesta. Considere su argumento aplicado a la teoría de la complejidad:

  • “El peor tiempo de ejecución de QuickSort estándar es [matemática] O (n ^ 2) [/ matemática] comparaciones en el número de entradas”. Declaración verdadera.
  • “Si asume que todas las permutaciones son igualmente probables como entrada, entonces el tiempo de ejecución promedio en caso de QuickSort estándar es [matemáticas] O (n \ log n) [/ matemáticas] comparaciones en el número de entradas”. También es cierto
  • “Si asume una distribución de probabilidad diferente como su conocimiento previo, obtendrá un análisis de caso promedio diferente. Pero la única forma en que una distribución de probabilidad puede afectar el análisis de caso más desfavorable es si asigna un subconjunto de permutaciones como imposible. Simplemente hacerlos improbables no afectará el análisis del peor de los casos “. Correcto.
  • “El análisis de caso promedio se ve afectado por más tipos de cambios en el conocimiento de fondo que el análisis de caso más desfavorable: debe establecer alguna entrada a probabilidad cero antes de que pueda afectar el peor caso”. Cierto.
  • “El análisis del caso promedio es superior al análisis del peor de los casos porque el enfoque del peor de los casos no incorpora conocimiento de fondo. Si desea incorporar el conocimiento de fondo sobre la distribución de probabilidad en las entradas, el análisis de caso promedio es la única alternativa viable”. ¡Aquí no puedo estar necesariamente de acuerdo!

El análisis del caso promedio y el peor de los casos no son inherentemente mejores o peores que el otro, y es una tontería decir que el caso promedio es mejor porque solo “incorpora” su opinión sobre la probabilidad de entradas. (Donde “incorpora” significa que esto afecta la respuesta). A veces te importa el promedio y a veces te importa el peor de los casos, y dependiendo de cuál sea, tu conocimiento de fondo puede ser más o menos relevante. ¡Esa no es una fuerza o debilidad inherente!

Un intervalo de confianza o valor p es una técnica del peor de los casos : el valor p es un límite superior absoluto en la tasa de falsos positivos que tendríamos que tolerar para llevar a casa un resultado positivo en este caso. La única forma en que puede afectar eso con su “conocimiento de fondo” es configurando algunas entradas para que tengan probabilidad cero, de modo que nuestro “límite superior” no necesite unirlas.

Por el contrario, un intervalo de credibilidad se está integrando sobre el anterior, y en ese sentido es un análisis de caso promedio.

Tampoco puedo estar de acuerdo con su comentario de que “Un análisis bayesiano muestra la verdadera posibilidad de tener la enfermedad”. (énfasis mío) ¡Esto podría ser algo traicionero de creer! Ningún análisis puede decirle la “verdadera” posibilidad de que un paciente que elige hacerse una prueba de diagnóstico tenga una enfermedad, solo la probabilidad condicional (probabilidad a posteriori), dada la observación y dada la probabilidad previa que suponemos que es precisa.

La respuesta solo es “verdadera” si lo anterior es correcto , lo que en la vida real no es algo que podamos saber.

Creo que para hacer su afirmación matemáticamente precisa, tendríamos que decir: “Un análisis bayesiano muestra la verdadera posibilidad de tener la enfermedad, siempre que conozcamos la tasa general de la enfermedad con una precisión perfecta Y que el paciente haya sido seleccionado al azar con uniforme probabilidad de la población sobre la cual se ha establecido la tasa (es decir, que el paciente no ha sesgado la probabilidad al tener alguna razón para elegir realizar la prueba) “.

Eso es un poco diferente.

nota: estoy agregando una respuesta a Keith Winstein en la parte inferior .

Depende de qué más sepas. Sin embargo, como referencia, 50 discos rectos buenos serían una fuerte evidencia de que al menos el 98% son buenos.

Este problema exige un análisis bayesiano. Así es como lo haces:

  1. Identifique una variable [matemática] n [/ matemática] para probar. Aquí, [math] n [/ math] es la cantidad de discos defectuosos
  2. Adivine la distribución de probabilidad de [matemáticas] n [/ matemáticas]. Esto se llama el “previo”.
  3. Si su distribución da mucha confianza de que [math] n \ leq4 [/ math], deténgase.
  4. Elija un disco aleatorio y vea si está en perfecto estado de funcionamiento.
  5. Use el teorema de Bayes para actualizar su distribución de probabilidad para [math] n [/ math].
  6. Regrese al paso 3.

Necesitará una definición de “alta confianza”, que elija usted mismo. También deberás elegir un previo, que también eliges por ti mismo en función de tu conocimiento general del proceso que creó los discos.

¿Por qué deberías hacerlo de esta manera?

Considera el juego de carnaval con una rueda que giras. El resultado puede tener uno de dos resultados: ganar o perder. Ves a 10 personas jugar y solo tres ganan. ¿Cuál es su mejor estimación de la probabilidad de que gane la undécima persona que ve jugar?

Ahora considere sacar un cuarto de su bolsillo. Lo volteas 10 veces y obtienes solo tres cabezas. ¿Cuál es su mejor estimación de la probabilidad de que el 11º lanzamiento sea cara?

Si eres como la mayoría de las personas, se te ocurrieron diferentes respuestas a los dos escenarios, a pesar de que los datos cuantitativos recopilados son los mismos. La razón es que entras en los escenarios con diferentes conocimientos previos. A priori, no sabes nada sobre el juego de carnaval, excepto que el propietario probablemente no quiere que la gente gane demasiado. Sin embargo, es muy probable que la moneda esté cerca de 50/50 porque ya ha lanzado muchas monedas antes y es de conocimiento común que las monedas son bastante justas.

Una vez que decida que lo que debe hacer es comenzar con su conocimiento previo y usar los resultados de los experimentos para actualizar ese conocimiento, matemáticamente la forma de llevarlo a cabo es con el teorema de Bayes.

Teorema de Bayes

El teorema describe una forma de actualizar nuestras creencias basadas en la evidencia. La idea básica es que la probabilidad de un resultado particular depende de qué tan bien ese resultado explique las observaciones.
Mira ¿Cuál es la mejor manera de describir el teorema de Bayes en lenguaje sencillo?

Por ejemplo, supongamos que encontramos diez discos rectos buenos. Si tenemos un 98% de discos buenos en la población total, entonces obtener diez buenos seguidos fue un resultado muy probable. La hipótesis de que el 98% o más de los discos son buenos explica bien las observaciones, por lo que debe considerarse más probable.

Por otro lado, una hipótesis que decía que la mitad de los discos eran malos hace un trabajo terrible al explicar los resultados. Es muy poco probable obtener diez buenas seguidas si esa hipótesis fuera cierta, por lo que ajustaríamos la probabilidad de esta hipótesis.
Sin embargo, en ambos casos también tendremos que tener en cuenta la distribución previa, como se explicó anteriormente. Pasaremos a la declaración matemática del teorema, que es

[matemáticas] P (A | B) = \ frac {P (B | A) P (A)} {P (B)} [/ matemáticas]

En lugar de tratar de explicar esto en detalle aquí, lo traduciré para el ejemplo específico en cuestión. Esperemos que tenga más y más sentido a medida que avanza la sección. (Lo sentimos, puede ser necesario leer la sección dos veces, pero no puedo encontrar una mejor manera de escribirla ahora).

[matemática] A [/ matemática] será la declaración “[matemática] n \ leq 4 [/ matemática]”, o equivalente “al menos el 98% de los discos no tienen defecto”.

[matemática] B [/ matemática] será nuestra observación de los resultados, como “cero de los diez discos verificados eran defectuosos”.

[matemáticas] P (A | B) [/ matemáticas] dice “probabilidad de [matemáticas] A [/ matemáticas] dado [matemáticas] B [/ matemáticas]”. Aquí, significa la probabilidad de que [math] n \ leq 4 [/ math] dado que cero de los diez discos eran defectuosos. Esto es lo que estamos buscando: nuestra confianza de que tenemos al menos un 98% de discos buenos.

[matemática] P (B | A) [/ matemática] es la probabilidad de [matemática] B [/ matemática] dada [matemática] A [/ matemática]. En este caso, es la respuesta a la pregunta, “suponiendo que tengamos discos buenos del 98% o más, ¿cuál es la probabilidad de obtener cero defectos en diez comprobaciones?”

[matemática] P (A) [/ matemática] es la probabilidad de [matemática] A [/ matemática] tal como la comprende actualmente: es la anterior. En nuestro caso, es nuestra suposición inicial de la probabilidad de que tengamos un 98% o más de discos buenos.

[matemática] P (B) [/ matemática] es la probabilidad total de que [matemática] B [/ matemática] ocurra, independientemente de si [matemática] A [/ matemática] es verdadera. En este caso, es la respuesta a la pregunta, “¿cuáles son las posibilidades de obtener cero defectos en diez discos?”

Todos juntos, entonces, el teorema de Bayes dice: “Supongamos que muestreamos diez discos y obtenemos cero errores. Entonces deberíamos calcular una nueva probabilidad de que el 98% de los discos sean buenos. Esa nueva probabilidad es igual a la probabilidad de ver diez discos buenos suponiendo que tengamos 98% de discos buenos, multiplicado por la probabilidad anterior de tener 98% de discos buenos, y dividido por la probabilidad de ver diez discos buenos en cualquier circunstancia “.

Aquí hay un pequeño gráfico para tratar de mostrar de dónde viene esto:

El cuadro grande representa todos los resultados posibles. Se divide en dos partes. La Parte 1 es la probabilidad de tener un 98% o más en función de su anterior; su área es [matemática] P (A) [/ matemática]. La parte 2 es lo contrario.

La cajita representa la probabilidad de obtener diez discos rectos buenos. Su área total es [matemática] P (B) [/ matemática]. Vemos que es más probable que esto suceda en la parte 1 que en la parte 2. (La idea es que la pequeña caja es realmente amarilla. En el lado izquierdo estamos en las cajas roja y amarilla, por lo que es naranja. Lo mismo para azul y amarillo haciendo verde a la derecha).

Si alguien lanza un dardo al tablero, es más probable que aterrice en la parte 2. Pero si arroja un dardo al tablero y sabes que aterriza dentro de la pequeña caja, ahora es más probable que haya aterrizado en la parte 1.

Dado que alguien lanza un dardo y cae dentro de la pequeña caja, la probabilidad de que esté en la parte 1 es el área de la parte 3 dividida por el área de las partes 3 y 4 combinadas. El área de la parte 3 es la fracción de la parte 1 tomada por la tercera parte multiplicada por el área de la parte 1. Eso es [matemática] P (B | A) P (A) [/ matemática]. El área de las partes 3 y 4 combinadas en [matemáticas] P (B) [/ matemáticas]. Por lo tanto, la probabilidad de aterrizar en la parte 1, dado que estamos en la pequeña caja, es

[matemáticas] P (1 | caja) = \ frac {P (3) / P (1) * P (1)} {P (3) + P (4)} [/ matemáticas]

Esto puede ser reescrito

[matemáticas] P (A | B) = \ frac {P (B | A) P (A)} {P (B)} [/ matemáticas]

Por ejemplo, supongamos que encontramos que, en base a nuestro anterior, hay un 10% de posibilidades de que tengamos un 98% o más de discos buenos, entonces [matemática] P (A) = 10 \% [/ matemática]. Además, según nuestro previo, hay un 3% de posibilidades de obtener diez discos buenos seguidos, por lo que [matemáticas] P (B) = 3 \% [/ matemáticas]. Sin embargo, suponiendo que tengamos 98% de discos buenos, hay un 20% de posibilidades de obtener diez discos buenos seguidos, entonces [matemática] P (B | A) = 20 \% [/ matemática].

Esto constituye evidencia decente de que de hecho obtuvimos 98% de discos buenos. Después de todo, si obtuvimos 98% de buenos, nuestras posibilidades de probar diez buenos son mucho mejores que si no lo hubiéramos hecho. Por lo tanto, nos inclinamos más a favor de tener 98% o mejores discos buenos. Nuestra nueva suposición de la probabilidad es

[matemáticas] P (A | B) = \ frac {P (B | A) P (A)} {P (B)} = \ frac {20 \% * 10 \%} {3 \%} = 67 \ %[/matemáticas]

Ahora creemos que hay un 67% de posibilidades de que al menos el 98% de los discos sean buenos.
Lo anterior fue hipotético; tendremos que hacer más trabajo para calcular realmente la probabilidad relevante. Afortunadamente, todo se puede calcular utilizando la teoría de la probabilidad directa.

Ejemplo de cálculo

Digamos que dibujamos diez discos buenos y queremos saber la probabilidad de que el 98% de los discos sean buenos en función de esta evidencia. Recorreré este proceso.

No sé cómo creó los discos, así que, por simplicidad, comenzaré asumiendo que todos los valores de [math] n [/ math] son ​​igualmente probables. Hay cinco valores de [matemática] n [/ matemática] que dan al menos 98% de discos buenos (0, 1, 2, 3, 4). Hay 201 valores posibles de [matemática] n [/ matemática]. Por lo tanto, la probabilidad de que tenga un 98% o más de discos buenos es

[matemáticas] P (A) = \ frac {5} {201} = 2.49% [/ matemáticas]

A continuación, necesito saber la probabilidad de que, dado que los discos [matemáticos] n [/ matemáticos] son ​​malos, saquemos diez buenos consecutivos. La probabilidad de que el primer disco que dibujes sea bueno es

[matemáticas] \ frac {200 – n} {200} [/ matemáticas]

La probabilidad de que el próximo también sea bueno es

[matemáticas] \ frac {(200 – n) – 1} {199} [/ matemáticas]

porque solo quedan 199 discos. Esto continúa hasta diez, por lo que la probabilidad total es

[matemáticas] P (B | n) = \ frac {200 – n} {200} \ frac {199 – n} {199} \ ldots \ frac {191 – n} {191} [/ matemáticas]

o

[matemáticas] P (B | n) = \ frac {(200 – n)! 190!} {(190 – n)! 200!} [/ Matemáticas]

A continuación, debemos sumar esto sobre todos los valores de [math] n [/ math] que nos interesan, multiplicados por la probabilidad de cada uno de esos valores de [math] n [/ math].
[matemática] P (B | A) = \ frac {1} {5} \ sum_ {n = 0} ^ 4 P (B | n) [/ matemática]
WolframAlpha proporciona asistencia http://www.wolframalpha.com/inpu

La respuesta llega al 90,44%.

Finalmente, necesitamos la probabilidad total de [matemáticas] B [/ matemáticas]

[matemáticas] P (B) = \ frac {1} {201} \ sum_ {n = 0} ^ {190} P (B | n) = \ frac {1} {11} = 9.09% [/ matemáticas]

Estamos listos para partir La nueva probabilidad de 98% de discos buenos, basada en nuestra muestra de diez discos buenos, es

[matemáticas] P (A | B) = \ frac {P (B | A) P (A)} {P (B)} [/ matemáticas]

Conectar los números da

[matemáticas] \ frac {90.44 \% * 2.49 \%} {9.09 \%} = 24.7 \% [/ matemáticas]

Entonces, incluso con una muestra de solo diez discos buenos consecutivos, aumenta su confianza en tener un 98% de discos buenos diez veces más del 2.5% al ​​25%.

Si va a 20 discos buenos seguidos, va al 43%. Por 50 discos rectos buenos, va al 77%. Esto es bastante razonable cuando se considera que el 50% de discos buenos y una tasa de error del 2% llega a aproximadamente 1 disco defectuoso, por lo que 50 discos es un punto de referencia decente para detectar si el 98% son buenos.

Tenga en cuenta que las personas que dicen que la respuesta es 196 tienen razón solo si desea una certeza completa, y luego la respuesta es ridícula porque su procedimiento de verificación no es 100% correcto de todos modos. Hay un comentario sobre otra respuesta que dice que se necesita una muestra de cerca de 10,000 para un intervalo de confianza del 1%. Eso también está mal, porque no tiene en cuenta el tamaño finito de la población. Con 100 discos rectos buenos, la confianza para que el 98% o más sea bueno es del 97% con este modelo, y como estamos a punto de ver, eso es una subestimación.

Mejores Priors

Asumir un anterior plano (lo que significa que supongo que todos los valores de [matemáticas] n [/ matemáticas] son ​​igualmente probables para empezar) no es realmente una gran idea aquí. Presumiblemente hiciste los discos con una grabadora de CD, y la mayoría de las grabadoras de CD tendrán un rendimiento superior al 50%, o de lo contrario nadie los compraría. Puede ser más razonable comenzar con una distribución que hacer que sea muy probable que [matemáticas] n <10 [/ matemáticas].

Si hace eso, aumentará su confianza en que el 98% de los discos son buenos, incluso con la misma observación de diez discos buenos consecutivos.

Manejando las matemáticas

Afortunadamente, hay resultados matemáticos que nos salvan de tener que trabajar desde cero en el análisis anterior. En los libros sobre análisis bayesiano se cubre qué tipo de prioridades elegir y cómo se actualizan. El que leí fue Sivia and Skilling’s Data Analysis: A Bayesian Tutorial . (
http://www.amazon.com/Data-Analy …)

Responder a la respuesta de Keith

¡La respuesta de Keith es genial! Estoy de acuerdo con lo que dice sobre el problema y aporta una gran perspectiva.

Con respecto a mi respuesta, Keith escribió: “Lo que debes calcular depende de quién eres y qué quieres lograr”. Exactamente. Y por la forma en que estaba formulada la pregunta, pensé que estaba bastante claro que solo había un lote de CD. En otras palabras, en base a la gramática de la pregunta, deduje que estábamos en la posición del “cliente de fábrica” ​​de Keith, y no percibimos ninguna ambigüedad en este punto. Keith y yo parecemos estar de acuerdo con las estadísticas. Simplemente teníamos una interpretación diferente del alcance de la pregunta.

Cuando describo cómo mi respuesta lo llevó a la distracción, creo que algunas de las citas de Keith están fuera de lugar y su representación de lo que dije es inexacta. Keith insinuó que dije que un enfoque bayesiano era la única forma de resolver este problema, sin importar quién sea usted. Eso no está bien. Lo que dije fue que si vas a incorporar tu conocimiento de fondo de la situación, la forma de hacerlo es introduciendo un análisis previo y haciendo un análisis bayesiano. Eche un vistazo nuevamente a las palabras que Keith puso entre comillas, incluyendo “el camino” y “usted debería”. En el contexto de mi respuesta, esas palabras solo aparecen después de suponer que vamos a incorporar conocimientos básicos en el análisis.

El enfoque frecuentista no incorpora ningún conocimiento de fondo. En otras palabras, si vas a inspeccionar el lote y el operador te dice que la máquina estaba haciendo un sonido extraño ese día, eso no cambia el análisis frecuente. Si está comprando el lote de un nuevo proveedor con el que no ha establecido una relación de confianza, eso no lo cambia, etc. Hasta donde yo sé, si desea incorporar sus conocimientos previos, un enfoque bayesiano Es la única alternativa viable. Eso podría estar mal, pero de todos modos eso es lo que dije, y creo que la respuesta de Keith tergiversa lo que dije.

En cuanto a mi uso de “exige un análisis bayesiano”, nuevamente estoy de acuerdo con lo que dijo Keith sobre el propietario de la fábrica. Pero para ser claros, el enfoque frecuentista responde una pregunta ligeramente diferente de la que se hizo originalmente.

La pregunta original preguntaba qué tipo de muestreo se necesitaba para estar seguro de que el 98% de los discos eran buenos. Esa es la condición. El enfoque frecuentista da una prueba y dice que si esa condición realmente falla, es muy poco probable que el lote pase la prueba. Sin embargo, eso no es lo mismo que confiar en que el lote fue bueno. Por ejemplo, suponga que desea saber si tiene una enfermedad rara que afecta a una de cada millón de personas, por lo que debe hacerse una prueba. La prueba siempre detecta la enfermedad cuando está allí, pero solo es adecuada para las personas sanas el 99% del tiempo. Si realiza la prueba y resulta positiva, puede rechazar la hipótesis de que está sano en p = .01. Sin embargo, su probabilidad de tener la enfermedad es solo de una en diez mil porque la prueba arrojará alrededor de diez mil falsos positivos por cada diagnóstico positivo correcto. Un análisis bayesiano muestra la verdadera posibilidad de tener la enfermedad. Un enfoque frecuentista simplemente responde una pregunta diferente. En el caso de los discos, dan respuestas similares porque no asumí una cantidad significativa de conocimientos previos.

Seguramente hubiera sido mejor decir: “Creo que una buena forma de abordar este problema es a través del análisis bayesiano”, pero lo dejaré como lo escribí originalmente para la continuidad. De todos modos, dado que los enfoques dan más o menos la misma respuesta, y debido a que Keith declaró muy claramente la interpretación exacta de la respuesta frecuente, le animo a que la lea e internalice su mensaje, y le agradezco a Keith por proporcionar su perspectiva.

Anon User está en lo correcto (al igual que Quora User) de que puede estar 100% seguro de que el 98% de los discos están bien al probar 196 discos.

Creo que lo que está preguntando (corríjame si me equivoco) es si hay alguna herramienta estadística que pueda usar para evaluar una muestra MUCHO más pequeña y extrapolarla al conjunto más grande de 200. El conjunto que está evaluando es demasiado pequeño para obtener una muestra lo suficientemente grande como para extrapolar con confianza estadística. Creo que la regla general es que necesita al menos 1500 muestras para poder extrapolar cualquier tipo de confianza estadística útil sobre un conjunto más grande.

A la luz de eso, mi respuesta es seguir tu instinto y descubrir cómo manejar cualquier riesgo que exista si te equivocas. ¿Cuántos se necesitarán para que te sientas seguro? Personalmente, me aburriría y lo llamaría un día si pudiera mantenerlo en 2 fallas de 40. Eso es solo el 95%, pero tengo otras cosas que hacer con mi día.

En el futuro, estoy de acuerdo con el usuario de Anon que sugiere verificarlos a medida que los graba.