Si, puedes hacerlo. Como persona práctica (y algunos puristas de estadísticas no estarán contentos de cortar esquinas y romper suposiciones), veo tres formas relativamente simples de hacerlo.
1. Correlación simple en Excel. Simplemente agregue una columna donde reemplace Sí con 1 y No con 0, y ejecute la correlación entre esta variable ficticia y su variable cuantitativa. Tenga en cuenta que si sus conjuntos Y y N no son representativos, es probable que haya otras variables que puedan explicar total o parcialmente esta correlación. Además, no podrá distinguir del coeficiente de correlación en sí mismo si es estadísticamente significativo.
2. Probar la diferencia de las medias para la significación estadística. Lo que puede hacer es establecer que hay una diferencia en los promedios (llamados ‘medios’ en las estadísticas) para Sí y No, que llamaremos yn, y luego verificar si es estadísticamente significativo. Si es así, has establecido que hay una relación. Nuevamente, al igual que el n. ° 1, asegúrese de asegurarse de que los conjuntos Sí y No sean representativos entre sí y que la diferencia no provenga de alguna otra variable correlacionada con S / N. Si cree que puede haber un caso de influencia, vuelva al n. ° 3, regresión de variable ficticia.
Para verificar la significación estadística, primero ejecute los promedios de Sí y No. En segundo lugar, calcule las desviaciones estándar de la variable cuantitativa para Y y N (solo use la fórmula STDEV.S en Excel), y luego calcule la desviación estándar de la diferencia entre Sí y no como
STD (yn) = SQRT (STD (Y) ^ 2 / Ny + STD (N) ^ 2 / Nn),
donde Ny es el número de observaciones en el conjunto Y, y Nn es el mismo para N.
- Estoy de acuerdo con lo que dice! Pero si no votamos por Modi, ¿por quién más votamos? http://qz.com/178362/india-crosses-the-moral-line-of-no-return-if-narendra-modi-becomes-prime-minister/
- Estaba considerando comprar un libro electrónico. ¿Debo ir un paso más allá y obtener una tableta?
- Soy un indio que busca actualizarme profesionalmente, por lo tanto, estoy tratando de aprender un nuevo idioma. ¿Qué idioma debo aprender: español o francés?
- Tengo 12 años. Mi tía sigue contándome historias sobre brujas y ella cree que existen. ¿Las brujas realmente existían en aquel entonces?
- Si cambio acciones regularmente desde una cuenta de corretaje estándar, como una o dos veces por semana, ¿hay alguna ley que pueda violar sin saberlo?
Si su diferencia yn es al menos dos veces mayor que su error estándar (en su caso, desviación estándar), entonces la diferencia yn es estadísticamente significativa a un nivel de confianza del 95%.
Esto probablemente no sea muy perfecto, y lo hice en la parte posterior de la servilleta usando Stat 101. La idea es que calcules un valor y luego su desviación estándar, y si su desviación estándar es la mitad o menos del valor, entonces el Se cree que el valor es diferente de cero (la prueba de hipótesis nula básica). Calcular la diferencia no es difícil, pero la desviación estándar es un poco complicada. Para eso necesita comprender la diferencia entre la varianza (varianza = STD ^ 2) de la variable y la varianza de su media (es 1 / (N-1), pero bajé -1 por simplicidad y otras consideraciones). Después de eso, puede calcular la desviación estándar de la varianza de una fórmula de suma, suponiendo una covarianza cero.
3. Regresión de variables ficticias. Lo mismo que # 1, pero puede agregar más variables para refinar el impacto de Y y N. Esto solo tendría sentido si Y / N impacta la variable cuantitativa, no al revés. Además, puede ser un poco demasiado agresivo para usted ejecutar una regresión múltiple con muchas variables. Probablemente recomendaría probar otras variables para la correlación / impacto usando primero # 1 y # 2.