No describe sus datos. Se aplican diferentes métodos a variables continuas o discretas. Más sobre eso más tarde. Primero hablemos de causalidad.
La causalidad es algo difícil de evaluar. El hecho de que dos cosas estén relacionadas no significa que una sea la causa de la otra.
En un estudio observacional, se recopilan datos existentes y se buscan relaciones. Pero considere las poblaciones de los Estados Unidos y la India. Ambos están aumentando y altamente correlacionados. Pero, ¿el aumento de la población de EE. UU. Hace que aumente la población de la India? ¿O es al revés? O tampoco? El hecho de que ambos estén aumentando en el tiempo es una explicación suficiente.
En un experimento, el experimentador controla el valor de algunas variables. Si otras variables están altamente correlacionadas, parece razonable que las variables controladas causen las respuestas.
- Si obtengo un nuevo trabajo en un estado diferente a mitad de contrato de arrendamiento de un apartamento, ¿qué puedo hacer?
- Tengo Windows 7 de 32 bits. ¿Puedo actualizar a Windows 10 de 64 bits (ya que es una actualización gratuita)?
- Tengo 20 años y quiero comenzar (aprender) a nadar para formar un equipo de natación de EE. UU. Y ganar 8 medallas de oro en Tokio. ¿Cómo empiezo?
- Si quisiera acceder y modificar el código de una aplicación informática, ¿sería posible?
- No puedo creer a mi madre. Pero ella me necesita. ¿Qué tengo que hacer?
Como ejemplo, considere la relación entre fumar y el cáncer de pulmón. Los primeros datos fueron criticados por ser simples datos de observación. Tal vez hubo una explicación genética que hizo que las personas fueran más propensas a fumar y a tener más probabilidades de tener cáncer de pulmón. Se necesitaban experimentos, pero no es ético hacer que las personas fumen (o hacer que se abstengan). En cambio, se realizaron experimentos con ratas. También se buscaron explicaciones a nivel celular.
El coeficiente de correlación habitual (Pearson) es una medida de qué tan bien una variable puede predecir la otra en función del mejor ajuste en línea recta. Solo es útil para relaciones lineales.
No se puede hablar de la probabilidad de una correlación. Hay una correlación o no (y generalmente la hay, incluso si es muy pequeña). Puedes estimar la correlación. Si es significativamente diferente de cero, ha encontrado una relación. Vale la pena saberlo, ya que te dice que vale la pena investigar más. La investigación adicional debe involucrar experimentos.
Tipos de datos. La correlación de Pearson es apropiada cuando una línea recta se ajusta a dos variables continuas. Si escala las variables para que ambas tengan la misma desviación estándar, entonces la correlación es el gradiente de la línea. Si la línea es horizontal, la correlación es cero y no hay ningún valor al tratar de predecir una variable basada en la otra.
Si la variable explicativa es continua y la respuesta es ordinal, a menudo es apropiada una técnica llamada regresión logística, especialmente si la variable ordinal tiene solo dos categorías.
Si ambas variables son categóricas, desea un análisis de tabla de contingencia. Debes buscar la prueba de independencia chi-cuadrado.