Necesito calcular la probabilidad de que dos eventos estén correlacionados (probabilidad de que un desencadenante sea la causa de un síntoma). ¿Qué herramienta estadística debo usar?

No describe sus datos. Se aplican diferentes métodos a variables continuas o discretas. Más sobre eso más tarde. Primero hablemos de causalidad.

La causalidad es algo difícil de evaluar. El hecho de que dos cosas estén relacionadas no significa que una sea la causa de la otra.

En un estudio observacional, se recopilan datos existentes y se buscan relaciones. Pero considere las poblaciones de los Estados Unidos y la India. Ambos están aumentando y altamente correlacionados. Pero, ¿el aumento de la población de EE. UU. Hace que aumente la población de la India? ¿O es al revés? O tampoco? El hecho de que ambos estén aumentando en el tiempo es una explicación suficiente.

En un experimento, el experimentador controla el valor de algunas variables. Si otras variables están altamente correlacionadas, parece razonable que las variables controladas causen las respuestas.

Como ejemplo, considere la relación entre fumar y el cáncer de pulmón. Los primeros datos fueron criticados por ser simples datos de observación. Tal vez hubo una explicación genética que hizo que las personas fueran más propensas a fumar y a tener más probabilidades de tener cáncer de pulmón. Se necesitaban experimentos, pero no es ético hacer que las personas fumen (o hacer que se abstengan). En cambio, se realizaron experimentos con ratas. También se buscaron explicaciones a nivel celular.

El coeficiente de correlación habitual (Pearson) es una medida de qué tan bien una variable puede predecir la otra en función del mejor ajuste en línea recta. Solo es útil para relaciones lineales.

No se puede hablar de la probabilidad de una correlación. Hay una correlación o no (y generalmente la hay, incluso si es muy pequeña). Puedes estimar la correlación. Si es significativamente diferente de cero, ha encontrado una relación. Vale la pena saberlo, ya que te dice que vale la pena investigar más. La investigación adicional debe involucrar experimentos.

Tipos de datos. La correlación de Pearson es apropiada cuando una línea recta se ajusta a dos variables continuas. Si escala las variables para que ambas tengan la misma desviación estándar, entonces la correlación es el gradiente de la línea. Si la línea es horizontal, la correlación es cero y no hay ningún valor al tratar de predecir una variable basada en la otra.

Si la variable explicativa es continua y la respuesta es ordinal, a menudo es apropiada una técnica llamada regresión logística, especialmente si la variable ordinal tiene solo dos categorías.

Si ambas variables son categóricas, desea un análisis de tabla de contingencia. Debes buscar la prueba de independencia chi-cuadrado.

Quería explicar eso, lamentablemente quora limitar el espacio tanto que no citaba lo que pretendía. Soy consciente de que una correlación es solo una pista, y que para determinar la causalidad necesitas experimentación. Como estoy codificando un sitio web como un proyecto para la escuela, el bit del experimento está bastante fuera de la mesa y “simplemente” necesito elegir qué herramienta estadística debo usar para determinar si existe una posible causa (dejémoslo en un probable culpable) y los síntomas están correlacionados. Dado que este no es el ejemplo clásico de Pearson con altura y peso, en cambio tengo las causas probables, con un valor de 0 o 1 si está presente, lo mismo para los síntomas y una restricción de tiempo ya que solo los síntomas que ocurrieron dentro de 2 días son relevante … no tengo ni idea … Muchas gracias por sus respuestas, fueron muy, muy ciertas