Si tengo un conjunto de datos, ¿qué método puedo usar para demostrar que no son aleatorios y que siguen un patrón?

Trace un histograma, vea cuál es la distribución.
La noción “aleatorio” es en realidad solo patrones basados ​​en alguna distribución. Hay gaussiano, uniforme, gamma … lo que sea. No es fácil asignar un histograma a una distribución (en su lugar, generalmente se define en teoremas), pero sería obvio qué distribución encajaría con mayor probabilidad en los datos.
El que Mike mencionó, en realidad se usa para examinar en términos de error en el modelo de regresión, esta es una noción ligeramente diferente a la aleatoria. Cuando no hay aleatoriedad en su término de error, lo más probable es que tenga una mala estimación de sus parámetros para la regresión. Aunque lo llamamos detectar no aleatoriedad, en realidad asumimos que los términos de error están distribuidos normalmente. Una analogía, cuando disparas dardos, a pesar de que ganaste una medalla olímpica en disparar dardos, si hay un viento fuerte, es poco probable que alcances tu objetivo como solías hacerlo.

“Aleatorio” siempre supone la distribución. Cualquier muestra de datos puede considerarse una muestra aleatoria de alguna distribución.

Una pregunta relacionada que tiene sentido matemáticamente: ¿Qué método puedo usar para demostrar que cierta propiedad de los datos no es aleatoria?

En el caso más simple, la propiedad es sí / no, y estamos tratando de demostrar que no es aleatoria con respecto a las otras características / propiedades de las entradas de sus datos.

Entonces la respuesta es simple: intente predecir este sí / no a partir de las otras características / propiedades. Y evalúe su algoritmo de predicción utilizando remuestreo o validación cruzada. Si al final la precisión es de aproximadamente 50%, su sí / no es aleatorio, si es 90 +%, seguro que no lo es.

No funciona así.

Si tiene un patrón en mente, las estadísticas pueden llevarlo a decir que el patrón es muy probable, pero nunca tome una decisión firme.

Considere los dígitos decimales de pi. En general, se cree que son “aleatorios”, lo que significa que no se ajustan a un patrón conocido, y se han recopilado estadísticas exhaustivas que muestran que, por ejemplo, los dígitos ocurren casi con la misma frecuencia, pares de dígitos con la misma frecuencia, y así sucesivamente, hasta los límites de los varios millones de dígitos conocidos, pero esto no prueba nada acerca de pi, solo acerca de la última aproximación de pi.

Sé que esta respuesta no es lo que querías saber, pero creo que tengo una razón para apoyar tu opinión. Dices que existe un patrón para cualquier conjunto de números. Tengo una opinión similar Pero consideremos solo los números naturales. Si tenemos un conjunto de números naturales, ¡se siguen exactamente los mismos números y su orden en cualquier número irracional en forma decimal! Porque hay infinitos números después del punto decimal en cualquier número irracional. Entonces, tiene que haber un orden único en la expansión decimal que corresponda exactamente al conjunto de números naturales que tenemos.

En tal situación, podría ser una buena idea utilizar algunas técnicas de visualización que retratarán los datos y, si hay algún patrón, será visible. Un software que se usa mucho en ciencia de datos es Tableau y ha ganado muchos elogios. Después de eso, algunas técnicas de agrupamiento pueden ser útiles, si no se observa un patrón significativo, pero los grupos son evidentes. Ayuda a saber qué tipo de datos son, como numéricos, categóricos, digitales, tweets o señales.

Es difícil saberlo con seguridad sin ningún dato que mirar. Sin embargo, es posible que desee ver este documento sobre la detección de la no aleatoriedad como un punto de partida. Página en nist.gov

Esto necesita más información para responder. Cuantas variables ¿De que tipo? ¿Qué tipo de “patrón”?

Solo intenta usar algunos de los métodos de agrupación,
por ejemplo: algoritmo EM.