Estoy haciendo un proyecto de matemáticas en la escuela secundaria que requiere regresión de datos. Estoy usando una función gaussiana para hacer que mis SSres sean mínimos. ¿Qué datos debo obtener?

Esta pregunta tiene más sentido de lo que piensas.

Y, sinceramente, más científicos de datos de los que nos gustaría utilizar métodos que suponen una distribución gaussiana sin verificar si es realmente gaussiana (normal), y de hecho pocos procesos de la vida real tienen una distribución gaussiana perfecta de sus variables.

Estás haciendo las preguntas correctas.

Para obtener un conjunto de datos distribuidos gaussianos, puede usar el sorprendente poder del Teorema del límite central: independientemente de la distribución subyacente, si toma suficientes muestras aleatorias, sus medios seguirán una distribución gaussiana. Por lo tanto, puede tomar cualquier conjunto de datos enorme y tomar muchas muestras aleatorias de él, y tiene una distribución Normal.

Otras formas implican el uso de datos que siguen una distribución que se aproxima a Normal: Binomial (lanzamiento de monedas; es una versión discreta de la distribución gaussiana) y Poisson (por ejemplo, el número de automóviles que llegan por hora en una cabina de peaje, o el número de clientes que llegan a un gran y restaurante popular durante la hora pico, como la noche del día de San Valentín, o el número de niños que vienen a sentarse en el regazo de Santa durante el día antes de Navidad). Cuando este número es lo suficientemente grande (en docenas), esta distribución puede ser aproximada por gaussiana.

¡Atentamente!

* algunas métricas humanas: longitud, peso, tamaño del zapato, número de press de banca, tiempo de carrera, …

* algunas métricas en la naturaleza: tamaño del árbol (por tipo), tamaño de la hoja, litros que produce una vaca por día, número de excrementos de conejo, …

* la distribución de 12 resultados de dados de seis lados

En realidad, la suma de N variables aleatorias e independientes siempre conduce a una distribución normal (si N aumenta). Tantas cosas en la vida que tienen muchos factores de contribución tendrán una distribución normal.

por eso, si repite un experimento muchas veces y calcula la media, la media tendrá una distribución normal.

Entonces … mucha variedad