En mis primeros años, volqué todos estos datos en una sola tabla: [símbolo, fecha, precio, volumen]. La tabla creció a más de 10 millones de filas y el rendimiento comenzó a degradarse (MySQL). Además, quería hacer consultas para fechas específicas, como “SELECCIONAR * de la tabla DONDE fecha = AAAAMMDD” … y de repente, el rendimiento era insoportable, y los índices en (fecha, símbolo) no ayudaron.
Hay archivos de datos binarios de alta dimensión que se supone que ayudan con este problema, pero descubrirá que tienen el mismo rendimiento que una tabla de base de datos indexada y optimizada …
Ninguna solución funcionará mejor.
¿Alguna vez se preguntó por qué los grandes sitios web (Yahoo, Google) solo muestran 5 días de datos de 1 minuto, 1 mes de datos de 5 minutos, algunos años de datos diarios y luego semanalmente? … son muchos datos.
- Quiero que alguien chatee para mejorar mi idioma. Alguien puede ayudar?
- ¿Es segura mi cuenta bancaria?
- Soy un demócrata registrado. Mi estado tiene un comité, pero no una primaria de acuerdo con el calendario principal de la DNC para 2016. ¿Esto significa que no puedo votar en las elecciones primarias?
- Quiero tener algún significado en mi vida. Necesito saber el propósito de mi vida. ¿De qué maneras puedo hacer eso? Tengo 19 años.
- No entiendo muy bien por qué uno negociaría acciones de centavo y ganaría dinero, ¿alguien puede explicar cómo estas personas ganan dinero con las existencias de centavo?
Optimice sus tablas de datos para respaldar sus consultas. Tendrá redundancia, así que automatice el proceso de creación de redundancia y viva con un esquema degradado. Su ciclo de análisis será mucho más rápido.
Ver también: voy a almacenar los precios de las acciones de muchos mercados bursátiles, como el mercado de valores de Nasdaq y de Nueva York, etc. ¿Cuántos datos tendré si mi aplicación se ejecuta durante 3 o 4 años? (más los últimos 10 años como datos históricos) ¿Necesitaré una base de datos no SQL para eso? ¿Una serie de tiempo noSQL quizás?