Alquile una instancia EC2 de 240 GB en Amazon Web Services.
Como regla general, R requiere 3 veces más RAM que los datos almacenados en la memoria. Probablemente podría ajustar su regresión logística con un muestreo mínimo (o incluso no) de esta manera.
Si la base glm
ahoga, recomendaría consultar el paquete bigglm
:
bigglm en su gran conjunto de datos en código abierto R, simplemente funciona, similar a SAS
Por último, también puede ejecutar un GLM en H20 a través de R:
H2O: aprendizaje automático escalable rápido para aplicaciones inteligentes
Si bien es probable que pueda resolver su problema específico con el muestreo, hay momentos en que esto no es deseable. Para algunas clases de problemas, el error del conjunto de pruebas podría continuar disminuyendo significativamente a medida que aumenta el número de ejemplos de capacitación.
- ¿Por qué empiezo muchas cosas pero nunca completo ninguna?
- Perdí un Moto IMEI después de reiniciar. Se muestra nulo ahora. ¿Que puedo hacer?
- Tengo una amplia variedad de experiencia en diferentes compañías e industrias, pero algunos de mis colegas en mi compañía tecnológica actual dicen que mi experiencia no significa nada porque todo es anecdótico. ¿Tienen razón?
- Si vivo en Nueva Jersey pero trabajo en Nueva York, ¿pueden mis hijos ir a la escuela allí?
- Tengo Ayuda y Manual, ¿necesito Madcap Flare para editar documentos complejos, o debería usar FrameMaker?