Necesito desarrollar una buena base de almacenamiento de datos e inteligencia de negocios. ¿De dónde debería comenzar a aprender? ¿Cuáles son algunas direcciones?

Comience con Bill Inmon desde que se le ocurrió el concepto. Comprender los objetivos de un almacén de datos. Luego lee Kimball. Ignora todas las guerras religiosas y la hipérbole sobre cuán maravilloso es el modelado dimensional. No es el almacenamiento de datos, son los data marts y la recopilación de data marts no es un almacén. Pase a Data Vault, que es lo que Inmon ahora respalda como la forma adecuada de modelar un almacén de datos.

Pasando a BI, comience con Stephen Few (Perceptual Edge) y luego siga con Ed Tufte. Esto le dará una base sólida en el diseño de visualización adecuado y cómo comunicar los resultados para beneficiar al usuario, no entretenerlos con imágenes bonitas.

Finalmente, explore la minería de datos (O’Reilly tiene varios buenos libros sobre el tema). Obtenga una visión general de lo que se trata NOSQL, bases de datos no estructuradas, big data y data science (Pluralsight tiene algunos buenos cursos de visión general).

Entonces tendrá suficiente conocimiento para elegir su interés en esta área bastante grande y tener una carrera satisfactoria.

Como cualquier camino, todo depende de tus objetivos. Suponiendo que desea desarrollar un conocimiento sólido para su propia aplicación de la tecnología, o tal vez para conseguir un trabajo, le ofrezco los siguientes principios rápidos:

Los basicos
Cuando comencé a trabajar en el campo y tuve que aprender rápido, leí todo sobre hechos, dimensiones, estrellas, copos de nieve y similares en estos sitios muy sencillos pero atemporales:
http://www.1keydata.com/dataware
http://philip.greenspun.com/sql/

Para leer más, mira este:
The Data Warehouse Toolkit: la guía completa para el modelado dimensional: 9780471200246: Computer Science Books @ Amazon.com

El “bueno saber”
El forraje popular para que las entrevistas de trabajo sean conscientes incluyen preguntas sobre diferentes tipos de dimensiones (dimensión que cambia lentamente), así como las diferencias en las estrategias de DW (modelos Kimball e Inmon DW).

La próxima ola
La arquitectura moderna de Data Warehouse ofrece una muy buena introducción al mundo de los grandes datos, al igual que 6 cosas que debe saber sobre Hadoop: Jenny (Xiao) Zhang

Próximos pasos
Busque un mentor / compañero / maestro, si es posible, con experiencia en el campo y discuta lo que ha aprendido. Pueden ayudarlo a superar el toro y a centrarse en cómo desarrollar sus habilidades y alcanzar sus objetivos específicos.

Como Andrew acaba de decir, implementar un Data Warehouse es una tarea enorme y complicada, creo que su enfoque sería el mejor en términos de aprendizaje práctico para DW.

Sin embargo, si solo desea aprender los conceptos básicos, las terminologías, etc., hay un par de pistas diferentes que puede tomar para comenzar a usar DW.

Si desea conocer los aspectos de modelado de datos y el enfoque arquitectónico de DW (sin tener en cuenta las herramientas), recomendaría la serie de libros Kimball. Cubren ETL, modelado de datos y modelado dimensional, conceptos de BI y DW.

Por otro lado, si está más interesado en los aspectos técnicos de la construcción de un DW, le recomendaría elegir primero un proveedor (Microsoft suele ser la tecnología más simple pero más débil que puede usar) y comenzar a leer libros y materiales sobre cómo construir un Data Warehouse utilizando esta tecnología.

Sin embargo, como dijo Andrew en la publicación anterior, no hay mejor manera de aprender que unirse a un equipo de profesionales de DWH y obtener experiencia práctica y hacer uso de sus conocimientos. Los libros que mencioné son solo un punto de partida

Un DWH es uno de los proyectos de TI más caros y complicados con los que una organización se comprometerá. Los proyectos DWH no tienen el mejor historial de entregar ROI o incluso ser considerados un éxito.

Debido a eso, solo permitiría que profesionales consumados de DWH desarrollen uno.

Si aún no eres un profesional consumado de DWH con un historial probado, iría a buscar uno. Sería miembro de ese equipo de personas y aprendería de ellos mientras desarrollan 2-4 proyectos DWH completando todas las tareas que le asignan.

No puedo pensar en ninguna justificación para desviarse de lo anterior a menos que la organización que paga por el DWH tenga dinero para gastar y no necesite que el proyecto se complete a tiempo o nunca. El riesgo de desarrollar una “buena” es tan alto que cualquier persona que le pague a un profesional de DWH no consumado debería ser eliminado de la autoridad para aprobar cheques de pago.

Nosotros (Chartio) acabamos de escribir un libro blanco sobre el almacenamiento de datos para ejecutivos que no son de TI:

Seis preguntas que le ahorrarán tiempo y dinero en el almacenamiento de datos.

Puede ayudarlo a medida que comienza a pensar en estos conceptos.

Como veo, usted es un desarrollador de BI y puede estar familiarizado con la mayoría de los fundamentos de DW; Una cosa a tener en cuenta es que con Big Data, DW tradicional parece difícil de implementar todo el tiempo. Como desarrollador de DW myslef, me resulta difícil modelar grandes datos como eventos de usuarios que vienen como archivos json o grandes consultas en un hecho y dimensiones perfectos. Puede terminar creando una única tabla grande para este tipo de datos. Muchas cosas han cambiado recientemente con Big Data y todavía estoy esperando el momento en que haya un matrimonio perfecto entre los desarrolladores tradicionales de data warehouse y los ingenieros de Big Data.