Tengo un flujo continuo de datos del archivo de registro de una máquina. El registro contiene diferentes eventos y ocurrencias de falla de la máquina en varios puntos en el tiempo. Necesito desarrollar un modelo (no necesariamente de aprendizaje automático) que pueda predecir fallas futuras. ¿Alguno de ustedes tiene experiencia en el análisis de archivos de registro?

Lo siguiente es una abstracción de alto nivel de las estrategias que utilicé.

1. Una clase de minería de reglas modificada para el flujo de datos para predecir eventos específicos ( fallas ).

Se definieron dos parámetros como se muestra a continuación, tw (ventana de tiempo analizada antes de la falla) y tl (el tiempo de entrega indica con qué anticipación se predice la falla). Se aplicó el algoritmo de minería de reglas estándar para encontrar la confianza de cada conjunto de elementos. La confianza es cuántas veces se produjo un conjunto de elementos dentro de tw contra el número total de ocurrencias.


2. Extendido (Minería de reglas) para capturar el patrón de ocurrencia de ráfaga como se muestra a continuación. (E es Evento y F es Fallo). El algoritmo de minería de reglas estándar no captura la aparición de ráfagas, ya que calcula la confianza a nivel mundial.


Procesó cada lote por separado y definió dos parámetros de confianza, uno para el lote y otro para las reglas dentro del lote.

3. Desarrollé un modelo de predicción de aprendizaje automático de dos clases (con o sin falla) con varios algoritmos como Bayesian, RBF, VFI, etc. con una construcción de vectores de características variadas. Comparó el ROC para encontrar el mejor modelo. Selección variada de parámetros, como AttributeSelectedClassifier, normalización de los ejemplos de instancias de características de entrada, evaluación sensible al costo (ya que las etiquetas de clase no están distribuidas de manera uniforme (demasiadas menos etiquetas de falla en comparación con las etiquetas sin falla), división porcentual, ventana deslizante para capturar el cambio de contexto, etc.

4. Desarrollé un espacio de estado gráfico con estados que son eventos y las aristas dirigidas son la probabilidad de que los eventos tarden en llegar a otros eventos con un tiempo medio de falla definido. Se parece más a una cadena de Markov pero se desarrolló utilizando una llamada recursiva realizada en el algoritmo básico de minería de reglas explicado en 1.

5. Los datos estadísticos se ajustan capturando tasas decrecientes entre llegadas entre eventos relacionados con fallas. Se usaron varias distribuciones (por ejemplo, Weibull).

¿Ha considerado usar alguna variación del análisis de crecimiento de confiabilidad (también conocido como Crow-AMSAA)? Es un método estadístico para usar un historial de fallas para comprender y predecir la vida esperada, así como para monitorear el impacto de los cambios en el tiempo medio entre fallas.

La técnica se usa comúnmente en ingeniería de confiabilidad industrial, no he oído hablar de una aplicación en su escenario, pero espero que pueda proporcionar algunos datos útiles.

Puede obtener más información sobre el crecimiento de la confiabilidad aquí:
http://www.weibull.com/basics/gr
http://www.weibull.com/RelGrowth
http://www.reliasoft.com/newslet

More Interesting

Odio a mi madre pero mi hijo ama a su abuela. ¿Qué tengo que hacer?

Le tengo miedo a todo. Tengo miedo de comprar una casa, miedo de que el jefe me grite, miedo de trabajar, miedo de tener éxito. ¿Cómo supero esto?

Soy un estudiante internacional en los Estados Unidos. Si hago una pasantía en Canadá, ¿qué país me otorgará mi permiso de trabajo?

Si encontré las llaves de un automóvil, lo conduje y lo dejé dentro de los límites de la ciudad, a poca distancia de donde lo llevé, ¿qué podría suceder?

He tomado un préstamo hipotecario y actualmente vivo en una casa alquilada. Todavía no tengo ninguna posesión. ¿Cómo puedo poner interés para la exclusión?

Me he convertido en una persona muy negativa últimamente y me da miedo ¿Cómo me deshago de ella?

Estoy buscando un cofundador del MIT para construir una startup tecnológica. ¿Cómo puedo encontrar uno?

Actualmente estoy implementando algoritmos de análisis de gráficos iterativos en Hadoop (en MapReduce). Desafortunadamente, mi código es extremadamente lento, principalmente porque cada iteración es un paso de MapReduce separado. ¿Existe un buen enfoque para implementar estos algoritmos iterativos en MapReduce? ¿Hay alguna manera de evitar MapReduce por completo y calcular los datos que residen en HDFS usando MPI, etc.?

Soy un estudiante de BE IT de último año. ¿Cómo selecciono un tema para mi proyecto de último año?

Obtuve CS en MIT Manipal pero lamento no haber recibido NIT Trichy. ¿Debo dejar caer y escribir JEE nuevamente o continuar en Manipal?