Supongo que el autor de la pregunta pregunta por la diferencia entre ingenuos bayes y LDA, ya que ambos pueden usarse con n-gramos y son los enfoques de modelado de texto más comunes.
La diferencia entre los dos está en la especificación del modelo generativo. Naive Bayes asume que el texto se genera seleccionando una clase y luego seleccionando cada palabra en un documento iid de la distribución de palabras de esa clase. LDA asume un modelo de documento donde primero se seleccionan los parámetros para una distribución multinomial en clases de una distribución de dirichlet, y cada palabra se muestrea primero muestreando una clase del multinomial de clase de documento y luego muestreando una palabra de la distribución de palabras multinomiales de clase. La conclusión intuitiva es que LDA puede “modelar” documentos que tratan sobre varios temas diferentes, mientras que NB está mucho más limitado.