R tiene un paquete llamado ‘sentimiento’ que puede usar. También puede usar varios algoritmos de aprendizaje automático para el entrenamiento de datos. Estos son los pasos al hacer con R:
Paso 1: cargue los paquetes necesarios (es posible que necesite descargar paquetes que no están disponibles de forma predeterminada)
# paquetes requeridos
biblioteca (twitteR)
biblioteca (sentimiento)
biblioteca (plyr)
biblioteca (ggplot2)
biblioteca (wordcloud)
biblioteca (RColorBrewer)
Paso 2: Seleccione algunos datos que desea usar. Puedes cargarlo usando readLines ()
- Si planeo visitar Walt Disney World por un día, ¿qué debería ver?
- Quiero comenzar un negocio de reciclaje, entonces, ¿qué materiales y qué productos me recomiendan reciclar?
- Si me uní al ejército para marcar la diferencia pero no creo en lo que hacen los militares, ¿sigue siendo lo correcto?
- Voy a comenzar un podcast con mis amigos. ¿Cuáles son algunas cosas que debo tener en cuenta?
- Es posible que necesite una aplicación de ajuste del sistema para HD y mantenimiento general del rendimiento para Mac OS X. ¿Recomendaciones?
# cosechar algunos tweets
some_tweets = searchTwitter (“starbucks”, n = 1500, lang = “en”)# obtener el texto
some_txt = sapply (some_tweets, function (x) x $ getText ())
Paso 3: prepare el texto para el análisis de sentimientos
# eliminar entidades retweet
some_txt = gsub (“(RT | via) ((?: \\ b \\ W * @ \\ w +) +)”, “”, some_txt)
# eliminar a las personas
some_txt = gsub (“@ \\ w +”, “”, some_txt)
# eliminar puntuación
some_txt = gsub (“[[: punct:]]”, “”, some_txt)
# eliminar números
some_txt = gsub (“[[: dígito:]]”, “”, some_txt)
# eliminar enlaces html
some_txt = gsub (“http \\ w +”, “”, some_txt)
# eliminar espacios innecesarios
some_txt = gsub (“[\ t] {2,}”, “”, some_txt)
some_txt = gsub (“^ \\ s + | \\ s + $”, “”, some_txt)# define la función “manejo de errores de tolower”
try.error = function (x)
{
# crear valor perdido
y = NA
# tryCatch error
try_error = tryCatch (tolower (x), error = function (e) e)
# si no es un error
if (! hereits (try_error, “error”))
y = tolower (x)
# resultado
volver (y)
}
# minúsculas usando try.error con sapply
some_txt = sapply (some_txt, try.error)# eliminar NAs en some_txt
some_txt = some_txt [! Página en is.na (some_txt)]
nombres (some_txt) = NULL
Paso 4: Realice el Análisis de opinión utilizando un algoritmo de clasificación incorporado como svm, bayes
# clasifica la emoción
class_emo = classify_emotion (some_txt, Algoritmo = “bayes”, anterior = 1.0)
# consigue la mejor emoción
emoción = clase_emo [, 7]
# sustituir NA por “desconocido”
emoción [Página en is.na (emoción)] = “desconocido”# clasificar polaridad
class_pol = classify_polarity (some_txt, Algoritmo = “bayes”)
# consigue la polaridad mejor
polaridad = class_pol [, 4]
Paso 5: cree un marco de datos con los resultados y obtenga algunas estadísticas generales
# marco de datos con resultados
sent_df = data.frame (text = some_txt, emotion = emotion,
polaridad = polaridad, stringsAsFactors = FALSE)# ordenar marco de datos
sent_df = dentro de (sent_df,
emoción <- factor (emoción, niveles = nombres (ordenar (tabla (emoción), decreciente = VERDADERO))))
más en: sentimiento – Minería de Twitter con R