Tengo alrededor de 40,000 datos revelados para un producto en particular. Quiero realizar un análisis de sentimientos. ¿Cómo abordo esto usando Excel, R o SAS? Cosas Personales

R tiene un paquete llamado ‘sentimiento’ que puede usar. También puede usar varios algoritmos de aprendizaje automático para el entrenamiento de datos. Estos son los pasos al hacer con R:

Paso 1: cargue los paquetes necesarios (es posible que necesite descargar paquetes que no están disponibles de forma predeterminada)

# paquetes requeridos
biblioteca (twitteR)
biblioteca (sentimiento)
biblioteca (plyr)
biblioteca (ggplot2)
biblioteca (wordcloud)
biblioteca (RColorBrewer)

Paso 2: Seleccione algunos datos que desea usar. Puedes cargarlo usando readLines ()

# cosechar algunos tweets
some_tweets = searchTwitter (“starbucks”, n = 1500, lang = “en”)

# obtener el texto
some_txt = sapply (some_tweets, function (x) x $ getText ())

Paso 3: prepare el texto para el análisis de sentimientos

# eliminar entidades retweet
some_txt = gsub (“(RT | via) ((?: \\ b \\ W * @ \\ w +) +)”, “”, some_txt)
# eliminar a las personas
some_txt = gsub (“@ \\ w +”, “”, some_txt)
# eliminar puntuación
some_txt = gsub (“[[: punct:]]”, “”, some_txt)
# eliminar números
some_txt = gsub (“[[: dígito:]]”, “”, some_txt)
# eliminar enlaces html
some_txt = gsub (“http \\ w +”, “”, some_txt)
# eliminar espacios innecesarios
some_txt = gsub (“[\ t] {2,}”, “”, some_txt)
some_txt = gsub (“^ \\ s + | \\ s + $”, “”, some_txt)

# define la función “manejo de errores de tolower”
try.error = function (x)
{
# crear valor perdido
y = NA
# tryCatch error
try_error = tryCatch (tolower (x), error = function (e) e)
# si no es un error
if (! hereits (try_error, “error”))
y = tolower (x)
# resultado
volver (y)
}
# minúsculas usando try.error con sapply
some_txt = sapply (some_txt, try.error)

# eliminar NAs en some_txt
some_txt = some_txt [! Página en is.na (some_txt)]
nombres (some_txt) = NULL

Paso 4: Realice el Análisis de opinión utilizando un algoritmo de clasificación incorporado como svm, bayes

# clasifica la emoción
class_emo = classify_emotion (some_txt, Algoritmo = “bayes”, anterior = 1.0)
# consigue la mejor emoción
emoción = clase_emo [, 7]
# sustituir NA por “desconocido”
emoción [Página en is.na (emoción)] = “desconocido”

# clasificar polaridad
class_pol = classify_polarity (some_txt, Algoritmo = “bayes”)
# consigue la polaridad mejor
polaridad = class_pol [, 4]

Paso 5: cree un marco de datos con los resultados y obtenga algunas estadísticas generales

# marco de datos con resultados
sent_df = data.frame (text = some_txt, emotion = emotion,
polaridad = polaridad, stringsAsFactors = FALSE)

# ordenar marco de datos
sent_df = dentro de (sent_df,
emoción <- factor (emoción, niveles = nombres (ordenar (tabla (emoción), decreciente = VERDADERO))))

más en: sentimiento – Minería de Twitter con R