SlideShare ist ein Scribd-Unternehmen logo
1 von 19
Análisis del «sentimiento»
Marzo 2013
¿Qué es?
Es el utilizar un software que automáticamente
extrae opiniones, emociones y el sentir de la gente
en un texto.
Nos permite rastrear actitudes y sentimiento en el
web. Ya sea en blogs, comentarios, foros, twitter
etc.
Se pueden rastrear productos, marcas o personas
para determinar si son bien o mal vistos en la red.
Podemos analizar…
• Hechos
– «Esa pintura costó más que un Monet»
• Opiniones
– «El Monet no me gustó, Pollock es un mejor
artista»
Varias áreas de la computación se mezclan
• Procesamiento de lenguaje natural
– Transforma el texto en un formato que la máquina
puede comprender
• Big Data
– Se recaban una gran cantidad de datos (minería de
datos, minería de opiniones) para mejorar el
desempeño de los algoritmos
• Inteligencia artificial
– Utiliza la información que le da el PLN y muchas
matemáticas para determinar si algo es positivo o
negativo
El problema tiene varias dimensiones
• ¿Cómo define el algoritmo la subjetividad y el sentir?
• ¿Cómo analizamos la polaridad (positivo/negativo)?
• ¿Cómo lidiamos con oraciones con palabras subjetivas?
• ¿Cómo asignamos un valor a una opinión?
• ¿Cómo podemos saber la intensidad de un sentimiento?
HE y ML
• Human Engineering
– Sistemas expertos con listas de palabras buenas y
malas hechas a mano
• Machine Learning
– NLP: Procesamiento natural del lenguaje y
entendimiento del habla, se utilizan modelos
estadísticos y sets de entrenamiento
– Tipos:
• Supervisado y directo
• Sin supervisar y sin datos
• Semisupervisado
¿Qué es una opinión para una máquina?
Es un «quintuple» o sea un objeto hecho de 5 cosas
distintas
O -> el objeto en cuestión
f-> alguna característica del objeto
so->el valor del sentir de la opinión de la persona h en cuanto a la
característica f del objeto o al tiempo t
Estos 5 elementos los tiene que identificar el software
(definido por Bing Liu en el NLP Handbook)
El lenguaje es demasiado ambiguo
para la máquina
«El reloj no es resistente al agua» - Es negativo en una
reseña pero neutral en la descripción del producto
«tan útil como una trampa en un bote salvavidas» –Es
negativo pero no lo entiende la máquina
«lol estuvo increeeeeibleeeeee» - lenguaje común en
redes muy difícil de procesar
Obtenemos «Social Data»
El proceso inicial…
Etiquetar parte del discurso pero también la posición y más:
Las palabras en un texto son etiquetadas usando un POStagger
(Petra tagger en español) para asignarle una etiqueta a cada
palabra, permitiendo así que el algoritmo las pueda procesar, esto
se ve algo así:
Revisamos como están orientado el sentimiento (so) de
los patrones que extrajimos:
Increíble + Teléfono
Lo cual es:
[JJ] + [NN] (adjetivo seguido por un sustantivo)
Lo opuesto sería terrible, en este paso el algoritmo
trata de situar en una escala emotiva por así decirlo
Los efectos de la negación
«la comida no estuvo buena»
Hay que seguir el negativo hasta el término de la oración
o algún signo de puntuación para determinar el
sentimiento
El efecto de la negación depende del término
Por ejemplo:
Doble negativo mediano -> no está mal = bien
Doble negativo extremo -> no está horrible = regular
Parcialidad del aprendizaje
• Si revisamos IMDB encontramos que la palabra «bad» se repite
mucho más veces en las críticas con 10 estrellas que en las de 2
estrellas
• Por lo tanto tenemos que normalizar usando las frecuencias
relativas
Sentimiento en redes
• Emoticons
–  ;( :/
– Con expresiones regulares podemos detectar el 95% de estos
– Ignoramos los complejos
• Longitud
– «La presentación estuvo geniaaaaaaaaaaaal! David es el mejoooooor!
Ahhhhhhhh!»
– No hay palabras con 3 vocales seguidas
– Fácil de normalizar por lo común que son
El ruidio lo podemos quitar con más datos, usamos la idea de Big Data
y limpiamos los datos
Incluimos muchos modelos de entrenamiento
Clasificando los «sentimientos»
• Naive Bayes (usamos el teoréma de Bayes)
• Entropía máxima (usa distribuciones de
probabilidad con base a conocimiento parcial)
• Support Vector Machine (los datos los
convertimos a vectores en un espacio 2D)
• Relevance Vector Machine ( similar a SVM pero
asigna probabilidades usando Sparse Bayesian
Learning para ARD)
SVM y RVM tienen un 80% de mejor desempeño
que los otros
Herremientas
• Part-of-speech (POS) taggers
– Petra a POS tagger en español
• Parsers
– Enju — A deep syntactic parser for English
– CFG Parser — A fast CFG parser for English
• Named entitities/terms
– Named-entity Recognizer — Part of the GENIA Tagger
– ACELA — Tool for efficient annotation of named entitites
– Smart dictionary lookup — machine learning-based gene/protein name lookup
– Term Normalization Tool — Normalizes terms with string rewriting rules automatically
generated based on a dictionary.
• Other tools
– EventMine — A machine learning-based event extraction system.
– brat — A free, open-source, web-based tool for text annotation visualisation and editing.
– Cafetiere — An easy-to-use text mining system for carrying text mining on your own document
collection
– Sentence and paragraph breaker — An accurate sentence and paragraph detector based on
heuristic rules
– Clinical Document Classification — automatic document classification demo
– Sentiment Analysis Tool — Analyses sentiment of input text.
– Rapid Miner - Professional open source data mining made easy: Analytical ETL, Data Mining,
and Predictive Reporting with a single solution
Las bases del análisis del sentimiento en redes sociales

Weitere ähnliche Inhalte

Was ist angesagt?

Opinion Mining
Opinion MiningOpinion Mining
Opinion Mining
Ali Habeeb
 
Twitter sentiment-analysis Jiit2013-14
Twitter sentiment-analysis Jiit2013-14Twitter sentiment-analysis Jiit2013-14
Twitter sentiment-analysis Jiit2013-14
Rachit Goel
 
Fake News Detection using Machine Learning
Fake News Detection using Machine LearningFake News Detection using Machine Learning
Fake News Detection using Machine Learning
ijtsrd
 

Was ist angesagt? (20)

Sentiment analysis of Twitter data using python
Sentiment analysis of Twitter data using pythonSentiment analysis of Twitter data using python
Sentiment analysis of Twitter data using python
 
Twitter Sentiment Analysis
Twitter Sentiment AnalysisTwitter Sentiment Analysis
Twitter Sentiment Analysis
 
Text classification & sentiment analysis
Text classification & sentiment analysisText classification & sentiment analysis
Text classification & sentiment analysis
 
Sentiment Analysis in Twitter
Sentiment Analysis in TwitterSentiment Analysis in Twitter
Sentiment Analysis in Twitter
 
sentiment analysis
sentiment analysis sentiment analysis
sentiment analysis
 
Twitter sentiment analysis.pptx
Twitter sentiment analysis.pptxTwitter sentiment analysis.pptx
Twitter sentiment analysis.pptx
 
Sentiment analysis of twitter data
Sentiment analysis of twitter dataSentiment analysis of twitter data
Sentiment analysis of twitter data
 
Sentiment Analysis on Twitter
Sentiment Analysis on TwitterSentiment Analysis on Twitter
Sentiment Analysis on Twitter
 
New sentiment analysis of tweets using python by Ravi kumar
New sentiment analysis of tweets using python by Ravi kumarNew sentiment analysis of tweets using python by Ravi kumar
New sentiment analysis of tweets using python by Ravi kumar
 
Opinion Mining
Opinion MiningOpinion Mining
Opinion Mining
 
Sentiment Analaysis on Twitter
Sentiment Analaysis on TwitterSentiment Analaysis on Twitter
Sentiment Analaysis on Twitter
 
Project prSentiment Analysis of Twitter Data Using Machine Learning Approach...
Project prSentiment Analysis  of Twitter Data Using Machine Learning Approach...Project prSentiment Analysis  of Twitter Data Using Machine Learning Approach...
Project prSentiment Analysis of Twitter Data Using Machine Learning Approach...
 
Twitter sentiment analysis project report
Twitter sentiment analysis project reportTwitter sentiment analysis project report
Twitter sentiment analysis project report
 
Twitter sentiment-analysis Jiit2013-14
Twitter sentiment-analysis Jiit2013-14Twitter sentiment-analysis Jiit2013-14
Twitter sentiment-analysis Jiit2013-14
 
Sentiment analysis - Our approach and use cases
Sentiment analysis - Our approach and use casesSentiment analysis - Our approach and use cases
Sentiment analysis - Our approach and use cases
 
Meta-Learning Presentation
Meta-Learning PresentationMeta-Learning Presentation
Meta-Learning Presentation
 
Machine learning ppt
Machine learning ppt Machine learning ppt
Machine learning ppt
 
Text Classification, Sentiment Analysis, and Opinion Mining
Text Classification, Sentiment Analysis, and Opinion MiningText Classification, Sentiment Analysis, and Opinion Mining
Text Classification, Sentiment Analysis, and Opinion Mining
 
Sentiment Analysis of Twitter Data
Sentiment Analysis of Twitter DataSentiment Analysis of Twitter Data
Sentiment Analysis of Twitter Data
 
Fake News Detection using Machine Learning
Fake News Detection using Machine LearningFake News Detection using Machine Learning
Fake News Detection using Machine Learning
 

Andere mochten auch

El lenguaje de las redes sociales ¿destrucción o moda
El lenguaje de las redes sociales  ¿destrucción o moda El lenguaje de las redes sociales  ¿destrucción o moda
El lenguaje de las redes sociales ¿destrucción o moda
santiago echeverri
 
Los sentimientos y las emociones
Los sentimientos y las emocionesLos sentimientos y las emociones
Los sentimientos y las emociones
clauvi10
 
Taking R to the Limit (High Performance Computing in R), Part 1 -- Paralleliz...
Taking R to the Limit (High Performance Computing in R), Part 1 -- Paralleliz...Taking R to the Limit (High Performance Computing in R), Part 1 -- Paralleliz...
Taking R to the Limit (High Performance Computing in R), Part 1 -- Paralleliz...
Ryan Rosario
 

Andere mochten auch (19)

Deep Learning + R by Gabriel Valverde
Deep Learning + R by Gabriel ValverdeDeep Learning + R by Gabriel Valverde
Deep Learning + R by Gabriel Valverde
 
Análisis de Sentimientos en un Corpus de Redes Sociales
Análisis de Sentimientos en un Corpus de Redes SocialesAnálisis de Sentimientos en un Corpus de Redes Sociales
Análisis de Sentimientos en un Corpus de Redes Sociales
 
Análisis de sentimientos con NLTK
Análisis de sentimientos con NLTKAnálisis de sentimientos con NLTK
Análisis de sentimientos con NLTK
 
Taller de Text Mining en Twitter con R
Taller de Text Mining en Twitter con RTaller de Text Mining en Twitter con R
Taller de Text Mining en Twitter con R
 
Presentación Guadalajara #Tecnopoliticay15M
Presentación Guadalajara #Tecnopoliticay15MPresentación Guadalajara #Tecnopoliticay15M
Presentación Guadalajara #Tecnopoliticay15M
 
Emociones pasiones y sentimientos
Emociones pasiones y sentimientosEmociones pasiones y sentimientos
Emociones pasiones y sentimientos
 
Introducción a Text Mining
Introducción a Text MiningIntroducción a Text Mining
Introducción a Text Mining
 
El lenguaje de las redes sociales ¿destrucción o moda
El lenguaje de las redes sociales  ¿destrucción o moda El lenguaje de las redes sociales  ¿destrucción o moda
El lenguaje de las redes sociales ¿destrucción o moda
 
Los sentimientos y las emociones
Los sentimientos y las emocionesLos sentimientos y las emociones
Los sentimientos y las emociones
 
EMOCIONES Y SENTIMIENTOS- FANNY JEM WONG
EMOCIONES Y SENTIMIENTOS- FANNY JEM WONGEMOCIONES Y SENTIMIENTOS- FANNY JEM WONG
EMOCIONES Y SENTIMIENTOS- FANNY JEM WONG
 
Apache Storm vs. Spark Streaming – two Stream Processing Platforms compared
Apache Storm vs. Spark Streaming – two Stream Processing Platforms comparedApache Storm vs. Spark Streaming – two Stream Processing Platforms compared
Apache Storm vs. Spark Streaming – two Stream Processing Platforms compared
 
Emociones - denifición y clasificaciones -
Emociones - denifición y clasificaciones -Emociones - denifición y clasificaciones -
Emociones - denifición y clasificaciones -
 
Signo Linguístico
Signo LinguísticoSigno Linguístico
Signo Linguístico
 
Emociones
EmocionesEmociones
Emociones
 
Sentimientos y emociones
Sentimientos y emocionesSentimientos y emociones
Sentimientos y emociones
 
Las Emociones
Las EmocionesLas Emociones
Las Emociones
 
Iconos
IconosIconos
Iconos
 
Diferencias de Lenguaje, Lengua, habla y norma
Diferencias de Lenguaje, Lengua, habla y normaDiferencias de Lenguaje, Lengua, habla y norma
Diferencias de Lenguaje, Lengua, habla y norma
 
Taking R to the Limit (High Performance Computing in R), Part 1 -- Paralleliz...
Taking R to the Limit (High Performance Computing in R), Part 1 -- Paralleliz...Taking R to the Limit (High Performance Computing in R), Part 1 -- Paralleliz...
Taking R to the Limit (High Performance Computing in R), Part 1 -- Paralleliz...
 

Ähnlich wie Las bases del análisis del sentimiento en redes sociales

Consejos y técnicas a la hora de programar - 1998
Consejos y técnicas a la hora de programar - 1998Consejos y técnicas a la hora de programar - 1998
Consejos y técnicas a la hora de programar - 1998
Luis Eduardo Pelaez Valencia
 
Algoritmos y estructura de datos
Algoritmos y estructura de datosAlgoritmos y estructura de datos
Algoritmos y estructura de datos
Lily- XztrzitA-
 
Herramientas ofimaticas
Herramientas ofimaticasHerramientas ofimaticas
Herramientas ofimaticas
sanr
 
Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdfSesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
Juan225106
 
Periodo 3 desarrollo de habilidades de pensamiento - trabajo grupal
Periodo 3  desarrollo de habilidades de pensamiento - trabajo grupalPeriodo 3  desarrollo de habilidades de pensamiento - trabajo grupal
Periodo 3 desarrollo de habilidades de pensamiento - trabajo grupal
AndrsSinisterra1
 

Ähnlich wie Las bases del análisis del sentimiento en redes sociales (20)

Bots
BotsBots
Bots
 
Consejos y técnicas a la hora de programar - 1998
Consejos y técnicas a la hora de programar - 1998Consejos y técnicas a la hora de programar - 1998
Consejos y técnicas a la hora de programar - 1998
 
Introducción al Machine learning en Android
Introducción al Machine learning en AndroidIntroducción al Machine learning en Android
Introducción al Machine learning en Android
 
Word
WordWord
Word
 
Algoritmos y estructura de datos
Algoritmos y estructura de datosAlgoritmos y estructura de datos
Algoritmos y estructura de datos
 
Unidad 1
Unidad 1Unidad 1
Unidad 1
 
INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...
INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...
INVESTIGACIÓN COMERCIAL - TEMA 8 UTILIZACIÓN DE PROGRAMAS INFORMÁTICOS - FP A...
 
Herramientas ofimaticas
Herramientas ofimaticasHerramientas ofimaticas
Herramientas ofimaticas
 
Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdfSesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
 
Pythonlearn-01-Intro.pptx
Pythonlearn-01-Intro.pptxPythonlearn-01-Intro.pptx
Pythonlearn-01-Intro.pptx
 
Unidad 1
Unidad 1Unidad 1
Unidad 1
 
Ada 30
Ada 30Ada 30
Ada 30
 
Periodo 3 desarrollo de habilidades de pensamiento - trabajo grupal
Periodo 3  desarrollo de habilidades de pensamiento - trabajo grupalPeriodo 3  desarrollo de habilidades de pensamiento - trabajo grupal
Periodo 3 desarrollo de habilidades de pensamiento - trabajo grupal
 
Periodo 3 desarrollo de habilidades de pensamiento - trabajo grupal
Periodo 3  desarrollo de habilidades de pensamiento - trabajo grupalPeriodo 3  desarrollo de habilidades de pensamiento - trabajo grupal
Periodo 3 desarrollo de habilidades de pensamiento - trabajo grupal
 
Inteligencias múltiples
Inteligencias múltiplesInteligencias múltiples
Inteligencias múltiples
 
Inteligencia Artificial
Inteligencia ArtificialInteligencia Artificial
Inteligencia Artificial
 
Tópicos 20-10-15
Tópicos 20-10-15Tópicos 20-10-15
Tópicos 20-10-15
 
CHAT GPT.pptx
CHAT GPT.pptxCHAT GPT.pptx
CHAT GPT.pptx
 
MANUAL VISUAL BASIC.pdf
MANUAL VISUAL BASIC.pdfMANUAL VISUAL BASIC.pdf
MANUAL VISUAL BASIC.pdf
 
Video
VideoVideo
Video
 

Mehr von CyberIntellix

Tipos de anuncios en facebook para tu empresa
Tipos de anuncios en facebook para tu empresaTipos de anuncios en facebook para tu empresa
Tipos de anuncios en facebook para tu empresa
CyberIntellix
 
Ser un líder en las redes sociales
Ser un líder en las redes socialesSer un líder en las redes sociales
Ser un líder en las redes sociales
CyberIntellix
 
100 cosas que todo diseñador debe saber sobre las personas parte 1
100 cosas que todo diseñador debe saber sobre las personas parte 1100 cosas que todo diseñador debe saber sobre las personas parte 1
100 cosas que todo diseñador debe saber sobre las personas parte 1
CyberIntellix
 
Primeros pasos para crear una comunidad digital
Primeros pasos para crear una comunidad digitalPrimeros pasos para crear una comunidad digital
Primeros pasos para crear una comunidad digital
CyberIntellix
 
Principios de un buen diseño web
Principios de un buen diseño webPrincipios de un buen diseño web
Principios de un buen diseño web
CyberIntellix
 
Un buen Layout para entretener, cautivar e informar al usuario
Un buen Layout para entretener, cautivar e informar al usuarioUn buen Layout para entretener, cautivar e informar al usuario
Un buen Layout para entretener, cautivar e informar al usuario
CyberIntellix
 

Mehr von CyberIntellix (20)

Tipos de anuncios en facebook para tu empresa
Tipos de anuncios en facebook para tu empresaTipos de anuncios en facebook para tu empresa
Tipos de anuncios en facebook para tu empresa
 
Como crecer tu marca en facebook con anuncios 2014
Como crecer tu marca en facebook con anuncios 2014Como crecer tu marca en facebook con anuncios 2014
Como crecer tu marca en facebook con anuncios 2014
 
Ser un líder en las redes sociales
Ser un líder en las redes socialesSer un líder en las redes sociales
Ser un líder en las redes sociales
 
Crea tu cuarto de guerrra para redes sociales
Crea tu cuarto de guerrra para redes sociales Crea tu cuarto de guerrra para redes sociales
Crea tu cuarto de guerrra para redes sociales
 
Cómo crear imágenes para el perfil de Twitter
Cómo crear imágenes para el perfil de TwitterCómo crear imágenes para el perfil de Twitter
Cómo crear imágenes para el perfil de Twitter
 
Las bases para crear una comunidad en las redes sociales
Las bases para crear una comunidad en las redes socialesLas bases para crear una comunidad en las redes sociales
Las bases para crear una comunidad en las redes sociales
 
Casos de estudio sobre las tendencias tecnológicas en activaciones y eventos
Casos de estudio sobre las tendencias tecnológicas en activaciones y eventosCasos de estudio sobre las tendencias tecnológicas en activaciones y eventos
Casos de estudio sobre las tendencias tecnológicas en activaciones y eventos
 
Usando contenido visual para generar emociones
Usando contenido visual para generar emocionesUsando contenido visual para generar emociones
Usando contenido visual para generar emociones
 
Las bases del diseño emocional
Las bases del diseño emocionalLas bases del diseño emocional
Las bases del diseño emocional
 
¿Cómo hacer mercadotecnia de tus libros en internet?
¿Cómo hacer mercadotecnia de tus libros en internet?¿Cómo hacer mercadotecnia de tus libros en internet?
¿Cómo hacer mercadotecnia de tus libros en internet?
 
Contar Historias con nuestro sitio web y/o aplicación (Storytelling)
Contar Historias con nuestro sitio web y/o aplicación (Storytelling)Contar Historias con nuestro sitio web y/o aplicación (Storytelling)
Contar Historias con nuestro sitio web y/o aplicación (Storytelling)
 
Como conectar y hacer amigos en las redes sociales
Como conectar y hacer amigos en las redes socialesComo conectar y hacer amigos en las redes sociales
Como conectar y hacer amigos en las redes sociales
 
¿Qué es el content marketing?
¿Qué es el content marketing?¿Qué es el content marketing?
¿Qué es el content marketing?
 
100 cosas que todo diseñador debe saber sobre las personas parte 1
100 cosas que todo diseñador debe saber sobre las personas parte 1100 cosas que todo diseñador debe saber sobre las personas parte 1
100 cosas que todo diseñador debe saber sobre las personas parte 1
 
Primeros pasos para crear una comunidad digital
Primeros pasos para crear una comunidad digitalPrimeros pasos para crear una comunidad digital
Primeros pasos para crear una comunidad digital
 
Principios de un buen diseño web
Principios de un buen diseño webPrincipios de un buen diseño web
Principios de un buen diseño web
 
Uso del color en el diseño web
Uso del color en el diseño webUso del color en el diseño web
Uso del color en el diseño web
 
Contenido editorial para web
Contenido editorial para webContenido editorial para web
Contenido editorial para web
 
Un buen Layout para entretener, cautivar e informar al usuario
Un buen Layout para entretener, cautivar e informar al usuarioUn buen Layout para entretener, cautivar e informar al usuario
Un buen Layout para entretener, cautivar e informar al usuario
 
Diseño para cautivar en 8 segundos
Diseño para cautivar en 8 segundosDiseño para cautivar en 8 segundos
Diseño para cautivar en 8 segundos
 

Kürzlich hochgeladen

Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
241521559
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
FagnerLisboa3
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
silviayucra2
 

Kürzlich hochgeladen (10)

Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 

Las bases del análisis del sentimiento en redes sociales

  • 2.
  • 3. ¿Qué es? Es el utilizar un software que automáticamente extrae opiniones, emociones y el sentir de la gente en un texto. Nos permite rastrear actitudes y sentimiento en el web. Ya sea en blogs, comentarios, foros, twitter etc. Se pueden rastrear productos, marcas o personas para determinar si son bien o mal vistos en la red.
  • 4. Podemos analizar… • Hechos – «Esa pintura costó más que un Monet» • Opiniones – «El Monet no me gustó, Pollock es un mejor artista»
  • 5. Varias áreas de la computación se mezclan • Procesamiento de lenguaje natural – Transforma el texto en un formato que la máquina puede comprender • Big Data – Se recaban una gran cantidad de datos (minería de datos, minería de opiniones) para mejorar el desempeño de los algoritmos • Inteligencia artificial – Utiliza la información que le da el PLN y muchas matemáticas para determinar si algo es positivo o negativo
  • 6. El problema tiene varias dimensiones • ¿Cómo define el algoritmo la subjetividad y el sentir? • ¿Cómo analizamos la polaridad (positivo/negativo)? • ¿Cómo lidiamos con oraciones con palabras subjetivas? • ¿Cómo asignamos un valor a una opinión? • ¿Cómo podemos saber la intensidad de un sentimiento?
  • 7.
  • 8. HE y ML • Human Engineering – Sistemas expertos con listas de palabras buenas y malas hechas a mano • Machine Learning – NLP: Procesamiento natural del lenguaje y entendimiento del habla, se utilizan modelos estadísticos y sets de entrenamiento – Tipos: • Supervisado y directo • Sin supervisar y sin datos • Semisupervisado
  • 9. ¿Qué es una opinión para una máquina? Es un «quintuple» o sea un objeto hecho de 5 cosas distintas O -> el objeto en cuestión f-> alguna característica del objeto so->el valor del sentir de la opinión de la persona h en cuanto a la característica f del objeto o al tiempo t Estos 5 elementos los tiene que identificar el software (definido por Bing Liu en el NLP Handbook)
  • 10. El lenguaje es demasiado ambiguo para la máquina «El reloj no es resistente al agua» - Es negativo en una reseña pero neutral en la descripción del producto «tan útil como una trampa en un bote salvavidas» –Es negativo pero no lo entiende la máquina «lol estuvo increeeeeibleeeeee» - lenguaje común en redes muy difícil de procesar
  • 12. El proceso inicial… Etiquetar parte del discurso pero también la posición y más: Las palabras en un texto son etiquetadas usando un POStagger (Petra tagger en español) para asignarle una etiqueta a cada palabra, permitiendo así que el algoritmo las pueda procesar, esto se ve algo así:
  • 13. Revisamos como están orientado el sentimiento (so) de los patrones que extrajimos: Increíble + Teléfono Lo cual es: [JJ] + [NN] (adjetivo seguido por un sustantivo) Lo opuesto sería terrible, en este paso el algoritmo trata de situar en una escala emotiva por así decirlo
  • 14. Los efectos de la negación «la comida no estuvo buena» Hay que seguir el negativo hasta el término de la oración o algún signo de puntuación para determinar el sentimiento El efecto de la negación depende del término Por ejemplo: Doble negativo mediano -> no está mal = bien Doble negativo extremo -> no está horrible = regular
  • 15. Parcialidad del aprendizaje • Si revisamos IMDB encontramos que la palabra «bad» se repite mucho más veces en las críticas con 10 estrellas que en las de 2 estrellas • Por lo tanto tenemos que normalizar usando las frecuencias relativas
  • 16. Sentimiento en redes • Emoticons –  ;( :/ – Con expresiones regulares podemos detectar el 95% de estos – Ignoramos los complejos • Longitud – «La presentación estuvo geniaaaaaaaaaaaal! David es el mejoooooor! Ahhhhhhhh!» – No hay palabras con 3 vocales seguidas – Fácil de normalizar por lo común que son El ruidio lo podemos quitar con más datos, usamos la idea de Big Data y limpiamos los datos Incluimos muchos modelos de entrenamiento
  • 17. Clasificando los «sentimientos» • Naive Bayes (usamos el teoréma de Bayes) • Entropía máxima (usa distribuciones de probabilidad con base a conocimiento parcial) • Support Vector Machine (los datos los convertimos a vectores en un espacio 2D) • Relevance Vector Machine ( similar a SVM pero asigna probabilidades usando Sparse Bayesian Learning para ARD) SVM y RVM tienen un 80% de mejor desempeño que los otros
  • 18. Herremientas • Part-of-speech (POS) taggers – Petra a POS tagger en español • Parsers – Enju — A deep syntactic parser for English – CFG Parser — A fast CFG parser for English • Named entitities/terms – Named-entity Recognizer — Part of the GENIA Tagger – ACELA — Tool for efficient annotation of named entitites – Smart dictionary lookup — machine learning-based gene/protein name lookup – Term Normalization Tool — Normalizes terms with string rewriting rules automatically generated based on a dictionary. • Other tools – EventMine — A machine learning-based event extraction system. – brat — A free, open-source, web-based tool for text annotation visualisation and editing. – Cafetiere — An easy-to-use text mining system for carrying text mining on your own document collection – Sentence and paragraph breaker — An accurate sentence and paragraph detector based on heuristic rules – Clinical Document Classification — automatic document classification demo – Sentiment Analysis Tool — Analyses sentiment of input text. – Rapid Miner - Professional open source data mining made easy: Analytical ETL, Data Mining, and Predictive Reporting with a single solution