EnglishEnglishEspañolEspañol

Entradas con la etiqueta ‘Sentiment Analysis’

Crónica del UX Spain 2012

publicado el Jueves, 17 de mayo de 2012 por: Equipo de Experiencia de Usuario
Etiquetas: - - - | 2 comentarios »

Mucho se ha contado ya (basta con revisar la lista abajo) acerca del primer UX Spain (Encuentro de profesionales de la Experiencia de Usuario en España) al que tuvimos ocasión de acudir el pasado 11 y 12 de mayo una representación de ocho Seres Paradigmáticos. A saber; @cvidal, @nacho_herranz, @vissit, @luiscalvodiaz, @jaucan, Óscar, Miguel y @davidmontalvo.

El evento deja algunos frentes de polémica que son, a nuestro parecer, el mejor legado que puede dejar algo de estas características (significa que seguimos vivos y cuestionamos lo que hacemos). El primero de ellos es la irregularidad en la calidad de las charlas, opinión que sí compartimos. Las mejores, desde nuestra humilde opinión, fueron las de Humberto Matas y Alberto Knapp por su capacidad inspiradora; Borja Delgado por su ritmo y rebeldía, la de Armando Fidalgo por su excelente preparación y contenido (sobre todo el arranque) y la de Javier Cañada por el punto de vista industrial con mensaje (esta se nos quedó un poco corta). Daniel Armengol compartió un tema sencillo pero supo contarlo y Nacho Madrid se arriesgó con un tema original, autocrítico y con visión propia (lo cual siempre es de agradecer). También destacó la mesa redonda de Nacho Puell, Álvaro Ortiz y Álvaro Varona moderada por Luis Villa que, partiendo de un tema jugoso pero poco enfocado, supieron lanzar media docena de ideas para guardar y meterse al público en el bolsillo.

La Universidad Pontificia de Salamanca, marco incomparable para la celebración del UX SpainLa organización (creo que ahí coincidimos todos) fue simplemente memorable, ¿un 9,5? :D El año que viene con el audio un poco más alto os lleváis un 10. No hemos visto exprimir 90 euros de semejante forma en ningún lugar de este universo: Hotel concertado con la organización a precio reducido, cafés y comidas más que suficientes, puntualidad, bolsa de recepción generosa, un wi-fi infatigable, un entorno privilegiado, las charlas de 15 minutos (un acierto) y una cena de gala que ya quisiera más de una boda ;) No podemos pedir más.

Otra cosa estupenda fue la cercanía. A diferencia de eventos como http://www.ux-lx.com (con ponentes internacionales de incuestionable renombre) el UX Spain fue muy “nuestro”. Casi todos pudimos charlar con algunos de los ponentes y organizadores sintiéndonos partícipes y dueños del evento.

La agria mesa redonda final nos pareció mucho más catártica y divertida que a la mayoría por lo que hemos leído. Con alguna torpeza de los invitados (en la forma pero no tantísimo en el fondo) fue triturada con más colmillo del necesario por la masa tuitera. No entendimos muy bien a aquellos que en el turno de preguntas decidieron hacer su propia “microponencia” (y no hemos encontrado a nadie que lo haya hecho).

Tampoco conviene tomarse demasiado en serio todo lo expelido en twitter; es más fácil conseguir cierto eco desde la acidez que desde la genialidad por lo que casi todos transitamos esa vía. Como ya hemos comentado algunos en el blog de Sergio, twitter fue un canal de entretenimiento, interacción e información genial; los tuits finales fueron de satisfacción y ganas de volver y nos queremos quedar con esa impresión. Queremos más y no nos conformamos.

Con respecto a Paradigma quedamos satisfechos con la acogida de nuestro regalo con el que además abrimos un concurso que permanecerá abierto hasta el 11 de junio. Nos sorprendió que pasara un poco desapercibida la ponencia de nuestro compañero @nacho_herranz porque fue de los pocos que dió una charla práctica; algo muy demandado por la concurrencia sobreponiéndose además a algunos problemas de audio y video. Aún nos preguntamos por qué sus diapositivas se vieron en blanco y negro . . .

En paralelo, y motivados por la repercusión del evento, lanzamos una app para seguir desde cualquier dispositivo el hashtag del evento #uxsp, y saber entre otras cosas quiénes han sido los más influyentes. Nuestro algoritmo Openinfluence ha dado más guerra de lo previsto desde el viernes, pero ahora sí podéis ver quien se lleva tan preciado reconocimiento.

Ya a modo de conclusión, un poco más emotiva, podríamos decir que arrancamos con la sensación de partir una fresca mañana de invierno para llegar en pleno verano. Hemos conocido a gente interesante, disfrutado de nuestras propias mesas redondas a la ida y a la vuelta con la buena compañia de @kremaster. La impresión final es que, sin lugar a dudas, habrá un UX Spain 2013 aún mejor.

Lista de crónicas en otros blogs:

 

Be Sociable, Share!
  • Twitter
  • Facebook
  • email
  • StumbleUpon
  • Delicious
  • Google Reader
  • LinkedIn
  • BlinkList

Minería de Opiniones: Realidades y ficciones (II)

publicado el Jueves, 22 de julio de 2010 por: Oscar Marín Miró
Etiquetas: - - | 2 comentarios »

En esta serie de artículos, pretendemos poner a esta tecnología (también llamada Sentiment Analysis, Opinion Extraction o Appraisal theory) en ‘su sitio’.

Antes de introducir las piedras técnicas y desmitificar algunas percepciones al respecto de la tecnología, se hace necesario introducir los siguientes conceptos:

  1. Subjetividad de un texto: Es una medida de la carga emocional del autor de un texto. Asi, por ejemplo: ‘Coca-cola es una compañía americada’ se considera una mención (no hay subjetividad), mientras que ‘Coca-cola me parece un buen refresco’ se considera una opinión. Es importante señalar que la subjetividad siempre es de un sujeto (el emisor) a un objeto (el receptor), y nos podemos encontrar con textos subjetivos respecto a una compañía y objetivos respecto a otra: “El otro día fui al Mercadona de mi barrio y me compré un exquisito jamón Bernardo Hernández”
  2. Polaridad de una opinión: Otra medida: cuantifica la negatividad/positividad de una opinión respecto a una entidad: “Coca-cola es demasiado cara” (polaridad negativa) vs “Coca-cola me encanta” (polaridad positiva)
  3. Sistema automático de clasificación de opiniones: Consta de dos etapas: detector de subjetividad y detector de polaridad
  4. Precisión de un sistema automático de clasificación de opiniones:
    • Respecto a la subjetividad: Qué porcentaje de textos clasificados como subjetivos respecto a una entidad (compañía, marca, persona, etc…) realmente lo son, cuando se revisan posteriormente por un humano
    • Respecto a la polaridad: Qué porcentaje de textos clasificados como positivos/negativos respecto a una entidad (compañía, marca, persona, etc…) realmente lo son, tras una revisión humana

Introducido el problema(1 y 2), su solución (3) y su medida de éxito (4), podemos proceder a desmitificar las siguientes asunciones académicas/comerciales:

Ficción número 1: El aprendizaje automático (machine learning) es la herramienta ideal para atacar el problema de la detección de polaridad de una opinión.

No es cierto. Es un tema con el que se siguen pegando en las universidades. El aprendizaje automático funciona bien, en general,cuando contamos con una gran muestra de ejemplos clasificados a mano y cuando las características sobre las que se entrena son estadísticamente independientes una de otra. El modelo común con el que se parte en este caso es el de ‘bag-of-words’: Es decir, el input al clasificador automático son las palabras del texto (‘tokens’), sin ningún orden, simplemente con el peso asociado a cada token correspondiente a su frecuencia de aparición. El problema es sutil, pero con un ejemplo se entiende bien:

  1. “No me gusta Coca-cola”. La entrada al clasificador es el vector ['No','me','gusta'] (eliminamos la entidad para no sesgar el entrenamiento).
  2. “Me gusta Coca-cola”. La entrada al clasificador es el vector ['me', 'gusta']
  3. “Me gusta Coca-cola pero no tengo sed hoy”. La entrada al clasificador es ['me', 'gusta','pero','no','tengo','sed','hoy']

A pesar de que 1) es negativa, 2) positiva y 3) positiva:

  • La palabra ‘gusta’ aparece en las tres y estadísticamente no se puede correlar con la polaridad
  • La palabra ‘no’ aparece en 1) y 3), pero tampoco se puede correlar, pues 1) es negativa y 3) positiva

Realmente, la lógica nos hace pensar que no debemos usar como características los tokens, sino las secuencias ‘no_me_gusta’ y ‘me_gusta’. Esta aproximación se denomina clasificación de ‘N-gramas’ [1], pero una vez más, nos encontramos con algunas trampas:

  • De qué longitud escogemos las secuencias? En los ejemplos, si escogemos N=2, ‘me_gusta’ aparece en las tres opiniones!
  • Sólo las cogemos de una longitud determinada? Qué pasa con casos como ‘casi no me gusta’ (sólo si cogemos N=4 se captura la secuencia correctamente, pero si también incluimos N=2, vuelve a aparecer ‘me_gusta’)

Tras unos buenos tortazos iniciales, en los que nunca conseguíamos una precisión superior al 60% (sin n-gramas y con n-gramas de ventana variable y fija), en Paradigma decidimos usar máquinas de estados y gramáticas que ‘entendieran’ el papel sintáctico de cada token y así conocer ‘dónde debemos recortar’ la opinión, de manera 100% acoplada a cada caso particular. El fondo del problema es que, para tareas de clasificación compleja y dependiente de las secuencias de entrada, el trabajo humano inicial que alimenta a un clasificador automático debe ser lo más completo y exhaustivo posible; y una extracción automática de tokens, no resuelve el problema, así como tampoco la generación de N-gramas.

Con los nuevos modelos basados en gramáticas, saltamos de un 60% a un mínimo de un 80%, que como se verá más adelante, y por varios motivos, está muy cercano al techo tecnológico o incluso perceptual.

[1] http://es.wikipedia.org/wiki/N-grama

Be Sociable, Share!
  • Twitter
  • Facebook
  • email
  • StumbleUpon
  • Delicious
  • Google Reader
  • LinkedIn
  • BlinkList

Minería de Opiniones: Realidades y ficciones (I)

publicado el Martes, 20 de julio de 2010 por: Oscar Marín Miró
Etiquetas: - - | 2 comentarios »

“Show me the business man or institution not guided by sentiment and service; by the idea that ‘he profits most who serves best’ and I will show you a man or an outfit that is dead or dying.” – Charles H. Spurgeon

Antes de la web social, preguntábamos a nuestros amigos cuando necesitábamos una recomendación en cualquier ámbito: películas, libros, servicios, hoteles… Hoy en día, Internet hace posible encontrar opiniones en casi cualquier ámbito.

Atendiendo a un estudio realizado sobre 2000 adultos americanos [1] y [2]:

  • El 81% de los usuarios de Internet han hecho ‘investigaciones online’ sobre un producto o servicio al menos una vez en su vida
  • El 20% de los usuarios lo hacen a diario
  • Los consumidores afirman estar dispuestos a pagar de un 20% a un 99% más por un producto marcado con 5 estrellas, respecto a los marcados por 4 (en un sistema de evaluación de 1 a 5 estrellas, se entiende

Se hace obvio, que desde el punto de vista de una compañía de productos y servicios, el análisis de las opiniones sobre la misma que circulan por Internet se hace esencial hoy en día, y que hay una relación directa entre la inversión en la optimización del ‘clima social’ respecto a la marca y los rendimientos comerciales de dichos productos/servicios.

En Paradigma Tecnológico, entendemos como minería de opiniones la búsqueda, adquisición y análisis de las opiniones relevantes a un producto o servicio, generalmente acompañada del mismo proceso aplicado a sus competidores.

En esta serie de artículos, pretendemos poner a esta tecnología (también llamada Sentiment Analysis, Opinion Extraction o Appraisal theory) en ‘su sitio’, apalancándonos en la experiencia que nos ha dado el diseño de productos actualmente en producción, y siempre tratando de encontrar un equilibrio óptimo entre la base teórica subyacente y la realidad práctica del mercado.

[1] comScore/the Kelsey group, “Online consumer-generated reviews have significant impact on offline purchase behavior,” Press Release, http://www. comscore.com/press/release.asp?press=1928, November 2007.

[2] J. A. Horrigan, “Online shopping,” Pew Internet & American LifePro ject Report, 2008

Be Sociable, Share!
  • Twitter
  • Facebook
  • email
  • StumbleUpon
  • Delicious
  • Google Reader
  • LinkedIn
  • BlinkList


Nuestro Blog

Autor: Equipo de Experiencia de Usuario - Jueves, 17 de mayo de 2012

Mucho se ha contado ya (basta con revisar la lista abajo) acerca del primer UX Spain (Encuentro de profesionales de la Experiencia de Usuario en España) al que tuvimos ocasión de acudir el pasado 11 y 12 de mayo una representación de ocho Seres Paradigmáticos. A saber; @cvidal, @nacho_herranz, @vissit, @luiscalvodiaz, @jaucan, Óscar, Miguel y @davidmontalvo.

Ver más
Autor: Paradigma - Jueves, 27 de octubre de 2011