¿Es posible que un ordenador interprete y codifique automáticamente las respuestas dadas a las preguntas abiertas de un cuestionario? ¿Es posible sustituir al ser humano en un trabajo tan cualitativo y tan personal como el de dar sentido a lo que el consumidor dice y encontrar patrones que nos permitan ahorrar tiempo en esa interpretación?
Lo que aparentemente puede sonar a ciencia ficción se está convirtiendo en realidad gracias a los avances en el campo de la inteligencia artificial.
Empresas como Iperceptions están trabajando ya en lo que puede ser una revolución de futuro, tal y como explican en su web, emplean "sofisticados algoritmos linguísticos para extraer los conceptos dominantes de las respuestas positivas o negativas".
Hasta ahora, conocíamos herramientas de software que facilitan el duro trabajo de recodificar las preguntas abiertas ordenando y agrupando las respuestas de forma automática por los términos que aparecen y asignándolas a categorías similares basándonos en consideraciones linguísticas. El problema surge cuando usamos un término como la unidad de medida (por ejemplo el término "insatifecho") ya que puede ignorar el contexto y hacer peor la categorización. El uso de estas herramientas estaba limitado a preguntas semi-abiertas, con un "otros" en el que se introducen respuestas simples y no párrafos de comentarios.
En las preguntas abiertas a un cuestionario, al igual que en la web, hay mucho “ruido lingüístico” y extraer los insights de todo aquello que no es relevante requiere de una capacidad que aún no es posible imitar con la computación. A pesar de todo, las técnicas de “text mining” (minería de textos) se llevan aplicando durante años en ámbitos tan diversos como el académico, la seguridad, la medicina o el software.
Algunas fuentes de información:
- Iperceptions: http://www.iperceptions.com/en/solutions/text-analysis
- Minería de textos: http://es.wikipedia.org/wiki/Miner%C3%ADa_de_textos
- Software de Text Mining: (en pdf) http://erabaki.ehu.es/jjga/?doc=MiningTextPimiento.pdf