
Alberto G. Luna
12/05/2012
(06:00)
Escribe tu comentario
El hecho de que Internet crezca sin control hace que a los profesionales que trabajan en reputación on-line o los simples usuarios, en ocasiones no puedan realizar satisfactoriamente sus búsquedas. Cada vez es más difícil encontrar determinadas palabras en los buscadores como por ejemplo Google o Bing. ¿La razón? La nueva información que ‘entierra’ a la antigua, y que cada vez dura menos en el tiempo. En entornos como en Twitter por ejemplo, la información dura menos aún y es más complejo acertar con lo que se busca. Cuando menos texto se tiene es más complicado resolver la ambigüedad, porque hay menos contexto.
El proyecto Limosine trabaja para evitar estos problemas. Está formado por miembros de las universidades de Amsterdam, Glasgow, Trento, UNED, el Barcelona Media Research de Yahoo! y Llorente & Cuenca. Centrados en las necesidades que tienen los consultores de comunicación, su objetivo es el de resumir la ambigüedad que se produce en Internet y enriquecer las búsquedas. "No estamos creando motores de búsqueda", asegura Julio Gonzalo, Profesor Titular en el Departamento de Lenguajes y Sistemas Informáticos de la UNED. "Creamos herramientas que trabajan en las salidas de los motores de búsquedas. El buscador hace una representación que permite resultados muy eficientes. A partir de ahí es cuando entra el proyecto. Estamos un paso por encima de un buscador normal".
Y parece que el proyecto está convenciendo a la Unión Europea que, según el blog oficial de Llorente & Cuenca ha dotado a la iniciativa con 5 millones de euros para que en los próximos años se avance en la investigación. Pero, ¿cómo funciona realmente Limosine?
"Nuestra primera capa crea herramientas de procesado donde se saca toda la información semántica que se puede y se agrega. La segunda son los escenarios de Internet donde se va a utilizar, y que son Flikr, Yahoo! Answers y Gestión de la Reputación On-line", explica Julio Gonzalo. "El proyecto lo que busca es comprender los textos en Internet mediante la semántica y la sintaxis; de qué entidades y productos se habla, y las relaciones que se establecen entre ellos. El objetivo es lograr descubrir la información implícita, como por ejemplo la imagen que tiene una compañía en la Web", añade.
¿Cómo evitar la ambigüedad en las búsquedas?
Las alertas de Google por ejemplo, recaban información sobre determinadas palabras en Internet. El usuario contrata una palabra y cada vez que aparece en la Web recibe un email o alerta con el contenido donde ha sido mencionada. El problema es la ambigüedad. "Si se quiere monitorizar una palabra te llegarán las alertas de toda la información que contenga esa palabra. Francisco González es el presidente de BBVA, pero es un nombre muy común. Pasa lo mismo con el de Michael Jordan, que es bastante usual en EEUU. Los buscadores entierran la información que se busca por el alto contenido que aparece en Internet. BBVA no es un término ambiguo, sin embargo la persona que está más asociada con la entidad bancaria es Messi, porque está en la Liga BBVA, lo que dificulta el análisis de su reputación”, aclara Gonzalo.
En el caso de la reputación de una compañía en Internet, el objetivo de Limosine no es el de encontrar documentos, sino de saber qué se dice y si se habla bien o mal de ella. Según Julio Gonzalo, "no es un proceso de buscar documentos, sino de entender toda la información en cada comentario y luego ser capaz de agregarlas para sacar información implícita. Y esto solo se consigue a base de agregación semántica".
"Todo este tipo de información y reputación on-line es un trabajo exhaustivo que tienen que hacer los expertos, y hacen falta mecanismos que logren esa información automáticamente", concluye el profesor.
0
COMENTARIOS
