17/Nov/05!f>
|
Revista Axxón
Axxón en facebook
Lectores de Axxón en facebook
|
|
Búsqueda en Internet: más agujas y menos pajar
!t>
(BBC Mundo) - Imaginemos que algún alemán quiere saber algo de su auto marca Golf en internet. Introduce pacientemente GOLF en el buscador Google
alemán y obtiene nada menos que ¡280 millones de páginas! donde aparece, de alguna manera, la palabra "Golf".
Pero no sólo aparece su auto, sino también un deporte y un accidente geográfico (golfo, en alemán), que se escriben igual.
Google es un buscador textual, es decir, busca una serie de letras dispuestas en un determinado orden y luego los textos que están entrelazados con esa palabra
y su referencia dentro de otras páginas o textos en internet, sin atender a su significado. No hace por tanto ninguna diferencia entre el auto, el deporte y el
accidente geográfico.
El usuario obtiene entonces una selva de páginas que él mismo deberá precisar y buscar bajo el enervante proceso de ensayo y error.
Si quiere buscar en español dónde o cómo arreglar su auto marca Golf introduce, por ejemplo, "arreglo Golf", pero Google encontrará en primer lugar una
página donde aparecen cursos de Golf y la oferta de un arreglo floral... para desesperación del aquejado automovilista.
Tampoco encontrará otras variantes como "reparación Golf", "mantenimiento de Golf", "mecánica de Golf", "talleres para Golf " que tienen un significado
relevante para el usuario que busca mejorar la salud de su auto.
Textos y semánticas
Para los enervados que pasan largas sesiones tratando de que Google entienda finalmente lo que se busca, el Instituto Fraunhofer de Alemania ha desarrollado
ConWeaver, un nuevo buscador que "entiende" los conceptos introducidos.
"El buscador ha sido desarrollado específicamente para las redes de intranet de las empresas e instituciones, pero es una cuestión de tiempo su aplicación a
internet", comentó a la BBC el creador de ConWeaver, Thomas Kamps.
"Un buscador como ConWeaver es semántico, es decir, atiende a los distintos significados de una misma serie de letras y su interrelación con otros conceptos, y
agrupa las variantes por tipos".
Un buscador semántico separaría entonces entre los distintos significados de Golf. Si busca Golf como auto encontraría fabricantes, talleres, manuales, etc.
Una serie semejante para el deporte y otra para el accidente geográfico.
"Un buscador semántico busca dentro de lo que llamamos una red de conocimientos u ontología, una red de conceptos y relaciones entre conceptos"
De intranet a internet
A diferencia de las redes de intranet para las cuales ConWeaver fue realizado, internet es enormemente más grande y caótico y existen infinidad de temas.
"ConWeaver opera ahora sobre temas delimitados como microbiología o ingeniería de la construcción, pero a través de ellos podemos ordenar otros contenidos
dentro de internet y usarla de fuente", según Kamps.
"Hasta ahora es complicado desarrollar 'procedimientos de extracción' que consigan ordenar automáticamente los temas que ya están dados en internet, pero
estamos trabajando intensamente en esa dirección".
"Nuestro tema es cómo combinar los distintos procedimientos entre sí, los llamados procedimientos de aprendizaje de máquinas, de automatización de procesos,
de procesos lingüísticos".
"Seguramente no será mañana o pasado , pero es algo que estamos intentando realizar", dijo Kamps.
Por ahora ConWeaver está en una etapa de demostración. El próximo 16 de noviembre será presentado operando dentro del sector de la construcción, donde
promete sacarle algunos problemas a los ingenieros en la búsqueda de sus datos.
Pronto, sin embargo, este buscador inteligente emprenderá su oficio de machete virtual dentro de la selva de internet, para alivio de muchos que hemos estado al
borde de lanzar el computador por la ventana.
Aportado por Eduardo J. Carletti
!c>
Información relacionada:
Un nuevo servicio de Google ayuda a los que manejan datos académicos
Analizan Internet como almacén de recuerdos
Crean mapa de Internet
Un algoritmo de base genética puede liberar a Internet del 'spam'