Categorías
Ciencia de la información

¿Qué es eso de métricas para arquitectura de información?

Este semestre estoy viendo una materia llamada «Métrica y arquitecturas de información». La primera vez que escuché el nombre me sonó a algo que tenía que ver con bibliometría aunque no estaba muy seguro de su relación con arquitecturas de información, tema que ya he tratado anteriormente en este post.

Pues bien, en esta materia hemos analizado bases de datos bibliográficas y comparando las opciones que presentan en cuanto a la búsqueda, recuperación de información, puntos de acceso (como autor, tipo de documento -artículo, libro, etc.),  depuración y presentación de resultados de búsquedas. La he encontrado particularmente útil ahora que estoy a cargo de un OPAC o catálogo de biblioteca y me he dado cuenta que los resultados de las búsquedas muchas veces se pasan por alto a la hora de diseñar sitios en internet, como si lo único que importara es que la base de datos hiciera su query y trajera cualquier cantidad de información, sin importar si es relevante o pertinente, si le estamos dando a nuestros usuarios toneladas de información para que se pierda en ella.

Para hacer una pequeña prueba he decidido usar uno de los sitios más consultados en Colombia, el sitio del diario www.eltiempo.com donde hice una búsqueda simple sobre la primer noticia que encontré en su portada

Portada de ElTiempo.com 2009-10-02
Portada de ElTiempo.com 2009-10-02

Ingresé «Rio de Janeiro, sede de los Juegos Olímpicos de Verano de 2016» en el buscador y obtuve 11 resultados:

Resultados de búsqueda en ElTiempo.com 2009-10-02
Resultados de búsqueda en ElTiempo.com 2009-10-02″

Esto puede darme a entender que no se estan usando los títulos como puntos de acceso, o que la única forma que pueda acceder a una noticia desde el buscador es que la noticia esté en Archivo y tenga al menos un día de anterioridad. En todo caso se están recuperando documentos a partir de stop words como lo demuestra la última noticia recuperada: «¿U2 en Colombia? ¿Que al Campín no le va a ocurrir nada? ¡No seamos ingenuos!» a partir de las palabras «de» y «los» que coinciden con nuestra búsqueda inicial y son stop words.

ElTiempo.com realiza depuraciones en sus búsquedas por portal, secciones y fecha, ordenacion de resultados por relevancia y más antiguo y más reciente primero. Me pareció un muy buen método el uso de la «Línea de tiempo» para mostrar las noticias por densidad vs. años aunque mi clase de Métricas para arquitectura de información me ha enseñado a trabajar más en las posibilidades que le brindas al usuario para recuperar información en entornos web. Imagino que el realizar una búsqueda con palabras poco usadas como «Olímpicos» te genera estos pocos resultados, habría que hacer la prueba con palabras más frecuentes en las noticias a ver qué tal reacciona el buscador al recuperar muchos más resultados.

Aclaro: este es apenas un ejercicio académico, felicitaciones a los desarrolladores del sitio de noticias por su buen trabajo y su reciente actualización; siempre van a haber comentarios sobre lo que se pordía mejorar y este es solo uno de ellos, tal vez fuera de lugar. Al final de este post dejo un taller común para métricas y arquitectura de información y su respuesta.

¿Debemos dejarle siempre todo el trabajo de búsqueda y recuperación a Google?

Métricas para arquitectura de información

Descargar