domingo, junio 14, 2009

Ordenando el caos

Como todos sabemos, web 2.0 mediante, los usuarios nos hemos transformado en productores de contenidos. Y son las folksonomías el mecanismo que nos permite organizar nuestra producción. Asignando etiquetas ("tags"), los usuarios clasificamos contenidos propios y ajenos colocando palabras clave con el objeto de que el contenido en cuestión sea hallado a través de una búsqueda electrónica. Mientras que los sistemas de organización tradicional, proponen estructuras rígidas con vocabularios controlados, las folksonomías se inspiran en criterios flexibles que permiten adaptaciones más rápidas a la dinámica de un entorno en constante expansión.

Pese a lo novedoso y auspicioso de este nuevo sistema, la ausencia de reglas al asignar tags, genera sin duda muchos problemas de calidad: impresición, superposición, duplicación, ambigüedad e identificación errónea. ¿Cuantas veces hemos observado en sitios como you tube, delicious.com o cualquier otro, items cuyos tags distan mucho de lo que nosotros mismos hubiésemos considerado correcto? ¿En que se basa la idea de que un criterio pueda ser más o menos correcto a la hora de etiquetar? Veamos pues, algunas sugerencias para relfexionar sobre el asunto...

¿Cómo elegir una buena etiqueta?

Un criterio interesante para considerar la adecuación de un "tag" es preguntarnos si esa palabra clave que sugerimos podría ser o no un criterio de búsqueda para quién estuviera rastreando ese material. En la medida en que consideremos que es más alta la probabilidad de usar ese término como criterio de búsqueda, es más probable que se trate de una clasificación oportuna. Veámoslo en un ejemplo:




En la imagen podemos ver como el usuario Anto015 clasificó el fragmento de un episodio de la serie televisiva "Cosmos" de Carl Sagan con los tags: "cosmos" "carl" "sagan" y "ciencia".

Analicemos críticamente el etiquetado de este usuario: "cosmos" resulta ambiguo aunque bastante aproximado ya que se trata del título de una serie televisiva mundialmente conocida y sin duda un criterio de búsqueda válido. El segundo y el tercer tag aparecen por separado cuando debería tratarse de uno solo. Así "Carl" genera un tag impreciso y consecuentemente erróneo, mientras que "Sagan" sería mucho más adecuado. Finalmente, el último tag colocado por el usuario, "ciencia" es excesivamente genérico en relación al fragmento que pretende rotular en el que se describe la metodología que utilizó Eratóstenes para calcuar la circunferencia de la tierra en el 240 a.C. En este sentido, una etiqueta más adecuada hubiera sido quizá "Eratóstenes" y en todo caso "historia de la ciencia".

Ahora bien, este nivel de imprecisión en el etiquetado masivo, tiene sus consecuencias a la hora de evaluar las eficiencias de una búsqueda.

¿Qué pueden hacer los desarrolladores?

  • Asociar las etiquetas a directorios controlados

Estudios empíricos (citados por Wichowski, 2009) compararon la eficiencia de la búsquedas en delicious.com (emblemático sitio en donde se comparten bookmarks y se utiliza el sistema de tags para la clasificación) con las de los directorios tradicionales. Se ha observado que los directorios han superado a las folksonomías en precisión y recordación. Sin embargo, cuando las folksonomias fueron asociadas a directorios de vocabulario controlado, la conclusión fue que en esta circunstancia, la eficiencia de las búsquedas se incrementaba.

  • Identificar usos diferenciados

Otros estudios determinaron que los usuarios eligen diferentes tags según estos sean para utilizar a nivel personal o para compartir con la comunidad en donde adicionalmente, acaban resultando muy importantes para que usuarios con intereses afines puedan encontrarse. Los perfiles en blogger son muy descriptivos de esta idea, ya que el listado de etiquetas es la clave para tejer una red social entre los bloggers. En estos casos, si bien las etiquetas no clasifican contenidos, resultan pertinentes para definir el perfil de los autores.




  • Asociar las etiquetas a las ontologías
Por otra parte, no puede perderse de vista además, que los tags utilizados en las las folksonomías, carecen de contexto. Esto no es un problema menor y resulta especialmente relevante en términos polisémicos. Imaginemos el caso un tag como "San Martín". Tenemos al menos tres significados posibles: uno histórico, otro tradicional-religioso y finalmente un tercero, geográfico.

Una de las posibilidades, a fin de resolver el problema de la descontextualización, es que los sistemas procuren vincular las etiquetas a las ontologías. En informática, se llama ontologías a un extenso y riguroso esquema conceptual (dentro de uno o varios dominios) cuyo objetivo es permitir y facilitar la comunicación entre diferentes sistemas. Veamos en nuestro ejemplo, muy sintéticamente de como podría construirse la contextualización:


  • Sugerir tags para entrenar al usuario
Y finalmente, otra posibilidad para mejorar la calidad de los etiquetados es el desarrollo de sistemas que faciliten la recomendación de tags, lo cual a su vez habilitaría una suerte de entrenamiento para la habilidad de etiquetar contenidos.


En síntesis, la suma de estos diferentes aspectos adecuadamente implementados, podrían probablemente, contribuir a que las folksonomías resulten más útiles y precisas.

Ver el artículo completo en Knol.

No hay comentarios.: