La web semántica ¿Qué es?

Deja un comentario

Logo SW

No es tan sencillo dar una definición de la web semántica, pues ha sido definida de múltiples formas a través del tiempo. Sin embargo algo que se repite constantemente es que es una extensión de la web actual (la WWW o World Wide Web). Esta extensión utiliza la información existente y relaciona los datos entre ellos.

Es decir, en la web semántica podemos seguir encontrando la información que encontramos ahora, hecha principalmente por humanos y dirigida para humanos, pero con la extensión añadida las computadoras podrían saber que tipo de datos son los que se están transmitiendo y podrían comunicarlo a otras computadoras.

Podríamos sugerir que la web semántica es una extensión que envuelve a la WWW donde se define la información y los servicios en la web. Esto hace posible que la misma web entienda y satisfaga las necesidades de las personas y las máquinas para usar el contenido de la web.

Imagen multimediaPor ejemplo, en la web actual yo puedo ver mis fotos, puedo ver mi agenda, encontrar información sobre alguna conferencia en la web semántica, pero ¿qué pasa si le digo al motor de búsqueda tradicional que estoy interesado en encontrar una conferencia sobre web semántica próxima al lugar donde tome las fotos en la fecha X y que además esté (yo) disponible en las fechas de la conferencia?

Bueno, esto ya es muy complejo pero no tendría por que serlo tanto, ¿no? Si de todas formas ya he subido gran parte de mi información en la red y la actualizo cada vez que me conecto, se podrían conectar los datos que contienen la información que busco para que fuera más fácil encontrar la información específica.

De momento esto no es posible porque las aplicaciones para ver mis fotos, buscar en la web, organizar mi agenda, administrar mi dinero, etc. son todas diferentes. Algunas grandes empresas que ofrecen todos estos servicios en línea (por ejemplo Google) se han dado cuenta que es una buena idea relacionar todos estos datos para incrementar su ganancia, y es lo que hará con la nueva política de privacidad.

La web semántica trata de ligar datos más allá de una sola empresa. Y no solo eso, a diferencia de la WWW que fue orientada principalmente para el intercambio de textos, esta nueva web pretende obtener los datos de diferentes fuentes de información: Videos, fotos, audio, texto, etc. con el fin de integrarlos y combinarlos.

concepto LinkedDataLa idea es que los datos tengan sentido entre ellos para poder facilitar diferentes tareas entre diferentes computadoras o diferentes dispositivos. Es decir, se espera que cuando el usuario use un equipo de cómputo, este pueda comunicarse con él y con los otros equipos del mundo, de tal forma en la que ambos entiendan la información que se está transmitiendo.

Para que quede un poco más claro aquí dejo un video (en inglés) que expande y muestra más ejemplos de lo que he dicho hasta ahora:

Sobrecarga de información o entre más, ¿mejor?

Deja un comentario

Sobrecarga de InformaciónYa hemos hablado sobre la recuperación y la extracción de información, sin embargo no sé si queda claro porque este tipo de sistemas se vuelven necesarios. Es decir, suena lógico que deba existir una forma en la que alguien que busca información la pueda encontrar, de la misma manera se pueda determinar en que documentos se encuentran. Pero ¿por que es necesario un sistema digital que haga lo que los bibliotecarios y archivistas han hecho toda la vida?

El problema que existe es que desde que inició la web, la gente empezó a generar contenido. Antiguamente este contenido era principalmente texto y era estático, de esta manera obedecía los estándares del HTML. Originalmente la web era sólo para algunos cuantos que podían encontrar acceso a internet y que entendían, aunque fuera un poco, como se generaban los hipertextos.

Conforme los precios de internet y las computadoras fueron bajando, más gente tuvo acceso a la web, lo que resultó no sólo en una mayor distribución de las páginas estáticas, sino también en una generación mayor de estas.

Como cada vez eran más personas que generaban páginas, cada vez existía mayor información y cada vez era más difícil encontrar lo que se buscaba, aunque bastaba con usar palabras clave y registrarse manualmente en un motor de búsqueda para quedar indizado.

Logo de WordPress

En poco tiempo la gente creaba y consumía información constantemente, surgieron web logs y después logs de fotos e incluso de vídeo, los estándares tuvieron que cambiar para adaptarse a estas nuevas necesidades. Esto trajo el surgimiento de la web 2.0, que como hemos visto es una web dinámica, que cambia constantemente.

Esta web 2.0 se basa en los usuarios de la misma. Se han generado sitios dedicados a almacenar y administrar blogs, han aumentado las redes sociales y en cambio han desaparecido o se han transformado sitios que estaban dedicados a la generación de las antiguas páginas estáticas.

Esto trae como resultado un exceso de información. De hecho la información contenida en las páginas de internet es tanta que ningún ser humano podría leerla toda en toda su vida, aunque la web no creciera más, algo que como se ha visto, resulta inevitable.

En esta nueva web, la información cambia cada segundo, por lo que los sistemas de recuperación de información deben adaptarse a estos cambios tan dinámicos. Esta adaptación es difícil, porque ahora, gracias al incremento de la participación del usuario, la información que se transmite suele ser más significativa.

Logo de WikipediaAhora cada vez encontramos una mayor cantidad de información subjetiva que se distribuye en muchos sitios. Incluso la información objetiva que se comparte se rebate con fines de que sea más precisa.

Los nuevos sistemas tiene que tener en cuenta esta sobrecarga de información y hacer lo posible por ser cada vez más rápidos, más exactos y más precisos. Es decir, cada día tiene más paja el pajar donde se trata de buscar la aguja exacta.