La web semántica ¿Por qué? I

Deja un comentario

Aunque no nos demos cuenta, la manera en la que usamos nuestro lenguaje es impresionante. Nosotros no tenemos ningún problema (lingüístico) con preguntarle a algún desconocido cómo encontrar el cajero más próximo. De la misma manera podemos tener alguna idea y gracias al poder del lenguaje natural la podemos compartir, al igual que el conocimiento adquirido a través de la experiencia. No sólo eso, también podemos adquirir conocimiento a partir de las experiencias de otros, incluso de personas que dejaron esos conocimientos plasmados en libros escritos muchos años de que naciéramos. Si no fuera por el lenguaje natural, el lenguaje humano, todos nuestros conocimientos serían difíciles de transmitir y administrar.

Por ejemplo si digo:

  • El árbol cayó de la casa.
  • La casa cayó de el árbol.

La reacción que provoca cada una de las oraciones es diferente. La diferencia reside en el orden en el que se encuentra cada una de las cláusulas, porque las palabras son las mismas, las mismas letras y los mismos sonidos. Lo único que varía es lo que está antes y después de “cayó de”. Por la experiencia que hemos adquirido con el tiempo, sabemos que “cayó” es la palabra que usamos para representar que una entidad, que entendemos con características más materiales, realiza un desplazamiento en un sentido específico (arriba hacia abajo), en un tiempo anterior al momento de la locución. Además agregamos la palabra “de” que nos indica un desprendimiento del objeto de otro que normalmente imaginamos de mayor tamaño. También hemos aprendido que árbol y casa son entidades más materiales y más grandes, por lo que parece anómalo que un árbol caiga de una casa o lo inverso. Pero también tenemos conocimiento del mundo que nos ha enseñado que se pueden construir casas en los árboles así como existen árboles dentro de casas.

El párrafo anterior es un ejemplo de la complejidad que se puede encontrar en una expresión pequeña y sintácticamente simple. Y gracias a ese conocimiento podemos contestar preguntas de mayor complejidad como: “¿Qué estaba arriba de qué?” o “La acción que se describe en el ejemplo, ¿ocurre en el futuro?”.

Por esto podemos decir, sin que sea una definición absoluta, que la semántica es el proceso por el cuál comunicamos información suficiente para que resulte en una acción. Por esta misma razón se puede usar la semántica para representar, combinar y compartir conocimiento entre grupos de máquinas y se pueden crear sistemas computacionales que puedan reaccionar ante tal conocimiento.

La mayoría de los programadores han usado la semántica, por ejemplo cuando le asignan un valor específico a una variable. En los lenguajes que fuerzan la declaración semántica de la variable, la semántica es explícita. Esto permite que otros programas pueden usar los datos arrojados por este programa.

Esa es la importancia de la semántica en los sistemas de cómputo, en el siguiente post hablaremos sobre como ocurren estas transacciones de información en la web.

La web semántica ¿Qué es?

Deja un comentario

Logo SW

No es tan sencillo dar una definición de la web semántica, pues ha sido definida de múltiples formas a través del tiempo. Sin embargo algo que se repite constantemente es que es una extensión de la web actual (la WWW o World Wide Web). Esta extensión utiliza la información existente y relaciona los datos entre ellos.

Es decir, en la web semántica podemos seguir encontrando la información que encontramos ahora, hecha principalmente por humanos y dirigida para humanos, pero con la extensión añadida las computadoras podrían saber que tipo de datos son los que se están transmitiendo y podrían comunicarlo a otras computadoras.

Podríamos sugerir que la web semántica es una extensión que envuelve a la WWW donde se define la información y los servicios en la web. Esto hace posible que la misma web entienda y satisfaga las necesidades de las personas y las máquinas para usar el contenido de la web.

Imagen multimediaPor ejemplo, en la web actual yo puedo ver mis fotos, puedo ver mi agenda, encontrar información sobre alguna conferencia en la web semántica, pero ¿qué pasa si le digo al motor de búsqueda tradicional que estoy interesado en encontrar una conferencia sobre web semántica próxima al lugar donde tome las fotos en la fecha X y que además esté (yo) disponible en las fechas de la conferencia?

Bueno, esto ya es muy complejo pero no tendría por que serlo tanto, ¿no? Si de todas formas ya he subido gran parte de mi información en la red y la actualizo cada vez que me conecto, se podrían conectar los datos que contienen la información que busco para que fuera más fácil encontrar la información específica.

De momento esto no es posible porque las aplicaciones para ver mis fotos, buscar en la web, organizar mi agenda, administrar mi dinero, etc. son todas diferentes. Algunas grandes empresas que ofrecen todos estos servicios en línea (por ejemplo Google) se han dado cuenta que es una buena idea relacionar todos estos datos para incrementar su ganancia, y es lo que hará con la nueva política de privacidad.

La web semántica trata de ligar datos más allá de una sola empresa. Y no solo eso, a diferencia de la WWW que fue orientada principalmente para el intercambio de textos, esta nueva web pretende obtener los datos de diferentes fuentes de información: Videos, fotos, audio, texto, etc. con el fin de integrarlos y combinarlos.

concepto LinkedDataLa idea es que los datos tengan sentido entre ellos para poder facilitar diferentes tareas entre diferentes computadoras o diferentes dispositivos. Es decir, se espera que cuando el usuario use un equipo de cómputo, este pueda comunicarse con él y con los otros equipos del mundo, de tal forma en la que ambos entiendan la información que se está transmitiendo.

Para que quede un poco más claro aquí dejo un video (en inglés) que expande y muestra más ejemplos de lo que he dicho hasta ahora:

Presentación

1 comentario

Gracias a la evolución de la web, desde sus orígenes hasta su estado actual, usuarios de todo el mundo han podido crear diversos tipos de contenidos que han ido subiendo a servidores personales o públicos, gratuitos o de paga. Estos contenidos han generado una cantidad de información disponible como nunca antes se había tenido. Esto ha motivado la necesidad de cambiar los modelos de búsqueda existentes hasta ahora.

Cada vez es más evidente que la información está relacionada entre sí de diversas manera, la misma web lo demuestra y cambia su estándar hacia ese nuevo modelo lleno de significado y relaciones. Esto es lo que se ha denominado la web semántica, que, junto con los medios sociales, la infraestructura existente y la amplia participación de los usuarios como creadores de nueva información están abriendo paso, cada vez con mayor velocidad a la prometida web 3.0.

¿Qué hay en esa web 3.0? Dentro de esa web se encuentra información relacionada entre sí, con significado tanto para las personas como para las máquinas que son capaces de comunicarse. Una computadora podrá ser capaz de reconocer los objetos existentes dentro de una fotografía y buscar información acerca de los mismos, enviar esa información a un teléfono celular y aumentar la realidad.

Este nuevo paradigma de información creará nuevas necesidades de búsqueda, recuperación y extracción de información. Esto se debe a que ahora será posible buscar alguna instancia de una entidad, responder preguntas con mayor grado de complejidad y generar abstracciones de una realidad representada en algún tipo de medio, ya sea texto, imagen estática, imágenes en movimiento (videos, películas, animaciones, etc.), o la mezcla de todo.

El objetivo de este curso es descubrir que son y como funcionan los dispositivos encargados de recuperar esta información, los llamados buscadores semánticos. Debido a la complejidad del tema, el curso sólo se basará en el tratamiento del lenguaje natural expresado en texto. A partir de esto se revisarán las diferencias entre este tipo de nuevas tecnologías y las tecnologías utilizadas hasta ahora.

Para alcanzar este objetivo, primero es necesario entender que es la recuperación y extracción de información. Como se realizan los reconocimientos de patrones en el texto y como se desarrollan las ontologías.

Esto permitirá conocer una parte más próxima de la llamada web semántica o web 3.0. También acercará al conocimiento de los llamados metalenguajes utilizados con el fin de entender las relaciones existentes entre las palabras.

Después de esto será posible conocer cuáles son los diferentes estándares utilizados para la organización y presentación de la información de manera semántica.

Al momento de revisar las ontologías será necesario entender las diferentes relaciones que existen entre las palabras, con el fin de comprender como es que un significado se transforma en texto.

Esto permitirá comprender a mayor profundidad los problemas generados por la semántica de la lengua. Se deberá comprender estos problemas para poder proponer soluciones a los mismos. Problemas como ambigüedad de palabras, cambios de dominios y estructuración de redes de significado serán tratados.

Finalmente, con todo ese conocimiento se entenderán las dos formas principales en las que funcionan esos buscadores, es decir o las computadoras “aprenden” los diferentes significados, o adquieren ese conocimiento a través de la “enseñanza” de los expertos humanos. También se deberán discutir cuáles son las ventajas y los retos de cada una de esas soluciones.