La web semántica ¿Por qué? I

Deja un comentario

Aunque no nos demos cuenta, la manera en la que usamos nuestro lenguaje es impresionante. Nosotros no tenemos ningún problema (lingüístico) con preguntarle a algún desconocido cómo encontrar el cajero más próximo. De la misma manera podemos tener alguna idea y gracias al poder del lenguaje natural la podemos compartir, al igual que el conocimiento adquirido a través de la experiencia. No sólo eso, también podemos adquirir conocimiento a partir de las experiencias de otros, incluso de personas que dejaron esos conocimientos plasmados en libros escritos muchos años de que naciéramos. Si no fuera por el lenguaje natural, el lenguaje humano, todos nuestros conocimientos serían difíciles de transmitir y administrar.

Por ejemplo si digo:

  • El árbol cayó de la casa.
  • La casa cayó de el árbol.

La reacción que provoca cada una de las oraciones es diferente. La diferencia reside en el orden en el que se encuentra cada una de las cláusulas, porque las palabras son las mismas, las mismas letras y los mismos sonidos. Lo único que varía es lo que está antes y después de “cayó de”. Por la experiencia que hemos adquirido con el tiempo, sabemos que “cayó” es la palabra que usamos para representar que una entidad, que entendemos con características más materiales, realiza un desplazamiento en un sentido específico (arriba hacia abajo), en un tiempo anterior al momento de la locución. Además agregamos la palabra “de” que nos indica un desprendimiento del objeto de otro que normalmente imaginamos de mayor tamaño. También hemos aprendido que árbol y casa son entidades más materiales y más grandes, por lo que parece anómalo que un árbol caiga de una casa o lo inverso. Pero también tenemos conocimiento del mundo que nos ha enseñado que se pueden construir casas en los árboles así como existen árboles dentro de casas.

El párrafo anterior es un ejemplo de la complejidad que se puede encontrar en una expresión pequeña y sintácticamente simple. Y gracias a ese conocimiento podemos contestar preguntas de mayor complejidad como: “¿Qué estaba arriba de qué?” o “La acción que se describe en el ejemplo, ¿ocurre en el futuro?”.

Por esto podemos decir, sin que sea una definición absoluta, que la semántica es el proceso por el cuál comunicamos información suficiente para que resulte en una acción. Por esta misma razón se puede usar la semántica para representar, combinar y compartir conocimiento entre grupos de máquinas y se pueden crear sistemas computacionales que puedan reaccionar ante tal conocimiento.

La mayoría de los programadores han usado la semántica, por ejemplo cuando le asignan un valor específico a una variable. En los lenguajes que fuerzan la declaración semántica de la variable, la semántica es explícita. Esto permite que otros programas pueden usar los datos arrojados por este programa.

Esa es la importancia de la semántica en los sistemas de cómputo, en el siguiente post hablaremos sobre como ocurren estas transacciones de información en la web.

Anuncios

Recuperación de información

1 comentario

La recuperación de la información es una de las disciplinas más antiguas dentro de las tecnologías de la información. Se enfoca en dirigir al usuario hacia la información almacenada en diversos medios.

La información puede encontrarse almacenada en múltiples bases y formatos. Es decir, la información puede encontrarse dentro de texto, imágenes, audio, objetos, números, etc. Por lo que para fines de este curso se asumirá que se busca información dentro de documentos textuales, sin embargo es bueno notar que no es la única forma en la que se puede encontrar almacenada la información.

Los humanos recibimos, almacenamos y generamos información de múltiples maneras. La transferimos también de diversas formas, pero la más común de ellas es a través de la comunicación.

Para que la comunicación sea exitosa se necesita un emisor, un receptor, un código y un mensaje. El mensaje se transmite a través de un canal u se realiza en un contexto. También es necesario que el emisor y el receptor sean capaces de interpretar el mismo código, es decir, existe un codificador y un decodificador.

En 1950, Calvin N. Mooers establecía que la recuperación de información consistía en dirigir al usuario hacia la información almacenada, alguna de la cuál podría ser desconocida para aquél. También asegura que el receptor es la parte activa de la comunicación, y que esta comunicación es temporal  de una época a otra y sin ruido en el canal. Para él, esta comunicación es siempre unidireccional, pues el emisor no puede saber el mensaje particular que será de utilidad posterior para el receptor, por lo mismo debe enviar tantos mensajes como le sean posibles. Debido a esto, el reto técnico es hallar TODOS los mensajes que sean RELEVANTES para el receptor en el menor tiempo posible.

Es bueno recordar que estas definiciones y suposiciones fueron hechas en 1950 y sin embargo gran parte de esta información continúa siendo relevante. También es importante notar que un buen sistema de recuperación de información debe encontrar todos los mensajes que sean relevantes, pero también sólo los mensajes que sean relevantes.

Es decir, un sistema que trajera todos los documentos existentes en internet dado que yo busqué un término sería un sistema completamente ineficiente, ya que si bien trajo todos los mensajes relevantes, también trajo muchos irrelevantes, de hecho la mayoría lo sería.

Para ejemplificar, imaginemos dos situaciones:

En la primera situación supongamos que el usuario “U” busca diversos libros sobre el tema “T”. Para encontrar ese libro, U entra en una librería y le pregunta al vendedor: “¿Dónde puedo encontrar libros acerca de T?” a lo que el vendedor responde: “Justo en esta librería”.

En la segunda situación U el vendedor, que tiene organizados sus libros de acuerdo a un método que sólo es conocido para él, amablemente busca entre todos sus libros. Después de un momento de reflexión y búsqueda regresa con sólo un libro sobre T y se lo entrega a U. U descubre que ese libro es acerca de lo que busca, sin embargo no es Todo lo que busca.

En estos dos ejemplos el vendedor de libros resultó ser un sistema de recuperación de información bastante ineficiente porque no ayudó a U a encontrar todo lo que buscaba.

Actualmente la entrada más común para encontrar información en internet es a través de los llamados buscadores o motores de búsqueda, estos son los sistemas de información más comunes, sin embargo no son los únicos. ¿Conoce algún otro?

Google       yahoo    bing