Web semántica

La web semántica (del inglés semantic web) es un conjunto de actividades desarrolladas en el seno de World Wide Web Consortium con tendencia a la creación de tecnologías para publicar datos legibles por aplicaciones informáticas (máquinas en la terminología de la Web semántica).[1] Se basa en la idea de añadir metadatos semánticos y ontológicos a la World Wide Web. Esas informaciones adicionales —que describen el contenido, el significado y la relación de los datos— se deben proporcionar de manera formal, para que así sea posible evaluarlas automáticamente por máquinas de procesamiento. El objetivo es mejorar Internet ampliando la interoperabilidad entre los sistemas informáticos usando "agentes inteligentes". Agentes inteligentes son programas en las computadoras que buscan información sin operadores humanos.

El precursor de la idea, Tim Berners-Lee, intentó desde el principio incluir información semántica en su creación, la World Wide Web, pero por diferentes causas no fue posible.[2] Por ese motivo introdujo el concepto de semántica con la intención de recuperar dicha omisión.

Antecedentes

El precursor de la idea de enlaces web de hipertexto fue Vannevar Bush (1890 - 1974), ingeniero y profesor del Massachusetts Institute of Technology ( MIT) y asesor, durante la Segunda Guerra Mundial, de Investigación Científica y Desarrollo en la administración americana siendo presidente Roosevelt. En 1945 describió la primera aplicación hipertextual, un proyecto llamado MeMex Memory Extended y descrito en As We May Think, (Cómo podríamos pensar) publicado en la revista Atlantic Monthly.[3]

La idea presentada era la de un sistema distribuido de información accesible a través de un escritorio (interfaz), en el que los archivos de texto e imagen estuvieran ligados y pudieran ser consultados a través de los enlaces. Así los usuarios podrían visualizar la información a través de distintos recorridos.[4] Este proyecto es lo que puede considerarse el origen del hipertexto.

En la década de los años 60 Theodor Nelson acuñó el término Hypertext como “non-sequential writing”, una escritura no secuencial. Se trata de un conjunto de bloques de texto conectados entre sí mediante unos enlaces que permiten navegar de un texto a otro.[5]

Paralelamente, Douglas Carl Engelbart, del centro Augmentation Research Center (ARC) de la Universidad de Stanford, trabajó sobre la idea de Vannevar Bush, desarrollando un software capaz de implementar hipertexto o referencias cruzadas automáticas a otros documentos. El proyecto oN Line System (NLS) consistía en un sistema de navegación en línea, una red local que enlazaba los documentos publicados por el instituto, para poder acceder a ellos y trabajar en grupo.[6]

Basándose en estos proyectos, fueron surgiendo numerosos sistemas de hipertexto. Como Hypertext Editing System (HES) en 1967 por IBM y la Brown University, File Retrieval and Editing System (FRESS) en 1968, ZOG en 1972 de la Carnegie Mellon University, Knowledge Management System (KMS) en 1983, Intermedia en 1985 en la Brown University, Note Cards en 1985 por la Xerox Parc o Smar Text en 1988.[7]

En 1990 Tim Berners - Lee y Robert Cailliau dieron a conocer la web como la conocemos actualmente. Presentaron el proyecto World Wide Web (WWW) en la Organización Europea para Investigación Nuclear ( CERN) en Ginebra (Suiza), que constituyó la primera propuesta de web. Consistía en un programa cliente (navegador/editor) basado en el lenguaje de etiquetas de hipertexto HTML ( Hyper Text Markup Language), junto con el protocolo de transferencia de hipertexto HTTP ( Hyper Text Transfer Protocol), lenguaje que los ordenadores usan para comunicarse por Internet, y el identificador uniforme de recursos digitales URI ( Uniform Resource Identifier), para la localización de objetos digitales. El navegador/editor World Wide Web era capaz de seguir vínculos en los archivos de los servidores HTTP.[8]

El W3C empieza a plantearse la idea de web semántica a finales de los años 90, aunque hasta 2001 se presenta un artículo en la revista Scientific American en el que se exhiben los postulados de la web semántica. La propuesta de Tim Berners- Lee en 2001 pretende transformar la actual web. La web actual se basa en el lenguaje natural, tiene una falta de estructuración de contenidos y una carencia de descripciones normalizadas para los recursos digitales, lo que se ve reflejado en la ambigüedad de  los resultados que recuperan los motores de búsqueda generalistas.[9]

Como consecuencia, para resolver el actual problema de accesibilidad a la información en Internet, surge la idea de web semántica, cuyo objetivo es identificar la información de forma unívoca y establecer relaciones entre los objetos digitales con miras a facilitar una recuperación eficaz de la información.

Puntos Fundamentales

La Web Semántica se basa en dos puntos fundamentales:

a)  La descripción del significado. Donde se definen los conceptos; y

b)  La manipulación  automática  de  estas descripciones. Se efectúa mediante  lógica y motores de inferencia.

En la descripción del significado se articula la semántica, los metadatos y las ontologías.[10]

  • La semántica. Es el estudio del significado de los términos lingüísticos.

En nuestro contexto de la Web Semántica, se pretende dotar de significado interpretable por parte de las máquinas, como información adicional que pueda ser comprendida y procesada por una computadora.

  • Los Metadatos. Son datos que describen otros datos, en este contexto los datos que describen recursos de la web.

La distinción entre datos y metadatos es relativa, pues depende de la aplicación. Los metadatos de una aplicación pueden ser los datos que maneja otra aplicación.

  • Las Ontologías. Una ontología es una jerarquía de conceptos con atributos y relaciones, que define una terminología consensuada para definir redes semánticas de unidades de información interrelacionadas y con ciertas reglas.[11]

Una ontología se puede definir como una «especificación explícita y formal de una conceptualización compartida» según (Gruber, 1993) de esta manera:[12]

  • Es explícita, porque define los conceptos, propiedades, relaciones, funciones, axiomas y restricciones que la componen.
  • Es formal, porque es legible e interpretable por las máquinas.
  • Es una conceptualización, porque es un modelo abstracto y una vista simplificada de las entidades que representa.
  • Finalmente,  es compartida porque ha habido un consenso previo sobre la información que ha sido acordado por un grupo de expertos.

Ventajas de la Web semántica

  • Incorpora contenido semántico a las páginas que se suben a Internet. Esto permite una mejor organización de la información, asegurando búsquedas más precisas por significado y no por contenido textual.
  • Permite a las computadoras la gestión de conocimiento, hasta el momento reservada a las personas (hace uso de inteligencia artificial).[13]

Desventajas de la Web semántica

  • Es costoso y laborioso adaptar los documentos de Internet, para poder ser procesados de forma semántica (a esto hay que sumar los problemas del idioma).
  • Es necesario unificar los estándares semánticos y proveer relaciones de equivalencia entre conceptos. Por ejemplo, en el caso del código postal, se debe establecer que CP es igual a ZC “zip code” en el caso del inglés.[14]
Other Languages
العربية: ويب دلالي
azərbaycanca: Semantik Veb
català: Web semàntic
čeština: Sémantický web
Deutsch: Semantic Web
English: Semantic Web
Esperanto: Semantika Reto
euskara: Web semantiko
فارسی: وب معنایی
français: Web sémantique
Bahasa Indonesia: Web semantik
íslenska: Merkingarvefur
italiano: Web semantico
한국어: 시맨틱 웹
Nederlands: Semantisch web
norsk bokmål: Semantisk web
polski: Semantic Web
português: Web semântica
Simple English: Semantic Web
slovenčina: Sémantický web
српски / srpski: Семантички веб
Türkçe: Anlamsal ağ
Tiếng Việt: Mạng ngữ nghĩa
中文: 语义网