Web Sémantique et données liées

La capacité à manipuler le contenu des documents web sur base de leur sémantique permettrait à des programmes de réaliser des tâches qui doivent être actuellement réalisées à la main et ouvre la voie à de nouvelles possibilités d’automatisation. Le web sémantique va structurer le contenu sémantique des documents web et ainsi permettre à des programmes d’interpréter leur contenu et de raisonner dessus.

La majorité du contenu du web actuellement produit est conçu pour être lu par des êtres humains, et pas pour être manipulé symboliquement par des programmes informatiques [Bern]. Certes un document HTML est manipulé par un programme pour que la mise en page soit correcte. Mais ce traitement se limite à interpréter les balises de présentation HTML présentes dans le document. Ces balises se limitent à décrire la manière dont le document doit être présenté. La signification du contenu du document reste implicite et le document ne peut donc pas être manipulé sur base de cette signification. De manière générale les ordinateurs n’ont aucune méthode systématique pour traiter le contenu d’un document web sur base de leur sémantique.

La capacité à manipuler le contenu des documents web sur base de leur sémantique permettrait à des programmes de réaliser des tâches qui doivent être actuellement réalisées à la main et ouvre la voie à de nouvelles possibilités d’automatisation. Le web sémantique va structurer le contenu sémantique des documents web et ainsi permettre à des programmes d’interpréter leur contenu et de raisonner dessus. Le web sémantique va créer un environnement où des programmes, que l’on appelle des agents logiciels, pourront exécuter des tâches complexes aux noms d’utilisateurs qui leur auront délégué ces tâches. Pour les accomplir les agents logiciels devront communiquer entre eux, et interpréter le contenu échangé de la même manière, c’est à dire en interprétant les termes décrivant le contenu de la même manière.

Les différents standards du Web Sémantique
Les différents standards du Web Sémantique (source : http://w3.org)

De nombreux langages pour le web sémantique ont ainsi été définis ces dernières années témoignant du rythme rapide d’évolution de ces langages. Des outils d’édition et de gestion de documents ont été développés afin de valider ces langages. A titre d’exemple, on peut citer comme langage XOL (XML based ontology exchange language) [XOL], Topic Maps (un standard ISO pour la description de représentations de connaissances) [Top], RDF/RDFS (Resource Description Framework et RDF Schema) [RDF], DAML+OIL (DARPA Agent Markup Language + Ontology Inference Layer) [DAML], et OWL (Web Ontology Language) [OWL]. Les trois derniers cités constituent ainsi une pile de langages web sémantique de plus en plus sophistiquée. OWL peut être utilisé pour représenter la signification des termes d’un vocabulaire et les relations entre ces termes. Cette représentation des termes et leurs relations est appelée une ontologie.