J'entends parler de web sémantique depuis plus de 10 ans, mais je n'avais jamais jusqu'à présent eu l'occasion d'ouvrir réellement le couvercle en voyant se dérouler un vrai projet.
Je viens d'en apprendre plus en regardant le démonstrateur du projet SemUNIT, financé par l’Université Numérique Ingénierie et Technologie (UNIT) à la suite de son appel à projet 2010 :
2010-21 | SemUNIT : Des services sémantiques pour UNIT | Monique Grandbastien | Voir la fiche détaillée |
Le
résultat de la première phase est un démonstrateur visitable en ligne sur http://semunt.supelec.fr/. Il s’agit
encore d’une maquette, avec une interface certainement insuffisamment explicite
pour la masse des utilisateurs visés. C’est pour moi une découverte du
back-office d’un projet de web sémantique : par exemple, nombreuses
interfaces de métadonnées produites par Pubby
- Des essais de requêtes sur le portail donnent des résultats convaincants, qu’on est invité à filtrer en limitant à une classification Dewey (il serait utile qu’on puisse filtrer avec la somme de plusieurs lignes Dewey) ou en limitant certaines ‘facettes’. Pour emporter la démonstration, il faudrait quelques actions de comparaison avec le résultat de requêtes sur le portail ORI-OAI
- La fonction « recherche d’experts » est particulièrement intéressante, et mérite certainement des prolongements très importants. On a ici essentiellement des contributeurs aux UNT, qu’en serait-il si on pouvait élargir ce service aux chercheurs ?, etc. ...
- On a un échantillon d’analyses amCharts séduisantes (cf. page http://semunt.supelec.fr/SemUnitCharts/semUnitVocabRatio.html) dont on perçoit la puissance, mais qui méritent commentaire, et dont il reste à définir les usages.
On trouve sur la toile
quelques documents récents présentant le projet (conférence 2012 SemWebPro et surtout la présentation, article
de la conférence Linked Learning) avec des détails suffisant pour le
lecteur relativement profane.
Au vu des documents que j'ai consultés, on est dans un projet de web sémantique canonique (j'en retrouve les sigles, et je commence à comprendre un peu de quoi il s'agissait !) : il s’attache à la « création d’une
ontologie en OWL capturant le sens des métadonnées utilisées », permettant
de construire des "triplets RDF à partir des données SupLomFr des ressources des
UNT. Une architecture de publication est choisie, et un premier service
d’interrogation par SPARQL est mis en place.
Dans l'article
de la conférence Linked Learning, les
références à des travaux comparables sont commentées avec autorité (Lucero, ), les choix faits au cours
de cette phase de la réalisation sont explicités clairement, la mobilisation et la mise en
œuvre d’outils (apparemment facilement disponibles
mais fort experts) sont conduites
méthodiquement avec une grande efficacité.
Je vois dans l'article qu'on est dans le même sujet que celui des Linked Data (mais si, vous connaissez déjà, vous avez entendu parler d'Open Data et de data.gouv.fr). Si
l’utilisation de technologies pour les linked data se répand, elle reste
innovante dans de nombreux domaines d’application. Il est donc très approprié qu’on
les applique dès maintenant aux ressources de e-formation de nos Universités Numériques Thématiques (UNT), puisqu'il s'agit par principe de ressources pédagogiques libres
Cette démonstration grandeur nature d’un projet de
linked data est à mettre en relief comme exemple concret auprès de décideurs
jusqu’ici peu familiers des perspectives ouvertes par ces approches. Dans l'état actuel du démonstrateur, même si cela
reste peu accessible pour le profane, j'estime cependant que la visite en est utile !.
La même équipe a déposé un dossier pour le financement de la phase 2 à l'appel à projet UNIT 2012 :
2012-25 | - Déploiement de SemUNIT | - UNIT - | Voir la fiche détaillée |
Un peu de vulgarisation sur le
‘comment’ des prouesses des outils du web sémantique, à partir de cette
réalisation, sera très utile pour notre culture générale.
Ainsi, à partir de 6000 ressources pédagogiques, on engendre un million de
triplets RDF, ce qui permet au moteur de recherche de donner son plein. On comprend que les ‘classes’ et les ‘propriétés’
reprennent toutes les liaisons existantes, mais jusqu’à présent non
exploitables, issues de l’indexation SupLomFr.
On
comprend aussi que le projet, en tant que projet de web sémantique & linked data,
reste adaptable et enrichissable au fur et à mesure des réflexions futures.
En
particulier, si la mobilisation des données disponibles et organisées dans le
SupLomFr a permis cette réalisation en lui donnant une fondation homogène, on
peut se demander comment on articulera cette approche dans les cas où on
disposera d’ontologies et de séries de triplets RDF complémentaires du monde du
linked data, construites à partir d’autres bases : analyses textuelles
internes à tel ou tel domaine scientifique et technologique, DPpedia, … . La
conclusion de l’article
pointe bien la piste de liaison avec DBLP, ...
Aucun commentaire:
Enregistrer un commentaire