vendredi 7 septembre 2012

Nos ressources pédagogiques universitaires ont leur projet de web sémantique : essayez le démonstrateur !


J'entends parler de web sémantique depuis plus de 10 ans, mais je n'avais jamais jusqu'à présent eu l'occasion d'ouvrir réellement le couvercle en voyant se dérouler un vrai projet. 

Je viens d'en apprendre plus en regardant le démonstrateur du projet SemUNIT, financé par l’Université Numérique Ingénierie et Technologie (UNIT) à la suite de son appel à projet 2010 : 

2010-21 SemUNIT : Des services sémantiques pour UNIT Monique Grandbastien Voir la fiche détaillée


Le résultat de la première phase est un démonstrateur visitable en ligne sur http://semunt.supelec.fr/. Il s’agit encore d’une maquette, avec une interface certainement insuffisamment explicite pour la masse des utilisateurs visés. C’est pour moi une découverte du back-office d’un projet de web sémantique : par exemple, nombreuses interfaces de métadonnées produites par Pubby
 
  • Des essais de requêtes sur le portail donnent des résultats convaincants, qu’on est invité à filtrer en limitant à une classification Dewey (il serait utile qu’on puisse filtrer avec la somme de plusieurs lignes Dewey) ou en limitant certaines ‘facettes’. Pour emporter la démonstration, il faudrait quelques actions de comparaison avec le résultat de requêtes sur le portail ORI-OAI
  • La fonction « recherche d’experts » est particulièrement intéressante, et mérite certainement des prolongements très importants. On a ici essentiellement des contributeurs aux UNT, qu’en serait-il si on pouvait élargir ce service aux chercheurs ?, etc. ...
On trouve sur la toile quelques documents récents présentant le projet (conférence 2012 SemWebPro et surtout la présentation, article de la conférence Linked Learning) avec des détails suffisant pour le lecteur relativement profane.

Au vu des documents que j'ai consultés, on est dans un projet de web sémantique canonique (j'en retrouve les sigles, et je commence à comprendre un peu de quoi il s'agissait !)  : il s’attache à la « création d’une ontologie en OWL capturant le sens des métadonnées utilisées », permettant de construire des "triplets RDF  à partir des données SupLomFr des ressources des UNT. Une architecture de publication est choisie, et un premier service d’interrogation par SPARQL est mis en place.     

Dans l'article de la conférence Linked Learning, les références à des travaux comparables sont commentées avec autorité (Lucero, ), les choix faits au cours de cette phase de la réalisation sont explicités clairement, la mobilisation et la mise en œuvre d’outils (apparemment  facilement disponibles mais fort  experts) sont conduites méthodiquement avec une grande efficacité.

Je vois dans l'article qu'on est dans le même sujet que celui des Linked Data (mais si, vous connaissez déjà, vous avez entendu parler d'Open Data et de data.gouv.fr). Si l’utilisation de technologies pour les linked data se répand, elle reste innovante dans de nombreux domaines d’application. Il est donc très approprié qu’on les applique dès maintenant aux ressources de e-formation de nos Universités Numériques Thématiques (UNT), puisqu'il s'agit par principe de ressources pédagogiques libres

Cette démonstration grandeur nature d’un projet de linked data est à mettre en relief comme exemple concret auprès de décideurs jusqu’ici peu familiers des perspectives ouvertes par ces approches. Dans l'état actuel du démonstrateur, même si cela reste peu accessible pour le profane, j'estime cependant que la visite en est utile !. 

La même équipe a déposé un dossier pour le financement de la phase 2 à l'appel à projet UNIT 2012 :
2012-25 - Déploiement de SemUNIT - UNIT - Voir la fiche détaillée

Un peu de vulgarisation sur le ‘comment’ des prouesses des outils du web sémantique, à partir de cette réalisation, sera très utile pour notre culture générale. Ainsi, à partir de 6000 ressources pédagogiques, on engendre un million de triplets RDF, ce qui permet au moteur de recherche de donner son plein. On comprend que les ‘classes’ et les ‘propriétés’ reprennent toutes les liaisons existantes, mais jusqu’à présent non exploitables, issues de l’indexation SupLomFr. 

On comprend aussi que le projet, en tant que projet de web sémantique & linked data, reste adaptable et enrichissable au fur et à mesure des réflexions futures. 

En particulier, si la mobilisation des données disponibles et organisées dans le SupLomFr a permis cette réalisation en lui donnant une fondation homogène, on peut se demander comment on articulera cette approche dans les cas où on disposera d’ontologies et de séries de triplets RDF complémentaires du monde du linked data, construites à partir d’autres bases : analyses textuelles internes à tel ou tel domaine scientifique et technologique, DPpedia, … . La conclusion de l’article pointe bien la piste de liaison avec DBLP, ... 


Aucun commentaire: