Ateliers

Extraction et Modélisation de Connaissances à partir de textes scientifiques (EmcSci)

Organisateurs:

  • Davide BUSCALDI, LIPN Paris
  • Valentina PRESUTTI, DR CNR Italie

Site web: emcsci/français

Date: Lundi après-midi.

Description

L’extraction de connaissances à partir du texte, également connue sous le nom de la fouille de texte, est une tâche clé dans le contexte du TAL. Les techniques d'analyse de texte permettent d'identifier concepts et leurs relations dans des textes non structurés. Les textes scientifiques constituent un champ d'application stimulant et intéressant pour telles techniques: trouver des concepts clés [Lopez 2010], identifier des domaines de recherche et leurs relations [Gabor 2016b] permet d'améliorer l'accès aux collections de textes scientifiques [Osborne 2012, Osborne 2013]. Le fait que les articles aient des auteurs et une date de publication permet d'extraire aussi des informations de collaboration [Roth 2010] et de déterminer l'évolution de certains concepts dans le temps [Chavalarias 2013]. L'intérêt pour ce type d'extraction des connaissances est attesté par l'apparition récente d'ateliers et de défis dédiés, tels que SAVE-SD (http://cs.unibo.it/save-sd/2015/) et ScienceIE (tâche 10 à Semeval 2017: https://scienceie.github.io/index.html). L'objectif de cet atelier est de rassembler des chercheurs qui s'intéressent à divers aspects du processus d'extraction de connaissances à partir de textes scientifiques, en particulier, mais sans s'y limiter, à: la recherche d'experts et la détection de communautés, la découverte des tendances de recherche, les méthodes d'extraction de phrases clés et de relations, de construction ou d'expansion automatique d'ontologies dédiées à l'analyse de données scientifiques.

OWL Reasoning in Practice

Organisatrices:

  • Sylvie DESPRES, LIMICS Paris
  • Florence AMARDEILH, Mondeca

Site web: owl-reasoning-in-practice

Date: Mardi. La durée de l'atelier sera revue en fonction du nombre de soumissions acceptées.

Description

L'objectif de cet atelier adossé à la conférence Ingénierie des Connaissances IC-2017 est de dresser un panorama des recherches et expérimentations francophones traitant du raisonnement avec des ontologies formalisées en OWL.

La spécification formelle d'une ontologie nécessite l'utilisation d'un langage de description. Depuis 2009, OWL2 est recommandé par le W3C comme le langage de description pour les ontologies. OWL2 est une nouvelle version de OWL enrichissant l'expressivité du langage OWL pour les propriétés et les types de données. L'expressivité est une caractéristique distinctive d'un langage de description. Elle est déterminée par le type de constructeurs autorisés et la manière dont ils peuvent être combinés dans le langage considéré. Une grande expressivité inclut de nombreux types de constructeurs différents. Cependant, cette expressivité a un prix. Plus l'expressivité est grande et plus les temps de réponse aux requêtes ou l'exécution des raisonnements peuvent être importants. Le choix d'un profil (ensemble de constructeurs permettant de parvenir au niveau d'expressivité souhaité) peut ainsi s'avérer coûteux en calculabilité. Un compromis doit par conséquent être trouvé entre expressivité et calculabilité. Il est difficile de trouver dans la littérature actuelle des projets ayant mis en œuvre un raisonnement OWL permettant d'exploiter l'expressivité d'une ontologie dans un cadre applicatif. Et c'est pourquoi nous souhaitons ouvrir le débat pour évaluer ensemble la pertinence du raisonnement OWL dans les applications, les besoins auxquels il peut répondre comme les limitations auxquelles il peut se confronter dans un environnement exigeant.

Recherche d'Information Sémantique (RISE)

Organisateurs:

Site web: RISE

Date: Mardi

Description

Les avancées du Web Sémantique rendent possible la mise en place de nouvelles méthodes d'accès à l'information sémantique. Les ressources sémantiques mises en ligne permettent de conceptualiser les besoins des utilisateurs et les contenus des documents. En effet les systèmes d'accès à l'information peuvent désormais traiter le contenu informationnel au niveau sémantique et non plus seulement au niveau signal (texte, image, etc). Un des enjeux actuels est de proposer des fonctionnalités sémantiques pertinentes pour exploiter au mieux les ressources sémantiques telles que les ontologies, les bases de données lexicales, les thesaurii. Le passage au niveau conceptuel permet de s'abstraire du niveau signal ainsi que, dans certains cas, de la langue. Le raisonnement au niveau conceptuel peut être exploité pour la recherche d'information multimédia et multilingue.

Les précédentes éditions de cet atelier ont montré l'intérêt de la recherche d'information sémantique dans des domaines de spécialité tels que le domaine agricole, médical, juridique, environnement, etc. Cet atelier a pour but de proposer un lieu d'échange entre des chercheurs issus de différentes communautés comme la Recherche d'Information, le Web Sémantique, l’Extraction des Connaissances et le Traitement Automatique des Langues Naturelles et le Multimédia. Comme l’an passé une session industriel sera organisé pour permettre à des industriels de venir présenter leur projet et leur développement logiciel en lien avec les thèmes de RISE.

Tutoriels

Modélisation visuelle d’ontologie pour le web sémantique avec le Graphical web ontology language (GOWL) et le logiciel OntoCASE4GOWL

Organisateurs:

Site web: tutoriel-g-owl-journees-francophones-d-ingenierie-des-connaissances

Date: Mardi après-midi.

Description

Données ouvertes et liées, intelligence artificielle, données massives sont autant de sujets d’actualité qui favorisent la migration du web sémantique et de la modélisation d’ontologies d’un usage en recherche vers sa démocratisation en industrie. Il est d’usage courant pour l’architecte de données d’utiliser des outils de modélisation qui permet de manipuler la donnée et sa structure dans un mode de représentation qui soit visuelle et graphique. Le besoin associé à ce type d’usage est aussi une demande pour le spécialiste qui souhaite construire une ontologie. Pour l’heure, les syntaxes préconisées par le W3C pour modéliser une ontologie sont en mode textuel. C’est pour offrir un complément visuel que le Graphical Web Ontology Laguage (GOWL)(Héon, 2014; Héon & Nkambou, 2013; Héon, Nkambou, & Langheit, 2016; Héon, Paquette, Nkambou, Gaha, & Langheit, 2017) a été conçu et que le logiciel OntoCASE4GOWL(Héon, Nkambou, & Gaha, 2016) développé.

Production de Linked Data à l'aide de la plateforme Datalift

Organisateurs:

  • Gabriel KEPEKLIAN, ATOS Integration France Orléans
  • Badre BELABBESS, ATOS Integration France Orléans
  • Houda KHROUF, ATOS Integration France Orléans

Site web à venir

Date: Lundi après-midi.

Description

Les données, qu'elles soient open data ou privées, gagnent toute leur valeur lorsque leur hétérogénéité disparaît au profit de leur interconnexion. Dans ce tutoriel, nous présentons concrètement comment produire un jeu de données liées à partir de données brutes non liées en recherchant les liens sémantiques latents qui existent. Une nouvelle version inédite de la plate-forme Datalift sera mise à disposition des participants. On interconnectera divers sources de données, dont des données géospatialisées OGC. L'interconnexion sera conforme à une ontologie. Les résultats seront présentés à l'aide des modules data visualisation de la plate-forme.

Le Web Sémantique rencontre L’Internet des Objets et le Web des Objets

Organisateurs:

Site web: Web Sem rencontre IoT & WoT

Date: Lundi.

Description

Le Web, le e-commerce, les réseaux sociaux, le cloud, ont représenté autant de vecteurs d'innovation pour les entreprises. Ces transitions numériques touchent chaque secteur d'activité économique, et depuis 2012 le Gouvernement aide les entreprises à opérer ces transitions pour qu'elles restent compétitives. Le prochain vecteur d'innovation identifié est l'Internet des Objets. Un rapport de 2015 de l'institut McKinsey Global estime le chiffre d'affaire annuel mondial généré par l'Internet des Objets à 11 100 milliard de dollars par an d'ici 2025. Il ajoute que l'interopérabilité sémantique débloquerait à lui seul 40 à 60% de ce montant.

Pour rendre les systèmes interopérables sémantiquement, nous identifions trois verrous principaux : (1) rendre les objets capables d'interagir sur le Web ; (2) permettre à RDF d’être une lingua franca sur le Web et le Web des Objets ; et (3) choisir un vocabulaire RDF commun par secteur d'activité, ou aligner ceux qui existent. La première partie de ce tutoriel présentera les bases de l'Internet des objets (IoT) et du Web des Objets (WoT), et proposera un tour d’horizon des travaux de recherche et de standardisation ayant pour objectif d’apporter des solutions à ces problèmes. La deuxième partie de ce tutoriel introduit le framework M3 et la méthodologie SEG 3.0. Nous montrerons comment les formalismes et technologies du Web sémantique peuvent être utilisés pour l'annotation sémantique et le raisonnement sur les données de capteurs pour construire des applications interopérables. La troisième partie de ce tutoriel complètera le panorama des solutions existantes répondant aux problématiques d’interopérabilités. Des initiatives émergent pour lever les verrous identifiés sur l’IoT, et font tendre le Web des objets vers un Web des Objets Sémantique (SWoT). Des standards issus du monde industriel, comme oneM2M, se rapprochent du W3C et intègrent dans leurs propositions des principes et des technologies issues du web sémantique. l’après-midi sera organisé comme un « hackfest » avec des objets communicants. En vous appuyant sur les résultats obtenus au cours des précédentes étapes, vous concevrez une application WoT à partir d’objets réels (capteurs, actionneurs, petits robots) hétérogènes, rendus interopérables à l’aide de technologies sémantiques, dont les fonctionnalités seront décrites et déduites sémantiquement.