Plan du site

Présentation

Recherche

Enseignement

Perso


Formation et titres universitaires

Activités d'enseignement

Recherche

Autres expériences professionnelles

Responsabilités collectives

Autres informations


CV détaillé

Marié - Nationalité française - Né le 10/09/1976 à Amiens (80)

Formation et titres universitaires

2004 Thèse de doctorat de l´université de Caen / Basse-Normandie (14), spécialité informatique

Titre Sémantique légère pour le document - Assistance personnalisée pour l´accès au document et l´exploration de son contenu


sous la direction de Mme Anne Nicolle, Professeur de l´université de Caen / Basse-Normandie


2000 DEA d´informatique – intelligence artificielle, image et algorithmique – spécialité intelligence artificielle, mention Bien

Titre Catégorisation lexicale pour la recherche documentaire

sous la direction de Mme Anne Nicolle et de M. Pierre Beust de l´université de Caen / Basse-Normandie


3e du DEA, Major de la spécialité intelligence artificielle

Bénéficiaire d´une bourse nationale de mérite.

1999 Maîtrise d´informatique – option intelligence artificielle et imagerie à l´université de Reims (51), mention Bien

Projet Annuel : KQML, communication entre agents logiciels sous la direction de Mme Zahia Guessoum,

Maître de conférences de l´université de Paris VII

(mention Très Bien).

1998 Licence d´informatique à l´université de Reims (51), mention Bien

1996/1997 DEUG MIAS – Mathématiques et Informatique Appliquées aux Sciences à l´université de Reims (51)

1995 Classe préparatoire aux concours d´entrées aux grandes écoles au lycée Georges Clemenceau de Reims (51)

1994 Baccalauréat C (scientifique) au lycée Paul Claudel de Laon (02), mention : très bien


Activités d’enseignement

Résumé

Environ 430 h éq. TD. d’enseignements.


Postes :
Publics concernés :

Principales compétences enseignées :

2004/2005 ATER - Attaché Temporaire à l´Enseignement et à la Recherche temps complet sur 6 mois, 96 heures éq. TD.

École Nationale Supérieure d’Ingénieur de Caen

Intitulé
Nature
Niveau
Effectifs
Contenu
Technologie Java 30h de TP 2e année 20 étudiants Java avancé : JDBC, Beans, JNI, JBuilder, etc.
Outils de développement 30h de TP 1e année 18 étudiants Introduction aux outils de développement : algorithmique, C, gcc, scripts Shell, , Xemacs, Dos, etc.
Conception de sites pour l´Internet 10h de TP 1e année 18 étudiants Développement pour l´Internet : HTML, XHTML, Javascript, CSS, CGI, etc.
Programmation Objet 20h de TP
20h de TD
3e année
2 groupes de 16 étudiants
Introduction à la POO : héritage, interfaces et classes abstraites, Java, etc.

Département d’informatique de l’université de Caen / Basse-Normandie

Intitulé
Nature
Niveau
Effectifs
Contenu
Design des sites web – Culture Hypermédia 15h de TP
Licence professionnelle Communication des organisations
15 étudiants
Conception d’une charte graphique et création de sites : Illustrator, Photoshop, Gimp, Image Ready, etc.
9h de TP Master Ingénierie de l’Internet 23 étudiants

2003/2004 ATER - Attaché Temporaire à l´Enseignement et à la Recherche temps partiel, 96 heures éq. TD

Département d’informatique de l’université de Caen / Basse-Normandie

Intitulé
Nature
Niveau
Effectifs
Contenu
Programmation Objet en Java 6h de CM
12h de TD
12h de TP
DESS NAPI Nouvelles Applications pour l’Internet
env. 15 étudiant
Initiation à la POO et au génie logiciel : UML, Java, héritage, JDBC, Swing et Awt, etc.
Applications Documentaires 8h de CM DESS RADI Réseaux, Applications Documentaires et Image env. 20 étudiants Cours sur les techniques de TAL pour la recherche documentaire : moteurs recherche (Google et PageRank), Web Sémantique, etc.
Conception de sites pour l’Internet 8h de TP
8h de TD
DEUG MIAS 2e année env. 25 étudiants HTML, Javascript, CSS (suivis et encadrement de projets).

Encadrements de deux projets de DESS :

  • DESS NAPI : Création et gestion de requêtes Web à partir de ressources d'ingénierie linguistique.
  • DESS RADI : La recherche documentaire personnalisée : étude bibliographique et perspectives d’évolution.

Département Langues Etrangères Appliquées de l´université de Caen / Basse-Normandie

Intitulé
Nature
Niveau
Effectifs
Contenu
Modèles de calcul et leur application dans un tableur 39h de TD
DEUG LEA 2e année
2 groupes d’env. 25 étudiants
Tableurs : Excel (formules complexes, TCD, tris, graphiques, etc.)

2000-2003 Moniteur de l´enseignement supérieur 192 heures éq. TD sur 3 années (3 fois 64h)

Département d’informatique de l’université de Caen / Basse-Normandie

Intitulé
Nature
Niveau
Effectifs
Contenu
Linguistique et Traitement Automatique des Langues 40h de TP
40h de TD
DEUG MIAS 1e année
2x 1 groupes d’env. 25 étudiants
Initiation au T.A.L. : segmentation multilingue, recherche d’entités nommées, etc.
Modélisation objet et algorithmique 50h de TP
50h de TD
DEUG MIAS 2e année 3x 2 groupes d’env. 25 étudiants Programmation Objet et principes de l’algorithmique : UML, Java, etc.

Encadrement d’un projet en maîtrise d’informatique (10h éq. TD)

  • Filtrage et ordonnancement de résultats de moteurs de recherche de l’Internet à partir de ressources d’ingénierie linguistique.
  • HTMLtoSVG : création de représentations graphiques de pages HTML – Coloration lexicale et repérage de zones pertinentes

 

Département de linguistique de l’université de Caen / Basse-Normandie

Intitulé
Nature
Niveau
Effectifs
Contenu
Traitement automatique des langues 8h de CM
8h de TD
Licence de linguistique
env. 12 étudiants
Initiation au TAL : segmentation, loi de Zipf, lemmatisation, initiation aux expressions régulières, approche multilingue, etc.

1999 Vacataire de la faculté de médecine de Caen

Bureautique : Word, Excel, Access (30h de TP) Initiation à la bureautique aux étudiants en 3e année de médecine (env. 25 étudiants). Sous la direction du Professeur Thouin.


Recherche

voir rubrique Publications et Logiciels.


Mes activités de recherche concernent deux domaines principaux : l’interaction homme-machine dans une problématique documentaire et l’exploitation assistée de corpus de documents numériques textuels. Mon travail se fonde à la fois sur des théories linguistiques (principalement les travaux de F. de Saussure, la sémantique interprétative de F. Rastier et plus largement la sémantique structurale européenne) et des concepts et des techniques informatiques (interfaces d’interaction, approches statistiques des documents numériques textuels, modélisation objet, etc.). Il s’agit en cela d’un projet résolument pluridisciplinaire mené au sein de l’équipe ISLanD (Interaction Sémiotique : Langues et Diagrammes) du GREYC où se côtoient informaticiens, linguistes et sémioticiens. Une partie de mes travaux se déroule dans le cadre d’un projet inter-équipe avec M. Stéphane Ferrari de l’équipe DoDoLa (Données, Documents et Langue) du GREYC. Cette collaboration (projet ISOMETA) a été mise en place en 2002 et se poursuit toujours.


L’approche du document numérique textuel que je défends s’inscrit dans le champ des recherches qui tentent de pallier les inconvénients des objectifs maximalistes de l’Intelligence Artificielle classique. Je me tourne ainsi vers une problématique d’assistance à l’interprétation des documents. Cet intérêt s’est manifesté en particulier à travers une participation jusqu’en 2004 au RTP 14 du CNRS-STIC intitulé "Sémantique Dynamique". Pour prendre en considération la dimension praxéologique des tâches documentaires et les particularités langagières des utilisateurs, je m’appuie sur des théories linguistiques qui me permettent de maintenir cohérentes les réalisations logicielles. En retour, les concepts et techniques informatiques sont exploitées au maximum pour élaborer des solutions technologiques innovantes adaptées à des préoccupations réelles permettant par exemple la mise en place de projets industriels.


Du point de vue des recherches fondamentales, mon travail principal a été, durant ma thèse, l’élaboration d’un modèle de catégorisation et de description de significations utilisables par des processus pour l’accès à des documents et l’assistance à l’exploration de leur contenu. Ce modèle, initialement nommé ANADIA et désormais LUCIA (pour Located User-Centred Interpretative Analyser) permet une instrumentation de l’activité interprétative de l’utilisateur. Il est avant tout dédié à l’assistance à l’accès au sens et non au calcul exclusivement automatique du sens. Cette approche centrée sur l’utilisateur a nécessité des discussions et la confrontation de nos travaux avec des linguistes, des psychologues et des psycholinguistes. Des rencontres ont par exemple eu lieu au sein du pôle pluridisciplinaire MODESCOS (Modélisation en Sciences Cognitives et Sociales) – axe Interactions de la MRSH (Maison en Recherche des Sciences Humaines) de l’université de Caen / Basse-Normandie, dont je fais partie depuis mon DEA.


Du point de vue applicatif, deux voies ont été explorées pour valider mon travail de thèse : l’analyse d’une métaphore conventionnelle, et la veille documentaire. Une plate-forme d’ingénierie linguistique a été élaborée pour assister ces deux tâches. Elle est constituée principalement de cinq logiciels (libres et mis à disposition sur simple demande) qui implantent les principes de LUCIA. Il s’agit de :


  • MEMLABOR, une plate-forme pour la manipulation et la gestion de corpus de documents aux formats HTML ou TXT qui propose divers travaux sur les corpus dont la transformation HTML vers TXT, la segmentation automatique des textes en graphies et paragraphes, le calcul des occurrences des graphies répétées (loi de Zipf), la création de groupes de graphies (en relation avec une base de données de flexions) pour le calcul des cooccurrences 2 à 2 (voir thèse pp. 129-141 et liste des publications).
  • THEMEEDITOR, un logiciel interactif pour l’évaluation de regroupements thématiques d’entités lexicales. Ce logiciel utilise les technologies XML et XSLT pour la coloration et la production de rapports chiffrés d’exploration de corpus pour l’assistance à la découverte de nouvelles entités lexicales associables à un thème donné et l’évaluation d’associations déjà existantes. Il a été adapté par nos soins à partir d’un projet de maîtrise en informatique (voir thèse pp. 141-147 et liste des publications).
  • LUCIABUILDER, un logiciel interactif pour la création assistée de dispositifs LUCIA, supports d’une description componentielle et différentielle d’un ensemble d’entités lexicales associées à un domaine de tâche documentaire (voir thèse pp. 151-160 et liste des publications).
  • 3D-LUCIAVIZUALISER, un logiciel interactif de visualisation en trois dimensions de redondances d’attributs et valeurs d’attributs LUCIA - pendants des sèmes de la sémantique interprétative de F. Rastier. Ce logiciel a été adapté par nos soins à partir d’un projet de DESS en informatique (voir thèse pp. 205-208).
  • LUCIASEARCH, un méta-moteur de recherche qui utilise des dispositifs LUCIA pour le filtrage et le réordonnancement d’ensembles de réponses obtenues de moteurs de recherche sur l’Internet. Ce logiciel est en cours d’adaptation dans le cadre d’un projet industriel mené conjointement avec une entreprise de veille documentaire, le CRITT-BNC (Centre Régional de Transfert Technologique – Basse-Normandie Cotentin) et le CERTIC (Centre de Ressources Technologiques en Technologies de l’Information et de la Communication) de Basse-Normandie (voir thèse pp. 226-248).

De plus, un ensemble de modules spécifiques permettant la transformation automatique de pages HTML en représentations graphiques au format SVG avec coloration thématique a été réalisé (à partir des résultats obtenus d’un projet de DESS). Ces logiciels et à travers eux le modèle LUCIA, ont fait l’objet de premières évaluations à travers plusieurs expériences :


  • la possibilité de création des ressources du modèle par des utilisateurs a été évaluée par une expérience avec une dizaine de sujets d’horizons divers (informaticiens, linguistes, psycholinguistes, ergonomes, etc.) au cours d’un atelier-formation CNRS – (voir thèse pp. 104-110 et liste des publications) ;
  • l’intérêt opérationnel des interfaces d’assistance à des linguistes ou à des experts du TAL a été démontré à travers la présentation de résultats spécifiques autour de l’étude d’une métaphore conventionnelle conceptuelle (voir thèse pp. 210-223 et liste des publications) ;
  • l’effectivité et l’intérêt des principes de filtrage, d’ordonnancement et de visualisation d’ensembles de documents dans un cadre de veille documentaire ont été montrés à travers une expérience élaborée pour la présentation de nos travaux à des industriels (voir thèse pp. 226-247). Ce champ d’application est actuellement à l’origine du projet d’innovation technologique mis en place conjointement avec le CRITT-BNC et le CERTIC.

Autres expériences professionnelles

Depuis 1997

Webmaster et infographiste

Réalisation de pochettes de supports musicaux (CD, cassettes, vynils), d'affiches, d'encarts publicitaires, d'autocollants et de sites web.

1995/1999

Hôte d'accueil

mission d'accueil et secrétariat au Centre International de Séjour et Relais Nautique de Reims (51)

1995/1996

Vendangeur - vignoble champenois - Epernay(51)
Employé stagiaire - compensation et sécrétariat - Banque Populaire du Nord de Laon (02)

 


Responsabilités collectives

Organisation de manifestations scientifiques

Mandats électifs

Autres responsabilités collectives


Autres informations


Get Firefox Valid XHTML 1.1! Valid CSS! Vincent.Perlerin@info.unicaen.fr