2024-2025 / INFO0943-1

Corpus textuels : principes de constitution et d'analyse

Durée

30h Th

Nombre de crédits

 Master en langues et lettres anciennes et modernes, à finalité approfondie5 crédits 
 Master en langues et lettres anciennes, orientation classiques, à finalité approfondie5 crédits 
 Master en langues et lettres anciennes, orientation orientales, à finalité approfondie5 crédits 
 Master en langues et lettres anciennes, orientation classiques, à finalité didactique5 crédits 
 Master en langues et lettres anciennes et modernes, à finalité didactique5 crédits 
 Master en linguistique, à finalité spécialisée en analyse des données textuelles5 crédits 
 Master en langues et lettres anciennes et modernes, à finalité spécialisée en édition et métiers du livre5 crédits 
 Master en langues et lettres anciennes, orientation classiques, à finalité spécialisée en édition et métiers du livre5 crédits 
 Master en langues et lettres anciennes, orientation orientales, à finalité spécialisée en langues et civilisations de l'Extrême-Orient : Chine-Japon5 crédits 
 Master en linguistique, à finalité spécialisée en traitement informatique du texte et analyse des données textuelles (Double diplomation)5 crédits 
 Master en langues et lettres anciennes, orientation orientales, à finalité spécialisée en langues, cultures et sociétés de l'Asie orientale : Chine-Japon5 crédits 
 Master en langues et lettres anciennes et modernes5 crédits 
 Master en langues et lettres anciennes, orientation classiques5 crédits 

Enseignant

Dominique Longrée, Julien Perrez

Langue(s) de l'unité d'enseignement

Langue française

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Introduction aux principes de constitution, de préparation et d'enrichissement des corpus textuels : historique de la discipline, définition des principaux concepts, méthodes d'enrichissement des corpus textuels (métadonnées, lemmatisation, étiquetage morphosyntaxique, ect.) par des méthodes semi-automatiques et par des étiqueteurs entraînables, organisation des éléments du corpus en base de données textuelles; exploitation des bases de données et analyse des données.

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

Ce cours a pour objectif de familiariser les étudiants de 1ère année du Master en Linguistique, à finalité spécialisée en Traitement automatique des textes et analyse statistique des données textuelles avec les méthodes de constitution et de préparation de corpus ou de base de données textuelles, en vue de leur utilisation dans le cadre de leurs recherches disciplinaires.

Savoirs et compétences prérequis

Aucun.

Activités d'apprentissage prévues et méthodes d'enseignement

Cours magistraux et exercices

Mode d'enseignement (présentiel, à distance, hybride)

1er quadrimestre.

Supports de cours, lectures obligatoires ou recommandées

Modalités d'évaluation et critères

Examen(s) en session

Toutes sessions confondues

- En présentiel

évaluation écrite ( questions ouvertes ) ET évaluation orale

- En distanciel

évaluation écrite ( questions ouvertes ) ET évaluation orale

Travail à rendre - rapport


Explications complémentaires:

Examen écrit et oral

Stage(s)

Remarques organisationnelles et modifications principales apportées au cours

1h de cours avec J. Perrez et 1h de cours avec D. Longrée

Contacts

Julien.Perrez@ulg.ac.be
dominique.longree@ulg.ac.be

Association d'un ou plusieurs MOOCs

Notes en ligne

Notes sur eCampus
Notes sur eCampus