2023-2024 / INFO8008-1

Multivaried analysis 2 : data mining et machine learning

Durée

12h Th, 26h Pr

Nombre de crédits

 Master : bioingénieur en sciences agronomiques, à finalité4 crédits 
 Master : bioingénieur en chimie et bioindustries, à finalité4 crédits 
 Master : bioingénieur en sciences et technologies de l'environnement, à finalité4 crédits 
 Master : bioingénieur en gestion des forêts et des espaces naturels, à finalité4 crédits 

Enseignant

Yves Brostaux, Juan Antonio Fernandez Pierna, Hélène Soyeurt

Coordinateur(s)

Hélène Soyeurt

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Le cours se divise en 6 modules d'apprentissage composé d'une séance en présentiel et d'activités e-learning:

  • Module 1: Régression linéaire, Ridge et Lasso
  • Module 2: Régression sur composantes principales (PCR) et régression des moindres carrés partiels (PLS)
  • Module 3: Régression logistique
  • Module 4: Random forest
  • Module 5: analyse discriminante PLS + Super vector machine (SVM)
  • Module 6: Systèmes neuronaux

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

A l'issue du cours, l'étudiant sera capable de mener un projet d'exploration de données du nettoyage des données, en passant par la calibration, la validation et l'implémentation.
L'étudiant sera également capable de communiquer ses résultats vers un public cible.

Savoirs et compétences prérequis

STAT2002-A-a : Statistique fondamentale, 1ère partie
STAT2004-A-a : Statistique appliquée : 1ère partie
STAT2005-A-a : Statistique appliquée : 2ème partie
STAT1213-A-a : Analyse statistique à plusieurs variables

Activités d'apprentissage prévues et méthodes d'enseignement

Le cours est composé de 6 modules comme mentionné précédemment. Chaque module est composé:

  • d'une séance en présentiel de 2h reprenant les concepts théoriques
  • d'une séance e-leaning de 1h mettant en pratique les concepts théoriques vus
  • d'une séance e-learning de 3h axé sur la résolution d'une analyse de données liée aux concepts théoriques vus

Mode d'enseignement (présentiel, à distance, hybride)

Séances en présentiel (30%) + activités e-learning (70%)

Lectures recommandées ou obligatoires et notes de cours

Le cours est donné en anglais.
Tous les supports de cours sont disponibles sur la plateforme e-campus du cours.

Modalités d'évaluation et critères

Examen(s) en session

Toutes sessions confondues

- En présentiel

évaluation orale

Travail à rendre - rapport


Explications complémentaires:

L'évaluation pendant la session d'examens se fera en 2 parties:



  • une réponse à des questions par écrit (30min)
  • un examen oral relatif à la réalisation d'un travail donné un mois avant l'examen (15 min).
Code jaune et orange: L'examen se donne en présentiel au sein du service de statistiques en respectant les mesures sanitaires.

 

Stage(s)

Remarques organisationnelles et modifications principales apportées au cours

Contacts

Hélène Soyeurt
Chargé de cours
081/62.25.35
hsoyeurt@uliege.be

Association d'un ou plusieurs MOOCs