2024-2025 / SPAT0086-1

Advanced data analysis in python and introduction to machine learning

Durée

15h Th, 25h Pr

Nombre de crédits

 Master en sciences spatiales, à finalité approfondie4 crédits 
 Master en sciences spatiales, à finalité spécialisée4 crédits 

Enseignant

Valentin Christiaens, Maxime Fays, Guy Munhoven, Dominique Sluse

Coordinateur(s)

Maxime Fays

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au deuxième quadrimestre

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Ce cours s'appuie sur les sujets couverts dans le cours SPAT0002 et propose une utilisation avancée du python dans le contexte des sciences spatiales. Avec ce cours, l'étudiant aiguisera ses compétences en programmation Python et se familiarisera avec certaines des techniques les plus populaires utilisées pour l'analyse des données dans les sciences spatiales. En particulier, l'accent sera mis sur les techniques liées au Machine Learning, au traitement et à l'analyse de séries temporelles et d'images. Le cours s'appuiera sur des diapositives et des Jupyter notebooks qui fourniront une explication concise des techniques examinées, ainsi qu'un (ou plusieurs) exercice(s) concret(s) généralement inspiré(s) de problèmes scientifiques réels.

Les cours se répartissent en deux parties principales :

  • Introduction à l'apprentissage automatique - Cette partie couvre les concepts importants de l'apprentissage automatique, comme, p. ex., les biais, l'underfitting et l'overfitting (sous-apprentissage et surapprentissage), validation croisée, matrices de confusion, ...), ainsi qu'à fournir un aperçu de certaines méthodes importantes utilisées pour l'apprentissage supervisé et non supervisé. En particulier, certains algorithmes parmi les plus populaires utilisés pour la réduction de la dimensionnalité, la classification, le regroupement et la régression seront présentés et expérimentés.
  • Analyse avancée des données - Cette partie étend l'analyse des séries temporelles introduite dans SPAT0002 (analyse de signaux périodiques et non périodiques), et couvre certains concepts de base du traitement des images (débruitage, filtrage, photometrie). Nous introduirons des outils communément utilsés en science spatial pour extraire de l'information de données brutes mais également pour nettoyer et valider des échantillons de données.  

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

  • Maîtrise des concepts importants et du "jargon" utilisés dans l'apprentissage automatique (biais, surajustement, matrice de confusion, ...).
  • Utiliser et appliquer les techniques standard d'apprentissage automatique à des ensembles de données et identifier la technique la mieux adaptée à un ensemble de données spécifique.
  • Maîtriser les outils nécessaires pour manipuler, nettoyer et vérifier de grands ensembles de données.
  • Utiliser des techniques avancées pour manipuler et interpréter le signal scientifique présent dans les images et les séries temporelles.
  • Construire un savoir-faire et une compréhension solides de la programmation python pour explorer, identifier et comprendre les solutions numériques à des problèmes qui ne sont pas enseignés pendant les cours magistraux.
  • Utiliser les outils adéquats pour le développement de projets et la programmation en python.
  • Etre capable d'appréhender et d'utiliser de nouveaux outils informatiques d'analyse développés en language python.

Savoirs et compétences prérequis

Cours SPAT0002-1 ou semblable.

Activités d'apprentissage prévues et méthodes d'enseignement

Le support du cours théorique est sous forme de notebooks Jupyter (http://jupyter.org) qui contiennent, en plus de la matière vue, des exemples et des petits exercices interactifs permettant aux étudiants une expérience directe des méthodes et notions présentées.
Les travaux pratiques sont consacrés à l'étude de problèmes plus avancés dont la résolution se fera à l'aide de librairies Python dans lesquelles plusieurs algorithmes vus au cours sont implémentés.

Mode d'enseignement (présentiel, à distance, hybride)

Cours donné exclusivement en présentiel

Supports de cours, lectures obligatoires ou recommandées


Informations complémentaires:

Le cours est basé sur du matériel provenant de diverses sources dont les références seront données à la fin de chaque notebook Jupyter.


En outre, les ouvrages suivants seront également utilisés:

 

Modalités d'évaluation et critères

Examen(s) en session

Toutes sessions confondues

- En présentiel

évaluation écrite ( questions ouvertes ) ET évaluation orale

- En distanciel

évaluation écrite ( questions ouvertes ) ET évaluation orale


Informations complémentaires:

L'examen sera, dans la mesure du possible organisé en présentiel.

Il sera discuté avec les étudiants de la possibilité de remplacer/compléter la partie écrite de l'examen par un projet à présenter oralement. Cette modalité d'examination, si plébiscitée par les étudiants, ne remplacera pas de cours en présentiel. 

Stage(s)

Il n'y a pas de stage prévu dans le cadre de ce cours.

Remarques organisationnelles et modifications principales apportées au cours

Le cours sera donné à raison d'un séance de 4h par semaine, au second quadrimestre.

Contacts

Dominique Sluse
Université de Liège
Institut d'Astrophysique et de Géophysique (Bât. B5c)
17, allée du Six-Août
B-4000 Liège
Tél.: (+32) (4) 366 9797  (D. Sluse)

Association d'un ou plusieurs MOOCs

Aucun MOOC n'est associé à ce cours.

Notes en ligne

Dépot Github où les notes de cours sont postées
https://github.com/SPAT0086

Le dépôt "Ongoing" contient les notes de l'année académique en cours.