Durée
30h Th, 60h Proj.
Nombre de crédits
Master en science des données, à finalité | 5 crédits | |||
Master : ingénieur civil en science des données, à finalité | 5 crédits |
Enseignant
Langue(s) de l'unité d'enseignement
Langue anglaise
Organisation et évaluation
Enseignement au premier quadrimestre, examen en janvier
Horaire
Unités d'enseignement prérequises et corequises
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement
Data science is rooted in a rigorous and systematic methodology for understanding and interpreting data. This course seeks to instil the foundational principles of data science, with a particular emphasis on the scientific method and the iterative process of Bayesian modelling. Our perspective is that models are built iteratively: We build a model, use it to analyze data, assess how it succeeds and fails, revise it based on insights, and repeat.
The lectures will closely follow each step of this loop (tentative and subject to change):
- Lecture 1: Build, compute, critique, repeat
- Lecture 2: Data
- Lecture 3: Visualization
- Lecture 4: Latent variable models
- Lecture 5: Expectation-maximization
- Lecture 6: Variational inference
- Lecture 7: MCMC
- Lecture 8: Model criticism
- Lecture 9: Wrap-up case study
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement
At the end of the course, the student will have gained the necessary experience, both theoretical and hands-on, for solving data-analysis problems. He/she will have acquired and practised the scientific method at the core of data science, including the representation, manipulation and visualization of the data, the design and use of Bayesian probabilistic models, their iterative criticism and improvement, as well as their applications for answering questions, claiming discoveries or making decisions.
Savoirs et compétences prérequis
Programming experience. Probability and statistics. Elements of artificial intelligence.
Activités d'apprentissage prévues et méthodes d'enseignement
- Lectures, with live coding sessions
- Reading assignments
- Homeworks
Mode d'enseignement (présentiel, à distance, hybride)
Cours donné exclusivement en présentiel
Explications complémentaires:
Lectures are taught face-to-face. Homeworks are carried out remotely.
Lectures recommandées ou obligatoires et notes de cours
Materials will be made publicly available on GitHub during the semester.
Modalités d'évaluation et critères
Examen(s) en session
Toutes sessions confondues
- En présentiel
évaluation orale
Travail à rendre - rapport
Explications complémentaires:
The evaluation is divided into the following units:
- Homeworks
- Exam (data science study)
Stage(s)
Remarques organisationnelles et modifications principales apportées au cours
The course hub is available at https://github.com/glouppe/dats0001-foundations-of-data-science
Contacts
Gilles Louppe (g.louppe@uliege.be)