Durée
20h Th, 50h TD
Nombre de crédits
Master en bioinformatique et modélisation, à finalité approfondie | 8 crédits |
Enseignant
Tom Druet, Frédéric Farnir, Sébastien Massart, Kristel Van Steen
Coordinateur(s)
Langue(s) de l'unité d'enseignement
Langue anglaise
Organisation et évaluation
Enseignement au deuxième quadrimestre
Horaire
Unités d'enseignement prérequises et corequises
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement
Face à la croissance exponentielle de la quantité de données générées dans les sciences de la vie, la bioinformatique occupe maintenant une place centrale dans la recherche et le développement, y compris en agronomie.
L'objectif de ce cours est de développer la capacité d'analyse, l'aptitude à sélectionner et appliquer les algorithmes pertinents par rapport à une question scientifique et l'abilité à expliquer les opérations réalisées et les résultats obtenus auprès de biologistes "non bioinformaticiens". En bref, il s'agit surtout d'apprendre à décoder les besoins exprimés et les questions scientifiques posées de manière à appliquer les codes informatiques les plus pertinents.
Ce cours est basé sur l'apprentissage par projet ou par l'action. A partir d'un problème scientique et de données de séquençage haut-débit, les étudiants devront mettre en place et utiliser un pipeline d'analyse de données. La question scientifique posée visera à comparer les communautés microbiennes présentes dans différents échantillons. Voici un tutoriel d'introduction à cette thématique: https://www.youtube.com/watch?v=6564K4-_DBI
Après une introduction théorique et la mise en contexte du projet, les étudiants recevront des données de séquençage haut-débit de communautés microbiennes ainsi que l'objectif poursuivi pour l'analyse des données.
L'ensemble du cours, orienté développement d'un projet, sera centré sur la sélection, l'application et la documentation d'un pipeline bioinformatique utilisant la suite logiciel QIIME (sous linux, une boite virtuelle sera créée par les étudiants ne travaillant pas sous Linux). Des tutoriels vidéos seront disponibles pour guider les étudiants dans leur démarche et des entretiens avec l'équipe enseignante permettront de guider les étudiants dans leur démarche.
Partie 'Applications en génétique et génomique quantitative; Génomique complexe et systémique':
La seconde partie enseignée par Frédéric Farnir et Tom Druet s'intéresse à des applications en génétique ou génomique quantitative. Le développement des technologies de génotypages et de reséquençage des génomes ont ouvert la voie à de nombreuses études dans les domaines de la génétique des populations ou de la génétique quantitative. Il est possible d'étudier tant les populations d'intérêt agronomique, les organismes modèles que les populations sauvages. Dans cette partie, nous ferons des analyses génomiques sur des données réelles. Ces analyses illustreront l'identification de la structure des populations, les techniques d'haplotypage et d'imputation de génotypes manquants, l'estimation des relations de parenté et du coefficient de consanguinité, l'identification de QTL et éventuellement les études d'associations ou l'identification de variants associés à des maladies récessives. Cette partie sera organisée en huit séances de 4h avec une première partie présentant les aspects théoriques suivie d'applications sur ordinateur avec des logiciels fréquemment utilisés. Si les conditions l'exigent, les séances en présentiel seront remplacées par des cours sur blackboard collaborate, ainsi que des documents décrivant les analyses à réaliser.
La partie enseignée par Kristel Van Steen présente les composants de la génétique complexe et met en évidence les avantages et les inconvénients des approches de la génétique des systèmes dans le contexte de la santé publique et de la médecine personnalisée.
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement
Les acquis d'apprentissage sont les suivants:
- Capacité à mettre en place un pipeline d'analyse bioinformatique de données de séquençage haut-débit en fonction des questions biologiques posées (transposer une question biologique en analyse bioinformatique utilisant les outils appropriés)
- Aptitude à analyser de manière critique un pipeline bioinformatique
- Capacité à extraire l'information biologique importante à partir de données brutes
- Développer la capacité d'interprétation qualitative et quantitative du "big data"
Pour la seconde partie, les acquis d'apprentissage sont :
- L'acquisition de nouvelles connaissances théoriques en génétique quantitative et génétique des populations telles que les notions de parenté, les modèles pour les études d'association, etc. ;
- L'apprentissage de techniques de modélisation de données génomiques de grande taille;
- La connaissance de logiciels de génétique et la capacité à interpréter les sorties de ces logiciels ;
- Une culture générale des techniques actuellement utilisées en génomique pour l'étude des populations et des caractères complexes.
- Connaissance d'importants concepts et voies d'analyse en génétique des systèmes pour les maladies complexes et en science translationnelle
Savoirs et compétences prérequis
Une bonne connaissance de la biologie moléculaire et des techniques associées (PCR, séquençage,...) est nécessaire.
Une connaissance poussée en bioinformatique ou en language de programmation n'est pas indispensable.
Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
Pour la seconde partie les étudiants devront avoir d'une part des connaissances de base en génétique quantitative, génétique des populations et en statistiques et d'autre part pouvoir travailler sous linux et avec R.
Activités d'apprentissage prévues et méthodes d'enseignement
Le cours se développe selon le principe de la classe inversée et de l'apprentissage par l'action. Une introduction générale sera donnée ex-cathedra. Cette introduction permettra d'expliquer le contexte, les objectifs, les modalités d'apprentissage et l'évaluation de ce cours.
Les données brutes à analyser seront également transférées aux étudiants
Des tutoriels en ligne seront ensuite mis à disposition des étudiants et pourront être suivis. Ces tutoriels expliquent la mise en place du pipeline d'analyse bioinformatique ainsi que l'utilité des différentes analyses bioinformatiques à réaliser. Les étudiants devront choisir les analyses les plus pertinentes.
Sur base de ces tutoriels et de recherches personnelles, les étudiants vont mettre en place leur pipeline d'analyse bioinformatique leur permettant d'interpréter les données brutes reçues. Tout au long du développement, les étudiants seront coachés par l'enseignant via des réunions régulières permettant de faire le point, de guider les développements et de résoudre les problèmes rencontrés.
La mise en place du pipeline d'analyse est individuelle mais les étudiants sont également invités à collaborer entre eux (peer learning)
Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
L'enseignement se fera dans une salle avec des ordinateurs. Tout d'abord l'enseignant présentera les notions théoriques. Ensuite, les étudiants analyseront des jeux de données réelles avec des logiciels communément utilisés. Si les conditions l'exigent, les séances en présentiel seront remplacées par des cours sur blackboard collaborate, ainsi que des documents décrivant les analyses à réaliser.
Pour le rôle de Kristel Van Steen, les étudiants seront confrontés à des études de cas tirées de la propre expertise du tuteur et de la littérature. Ces études de cas seront discutées en classe et ont pour objectif principal d'améliorer la compréhension des concepts pertinents et de mieux faire connaître les éléments importants de la recherche en génétique complexe.
Mode d'enseignement (présentiel, à distance, hybride)
- Présentiel: séance d'introduction et coaching reguliers
- A distance: tutoriels on-line et travail personnel sur le projet
L'enseignement se fera en présentiel (parties théoriques) et sous la forme de travaux personnels avec corrections et commentaires des enseignants. Si les conditions l'exigent, les séances en présentiel seront remplacées par des cours sur blackboard collaborate ainsi que des documents décrivant les analyses à réaliser.
Supports de cours, lectures obligatoires ou recommandées
Sélection de tutoriels vidéo à partir de cette chaine: https://www.youtube.com/channel/UC7QH-fgE50r2mDnkm88fzMg
Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
Les enseignants donneront un pdf de leur présentation (type powerpoint) et également des chapitres comprenant les éléments théoriques vus. Pour les applications, des pdf montrant la résolution des applications seront aussi disponibles. D'éventuelles lectures seront recommandées et partagées lors du cours.
Modalités d'évaluation et critères
Toutes sessions confondues :
- En présentiel
évaluation orale
- En distanciel
évaluation orale
- Si évaluation en "hybride"
préférence en présentiel
Explications complémentaires:
Les résultats du projet correspondront à l'évaluation.
Plus spécifiquement, la note correspondra à la moyenne entre la documentation du pipeline mis en place (partie documentation bioinformatique) et le rapport d'analyse (traduction des résultats d'analyse bioinformatique en information utilisables par un biologiste).
Un document pdf devra être fourni pour la partie documentation (5 pages maximum) et les résultats seront présentés sous la forme d'un powerpoint (de 6 slides maximum)
Pour la seconde partie, l'évaluation se fera sous la forme d'un examen oral.
Partie 'Applications en génétique et génomique quantitative'
L'évaluation se fera sous la forme d'un examen oral (si les conditions le permettent). Les étudiantes et les étudiants devront pouvoir présenter tous les exercices ou applications vues durant le cours. Une liste de ces applications leur sera fournie à l'avance. Pour chacune d'entre elles, les étudiantes et les étudiants devront comprendre les concepts théoriques associés, montrer qu'ils ont réalisé eux-mêmes l'analyse de l'application, montrer les résultats sous une forme personnalisée (graphique et image personnelle par exemple) et, enfin, pouvoir interpréter et expliquer les résultats. Chaque étudiant sera interrogé sur une application tirée au hasard.
Stage(s)
Remarques organisationnelles et modifications principales apportées au cours
Contacts
Analyse de communautés microbiennes à partir de séquences d'ADN: Prof. Sébastien Massart et Mr. Gilles Stouvenakers
Partie 'Applications en génétique et génomique quantitative': Prof. Frédéric Farnir et Dr. Tom Druet
Partie 'Génomique complexe et systémique': Prof Kristel Van Steen