2024-2025 / INFO8009-1

Bioinformatique

Durée

9h Th, 9h Pr

Nombre de crédits

 Master : bioingénieur en sciences agronomiques, à finalité spécialisée2 crédits 

Enseignant

Sébastien Massart, Martine Schroyen

Coordinateur(s)

Sébastien Massart

Langue(s) de l'unité d'enseignement

Langue française

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Langues 

Langue française et anglaise

Contenus 

Face à la croissance exponentielle de la quantité de données générées dans les sciences de la vie, le bioingénieur doit pouvoir apprivoiser et comprendre la bioinformatique et son importance dans la recherche du futur. L'objectif de ce cours est d'introduire les étudiants à la bioinformatique via l'apprentissage par l'action.

Dans une première partie, ils apprennent de mettre en place et d'utiliser un pipeline d'analyse de données de séquençage haut-débit permettant d'étudier et de comparer les communautés microbiennes présentes dans différents échantillons. Voici un tutoriel d'introduction à cette thématique:  https://www.youtube.com/watch?v=6564K4-_DBI. Après une introduction théorique (1h), les étudiants recevront des données de séquençage haut-débit de communautés microbiennes ainsi que l'objectif poursuivi pour l'analyse des données (question biologique). L'ensemble du cours, orienté développement d'un projet, sera centré sur la sélection, l'application et la documentation d'un pipeline bioinformatique utilisant QIIME2 en suivant un tutoriel pas à pas. Un coaching au fil du projet et des tutoriels vidéos seront disponibles pour guider les étudiants dans leur démarche. 

Dans une seconde partie, les étudiants apprennent comment on réalise le séquençage haut-débit de l'ARN, qu'est-ce que c'est la signification de l'expression différentielle et comment on peut utiliser des outils de GO enrichissements pour trouver des différences biologiques entre deux ou plusieurs conditions expérimentales. De plus, ils doivent eux-mêmes travailler avec le paquet WGCNA en utilisant le tutoriel en ligne: https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/. Comme dans la première partie, une introduction théorique est suivie d'une formation pratique sur les données de séquençage de l'ARN. Le logiciel qu'on utilisera sera R studio.

 

 

 

 

 

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

Les acquis d'apprentissage sont les suivants :

  • Capacité à comprendre et appliquer un pipeline d'analyse bioinformatique de données de séquençage haut-débit en fonction des questions biologiques posées (transposer une question biologique en analyse bioinformatique utilisant les outils appropriés)
  • Aptitude à analyser de manière critique un pipeline bioinformatique
  • Capacité à extraire l'information biologique importante à partir de données brutes
  • Développer la capacité d'interprétation qualitative et quantitative du "big data"
 
 

Savoirs et compétences prérequis

Une bonne connaissance de la biologie moléculaire et des techniques associées (PCR, séquençage,...) est nécessaire.
Une connaissance en bioinformatique ou en language de programmation n'est pas nécessaire. Le cours est une introduction à la bioinformatique et ne nécessite pas de connaissance préalable sur la programmation.
 
 

Activités d'apprentissage prévues et méthodes d'enseignement

Le cours se développe selon le principe de la classe inversée et de l'apprentissage par l'action. Une introduction générale sera donnée ex-cathedra durant 1 heure. Cette introduction permettra d'expliquer le contexte, les objectifs, les modalités d'apprentissage et l'évaluation de ce cours.
Les données brutes à analyser seront également transférées aux étudiants
Des tutoriels en ligne seront ensuite mis à disposition des étudiants et devront être suivis. Ces tutoriels expliquent  la mise en place du pipeline d'analyse bioinformatique ainsi que l'utilité des différentes analyses bioinformatiques à réaliser.
Sur base de ces tutoriels et de recherches personnelles, les étudiants vont mettre en place leur pipeline d'analyse bioinformatique leur permettant d'interpréter les données brutes reçues. Tout au long du développement, les étudiants seront coachés par l'enseignant via des réunions régulières permettant de faire le point, de guider les développements et de résoudre les problèmes rencontrés.
La mise en place du pipeline d'analyse est individuelle mais les étudiants sont également invités à collaborer entre eux (peer learning)
 
 

Mode d'enseignement (présentiel, à distance, hybride)

Combinaison d'activités d'apprentissage en présentiel et en distanciel


Explications complémentaires:

Pour les deux parties :

  • Présentiel : 1.5heure d'introduction et coaching réguliers
  • A distance : tutoriels on-line et travail personnel sur le projet
 
 

Supports de cours, lectures obligatoires ou recommandées

Sélection de tutoriels vidéo à partir de cette chaine: https://www.youtube.com/channel/UC7QH-fgE50r2mDnkm88fzMg (partie 1) et des infos en ligne pour démarrer avec le paquet WGCNA sur : https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA (partie 2).

 

Modalités d'évaluation et critères

Travail à rendre - rapport


Explications complémentaires:

Les résultats du projet correspondront à l'évaluation. Plus spécifiquement, la note correspondra à la moyenne entre la documentation du pipeline mis en place (partie documentation bioinformatique) et le rapport d'analyse (traduction des résultats d'analyse bioinformatique en information utilisables par un biologiste). Un document pdf devra être fourni pour la partie documentation (5 pages maximum) et les résultats seront présentés sous la forme d'un powerpoint (de 6 slides maximum).
Pour la seconde partie, nous demandons un rapport d'analyse sur les données de séquençage de l'ARN, soit fourni par l'enseignant, soit sur des propres données si présent (5 pages maximum).
 
 
 

Stage(s)

Remarques organisationnelles et modifications principales apportées au cours

Contacts

Analyse de communautés microbiennes à partir de séquences d'ADN : Prof. Sébastien Massart.

Analyse WGCNA à partir d'une matrice d'expression normalisée : Prof. Martine Schroyen.

 

Association d'un ou plusieurs MOOCs