INFO8009-1

Durée

9h Th, 9h Pr

Nombre de crédits

	Master : bioingénieur en sciences agronomiques, à finalité spécialisée	2 crédits

Enseignant

Sébastien Massart, Martine Schroyen

Coordinateur(s)

Sébastien Massart

Langue(s) de l'unité d'enseignement

Langue française

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Langues

Langue française et anglaise

Contenus

Face à la croissance exponentielle de la quantité de données générées dans les sciences de la vie, le bioingénieur doit pouvoir apprivoiser et comprendre la bioinformatique et son importance dans la recherche du futur. L'objectif de ce cours est d'introduire les étudiants à la bioinformatique via l'apprentissage par l'action.

Dans une première partie, ils apprennent de mettre en place et d'utiliser un pipeline d'analyse de données de séquençage haut-débit permettant d'étudier et de comparer les communautés microbiennes présentes dans différents échantillons. Voici un tutoriel d'introduction à cette thématique: https://www.youtube.com/watch?v=6564K4-_DBI. Après une introduction théorique (1h), les étudiants recevront des données de séquençage haut-débit de communautés microbiennes ainsi que l'objectif poursuivi pour l'analyse des données (question biologique). L'ensemble du cours, orienté développement d'un projet, sera centré sur la sélection, l'application et la documentation d'un pipeline bioinformatique utilisant QIIME2 en suivant un tutoriel pas à pas. Un coaching au fil du projet et des tutoriels vidéos seront disponibles pour guider les étudiants dans leur démarche.

Dans une seconde partie, les étudiants apprennent comment on réalise le séquençage haut-débit de l'ARN, qu'est-ce que c'est la signification de l'expression différentielle et comment on peut utiliser des outils de GO enrichissements pour trouver des différences biologiques entre deux ou plusieurs conditions expérimentales. De plus, ils doivent eux-mêmes travailler avec le paquet WGCNA en utilisant le tutoriel en ligne: https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/. Comme dans la première partie, une introduction théorique est suivie d'une formation pratique sur les données de séquençage de l'ARN. Le logiciel qu'on utilisera sera R studio.

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

Les acquis d'apprentissage sont les suivants :

Capacité à comprendre et appliquer un pipeline d'analyse bioinformatique de données de séquençage haut-débit en fonction des questions biologiques posées (transposer une question biologique en analyse bioinformatique utilisant les outils appropriés)
Aptitude à analyser de manière critique un pipeline bioinformatique
Capacité à extraire l'information biologique importante à partir de données brutes
Développer la capacité d'interprétation qualitative et quantitative du "big data"

Savoirs et compétences prérequis

Une bonne connaissance de la biologie moléculaire et des techniques associées (PCR, séquençage,...) est nécessaire.
Une connaissance en bioinformatique ou en language de programmation n'est pas nécessaire. Le cours est une introduction à la bioinformatique et ne nécessite pas de connaissance préalable sur la programmation.

Activités d'apprentissage prévues et méthodes d'enseignement

Le cours se développe selon le principe de la classe inversée et de l'apprentissage par l'action. Une introduction générale sera donnée ex-cathedra durant 1 heure. Cette introduction permettra d'expliquer le contexte, les objectifs, les modalités d'apprentissage et l'évaluation de ce cours.
Les données brutes à analyser seront également transférées aux étudiants
Des tutoriels en ligne seront ensuite mis à disposition des étudiants et devront être suivis. Ces tutoriels expliquent la mise en place du pipeline d'analyse bioinformatique ainsi que l'utilité des différentes analyses bioinformatiques à réaliser.
Sur base de ces tutoriels et de recherches personnelles, les étudiants vont mettre en place leur pipeline d'analyse bioinformatique leur permettant d'interpréter les données brutes reçues. Tout au long du développement, les étudiants seront coachés par l'enseignant via des réunions régulières permettant de faire le point, de guider les développements et de résoudre les problèmes rencontrés.
La mise en place du pipeline d'analyse est individuelle mais les étudiants sont également invités à collaborer entre eux (peer learning)

Mode d'enseignement (présentiel, à distance, hybride)

Combinaison d'activités d'apprentissage en présentiel et en distanciel

Explications complémentaires:

Pour les deux parties :

Présentiel : 1.5heure d'introduction et coaching réguliers
A distance : tutoriels on-line et travail personnel sur le projet

Supports de cours, lectures obligatoires ou recommandées

Sélection de tutoriels vidéo à partir de cette chaine: https://www.youtube.com/channel/UC7QH-fgE50r2mDnkm88fzMg (partie 1) et des infos en ligne pour démarrer avec le paquet WGCNA sur : https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA (partie 2).

Modalités d'évaluation et critères

Travail à rendre - rapport

Explications complémentaires:

Les résultats du projet correspondront à l'évaluation. Plus spécifiquement, la note correspondra à la moyenne entre la documentation du pipeline mis en place (partie documentation bioinformatique) et le rapport d'analyse (traduction des résultats d'analyse bioinformatique en information utilisables par un biologiste). Un document pdf devra être fourni pour la partie documentation (5 pages maximum) et les résultats seront présentés sous la forme d'un powerpoint (de 6 slides maximum).
Pour la seconde partie, nous demandons un rapport d'analyse sur les données de séquençage de l'ARN, soit fourni par l'enseignant, soit sur des propres données si présent (5 pages maximum).

Stage(s)

Remarques organisationnelles et modifications principales apportées au cours

Contacts

Analyse de communautés microbiennes à partir de séquences d'ADN : Prof. Sébastien Massart.

Analyse WGCNA à partir d'une matrice d'expression normalisée : Prof. Martine Schroyen.

Nom	Provider / Domaine	Expiration	Description
JSESSIONID	Oracle Corporation www.uliege.be	Session	Cookie de session de plate-forme à usage général, utilisé par les sites écrits en JSP. Habituellement utilisé pour maintenir une session utilisateur anonyme par le serveur.
CookieScriptConsent	CookieScript .uliege.be	1 an	Ce cookie est utilisé par le service Cookie-Script.com pour mémoriser les préférences de consentement des visiteurs en matière de cookies. Il est nécessaire pour que la bannière de cookies Cookie-Script.com fonctionne correctement.
jcms.prefs	www.uliege.be	Session	Permet de conserver des préférences de l’utilisateur (onglet ouvert, par exemple).

Nom	Provider / Domaine	Expiration	Description
_pk_id	InnoCraft Ltd .uliege.be	1 an	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_id est suivi d'une courte série de chiffres et de lettres, qui est censé être un code de référence pour le domaine définissant le cookie.
_pk_ses	InnoCraft Ltd .uliege.be	30 minutes	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ses est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.
_pk_ref	InnoCraft Ltd .uliege.be	6 mois	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ref est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.

Bioinformatique