INFO0955-1

Durée

20h Th, 50h TD

Nombre de crédits

	Master en bioinformatique et modélisation, à finalité	8 crédits

Enseignant

Tom Druet, Frédéric Farnir, Sébastien Massart, Kristel Van Steen

Coordinateur(s)

Sébastien Massart

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au deuxième quadrimestre

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Face à la croissance exponentielle de la quantité de données générées dans les sciences de la vie, la bioinformatique occupe maintenant une place centrale dans la recherche et le développement, y compris en agronomie.
L'objectif de ce cours est de développer la capacité d'analyse, l'aptitude à sélectionner et appliquer les algorithmes pertinents par rapport à une question scientifique et l'abilité à expliquer les opérations réalisées et les résultats obtenus auprès de biologistes "non bioinformaticiens". En bref, il s'agit surtout d'apprendre à décoder les besoins exprimés et les questions scientifiques posées de manière à appliquer les codes informatiques les plus pertinents.
Ce cours est basé sur l'apprentissage par projet ou par l'action. A partir d'un problème scientique et de données de séquençage haut-débit, les étudiants devront mettre en place et utiliser un pipeline d'analyse de données. La question scientifique posée visera à comparer les communautés microbiennes présentes dans différents échantillons. Voici un tutoriel d'introduction à cette thématique: https://www.youtube.com/watch?v=6564K4-_DBI
Après une introduction théorique et la mise en contexte du projet, les étudiants recevront des données de séquençage haut-débit de communautés microbiennes ainsi que l'objectif poursuivi pour l'analyse des données.
L'ensemble du cours, orienté développement d'un projet, sera centré sur la sélection, l'application et la documentation d'un pipeline bioinformatique utilisant la suite logiciel QIIME (sous linux, une boite virtuelle sera créée par les étudiants ne travaillant pas sous Linux). Des tutoriels vidéos seront disponibles pour guider les étudiants dans leur démarche et des entretiens avec l'équipe enseignante permettront de guider les étudiants dans leur démarche.
Partie 'Applications en génétique et génomique quantitative; Génomique complexe et systémique':

La seconde partie enseignée par Frédéric Farnir et Tom Druet s'intéresse à des applications en génétique ou génomique quantitative. Le développement des technologies de génotypages et de reséquençage des génomes ont ouvert la voie à de nombreuses études dans les domaines de la génétique des populations ou de la génétique quantitative. Il est possible d'étudier tant les populations d'intérêt agronomique, les organismes modèles que les populations sauvages. Dans cette partie, nous ferons des analyses génomiques sur des données réelles. Ces analyses illustreront l'identification de la structure des populations, les techniques d'haplotypage et d'imputation de génotypes manquants, l'estimation des relations de parenté et du coefficient de consanguinité, l'identification de QTL et éventuellement les études d'associations ou l'identification de variants associés à des maladies récessives. Cette partie sera organisée en huit séances de 4h avec une première partie présentant les aspects théoriques suivie d'applications sur ordinateur avec des logiciels fréquemment utilisés. Si les conditions l'exigent, les séances en présentiel seront remplacées par des cours sur blackboard collaborate, ainsi que des documents décrivant les analyses à réaliser.

La partie enseignée par Kristel Van Steen présente les composants de la génétique complexe et met en évidence les avantages et les inconvénients des approches de la génétique des systèmes dans le contexte de la santé publique et de la médecine personnalisée.

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

Les acquis d'apprentissage sont les suivants:

Capacité à mettre en place un pipeline d'analyse bioinformatique de données de séquençage haut-débit en fonction des questions biologiques posées (transposer une question biologique en analyse bioinformatique utilisant les outils appropriés)
Aptitude à analyser de manière critique un pipeline bioinformatique
Capacité à extraire l'information biologique importante à partir de données brutes
Développer la capacité d'interprétation qualitative et quantitative du "big data"

Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
Pour la seconde partie, les acquis d'apprentissage sont :

L'acquisition de nouvelles connaissances théoriques en génétique quantitative et génétique des populations telles que les notions de parenté, les modèles pour les études d'association, etc. ;
L'apprentissage de techniques de modélisation de données génomiques de grande taille;
La connaissance de logiciels de génétique et la capacité à interpréter les sorties de ces logiciels ;
Une culture générale des techniques actuellement utilisées en génomique pour l'étude des populations et des caractères complexes.
Connaissance d'importants concepts et voies d'analyse en génétique des systèmes pour les maladies complexes et en science translationnelle

Savoirs et compétences prérequis

Une bonne connaissance de la biologie moléculaire et des techniques associées (PCR, séquençage,...) est nécessaire.
Une connaissance poussée en bioinformatique ou en language de programmation n'est pas indispensable.

Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
Pour la seconde partie les étudiants devront avoir d'une part des connaissances de base en génétique quantitative, génétique des populations et en statistiques et d'autre part pouvoir travailler sous linux et avec R.

Activités d'apprentissage prévues et méthodes d'enseignement

Le cours se développe selon le principe de la classe inversée et de l'apprentissage par l'action. Une introduction générale sera donnée ex-cathedra. Cette introduction permettra d'expliquer le contexte, les objectifs, les modalités d'apprentissage et l'évaluation de ce cours.
Les données brutes à analyser seront également transférées aux étudiants
Des tutoriels en ligne seront ensuite mis à disposition des étudiants et pourront être suivis. Ces tutoriels expliquent la mise en place du pipeline d'analyse bioinformatique ainsi que l'utilité des différentes analyses bioinformatiques à réaliser. Les étudiants devront choisir les analyses les plus pertinentes.
Sur base de ces tutoriels et de recherches personnelles, les étudiants vont mettre en place leur pipeline d'analyse bioinformatique leur permettant d'interpréter les données brutes reçues. Tout au long du développement, les étudiants seront coachés par l'enseignant via des réunions régulières permettant de faire le point, de guider les développements et de résoudre les problèmes rencontrés.
La mise en place du pipeline d'analyse est individuelle mais les étudiants sont également invités à collaborer entre eux (peer learning)
Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
L'enseignement se fera dans une salle avec des ordinateurs. Tout d'abord l'enseignant présentera les notions théoriques. Ensuite, les étudiants analyseront des jeux de données réelles avec des logiciels communément utilisés. Si les conditions l'exigent, les séances en présentiel seront remplacées par des cours sur blackboard collaborate, ainsi que des documents décrivant les analyses à réaliser.
Pour le rôle de Kristel Van Steen, les étudiants seront confrontés à des études de cas tirées de la propre expertise du tuteur et de la littérature. Ces études de cas seront discutées en classe et ont pour objectif principal d'améliorer la compréhension des concepts pertinents et de mieux faire connaître les éléments importants de la recherche en génétique complexe.

Mode d'enseignement (présentiel, à distance, hybride)

Présentiel: séance d'introduction et coaching reguliers
A distance: tutoriels on-line et travail personnel sur le projet

Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
L'enseignement se fera en présentiel (parties théoriques) et sous la forme de travaux personnels avec corrections et commentaires des enseignants. Si les conditions l'exigent, les séances en présentiel seront remplacées par des cours sur blackboard collaborate ainsi que des documents décrivant les analyses à réaliser.

Lectures recommandées ou obligatoires et notes de cours

Sélection de tutoriels vidéo à partir de cette chaine: https://www.youtube.com/channel/UC7QH-fgE50r2mDnkm88fzMg
Partie 'Applications en génétique et génomique quantitative'; Génomique complexe et systémique':
Les enseignants donneront un pdf de leur présentation (type powerpoint) et également des chapitres comprenant les éléments théoriques vus. Pour les applications, des pdf montrant la résolution des applications seront aussi disponibles. D'éventuelles lectures seront recommandées et partagées lors du cours.

Modalités d'évaluation et critères

Toutes sessions confondues :

- En présentiel

évaluation orale

- En distanciel

évaluation orale

- Si évaluation en "hybride"

préférence en présentiel

Explications complémentaires:

Les résultats du projet correspondront à l'évaluation.
Plus spécifiquement, la note correspondra à la moyenne entre la documentation du pipeline mis en place (partie documentation bioinformatique) et le rapport d'analyse (traduction des résultats d'analyse bioinformatique en information utilisables par un biologiste).
Un document pdf devra être fourni pour la partie documentation (5 pages maximum) et les résultats seront présentés sous la forme d'un powerpoint (de 6 slides maximum)
Pour la seconde partie, l'évaluation se fera sous la forme d'un examen oral.

Partie 'Applications en génétique et génomique quantitative'
L'évaluation se fera sous la forme d'un examen oral (si les conditions le permettent). Les étudiantes et les étudiants devront pouvoir présenter tous les exercices ou applications vues durant le cours. Une liste de ces applications leur sera fournie à l'avance. Pour chacune d'entre elles, les étudiantes et les étudiants devront comprendre les concepts théoriques associés, montrer qu'ils ont réalisé eux-mêmes l'analyse de l'application, montrer les résultats sous une forme personnalisée (graphique et image personnelle par exemple) et, enfin, pouvoir interpréter et expliquer les résultats. Chaque étudiant sera interrogé sur une application tirée au hasard.

Stage(s)

Remarques organisationnelles et modifications principales apportées au cours

Contacts

Analyse de communautés microbiennes à partir de séquences d'ADN: Prof. Sébastien Massart et Mr. Gilles Stouvenakers
Partie 'Applications en génétique et génomique quantitative': Prof. Frédéric Farnir et Dr. Tom Druet
Partie 'Génomique complexe et systémique': Prof Kristel Van Steen

Nom	Provider / Domaine	Expiration	Description
JSESSIONID	Oracle Corporation www.uliege.be	Session	Cookie de session de plate-forme à usage général, utilisé par les sites écrits en JSP. Habituellement utilisé pour maintenir une session utilisateur anonyme par le serveur.
CookieScriptConsent	CookieScript .uliege.be	1 an	Ce cookie est utilisé par le service Cookie-Script.com pour mémoriser les préférences de consentement des visiteurs en matière de cookies. Il est nécessaire pour que la bannière de cookies Cookie-Script.com fonctionne correctement.
jcms.prefs	www.uliege.be	Session	Permet de conserver des préférences de l’utilisateur (onglet ouvert, par exemple).

Nom	Provider / Domaine	Expiration	Description
_pk_id	InnoCraft Ltd .uliege.be	1 an	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_id est suivi d'une courte série de chiffres et de lettres, qui est censé être un code de référence pour le domaine définissant le cookie.
_pk_ses	InnoCraft Ltd .uliege.be	30 minutes	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ses est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.
_pk_ref	InnoCraft Ltd .uliege.be	6 mois	Ce nom de cookie est associé à la plateforme d'analyse Web open source Matomo. Il est utilisé pour aider les propriétaires de sites Web à suivre le comportement des visiteurs et à mesurer les performances du site. Il s'agit d'un cookie de type modèle, où le préfixe _pk_ref est suivi d'une courte série de chiffres et de lettres, ce qui est considéré comme un code de référence pour le domaine définissant le cookie.

Bioinformatics applications: Case studies in veterinary sciences, agronomical sciences and systems medicine