Durée
Nombre de crédits
Master en management de l'innovation et de la conception des aliments, à finalité | 2 crédits |
Enseignant
Langue(s) de l'unité d'enseignement
Langue française
Organisation et évaluation
Enseignement au premier quadrimestre, examen en janvier
Horaire
Unités d'enseignement prérequises et corequises
Les unités prérequises ou corequises sont présentées au sein de chaque programme
Contenus de l'unité d'enseignement
Ce cours reprend dans un premier temps les bases de la statistique avant d'explorer des techniques d'analyses propres aux données multivariées.
La première partie de ce cours a pour objectif une approche concrète des notions statistiques les plus courantes, point de départ de toute analyse de données. Plus précisément, seront étudiés les chapitres suivants :
A. Statistiques descriptives : paramètres de tendance centrale et de dispersion. Quartiles.
Visualisation des données : barplots, histogrammes, boxplots, mosaicplot, etc.
Régression linéaire (droite des moindres carrés) et paramètre d'adéquation de cette approximation linéaire.
B. Intervalle de confiance (IC) d'un estimateur (proportion, moyenne, etc.).
C. Tests d'hypothèses
C.1. risque alpha, bêta, niveau de confiance, puissance d'un test, test unilatéral, test bilatéral
C.2. Test du X² : test d'indépendance
C.3. Comparaison de deux moyennes (variance connue ou estimée) : Test de Student
C.4. Comparaison de deux moyennes issues de "gros" échantillons : hypothèse de normalité
C.5. Comparaison de deux proportions : Approximation normale - Test de Fisher - Test de Mc Nemar
C.6. Comparaison de plusieurs moyennes : ANOVA à 1 facteur / ANOVA à 2 facteurs (+ Diagrammes d'interaction)
C.7. Test de normalité d'une v.a. / Test d'homogénéité des variances (BARTLETT, LEVENE)
C.8. Tests non-paramétriques tels que : Mann-Whitney, Wilcoxon, Kruskal-Wallis, test exact de Fisher, test de Mc Nemar, Corrélation des rangs
Suite à cette première partie, seront étudiées les techniques d'analyses multivariées suivantes :
D. Analyse multivariée : arborescence, arbre de décision, dendrogramme, clustering, analyse factorielle, analyse en composantes principales, régression linéaire multivariée, modèle linéaire généralisé, analyse des correspondances, analyse des correspondances multiples.
Exploration d'outls graphiques (du logiciel R) permettant de visualiser les données multi-variées.
Logiciel "R" : FAIRE des statistiques nécessite l'usage d'un logiciel spécialisé pour produire graphiques et analyses. Le logiciel "R" retenu dans ce cours est à la fois performant et gratuit.
Ce cours fera continuement le lien entre les notions étudiées et leur mise en oeuvre en "R". Cette approche résolument pratique vise à illustrer la théorie et la rendre opérationnelle.
EXERCICES/TP
Les notes du cours théorique contiennent de nombreux exercices variés dont certains sont résolus en classe.
De plus, les étudiants reçoivent un document reprenant des exercices complémentaires de synthèse. Une majorité de ces exercices renvoient à des bases de données mises à disposition des étudiants. Certains exercices sont résolus pendant les séances théoriques ou durant les séances pratiques sur ordinateur, d'autres sont proposés à titre complémentaire.
Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement
- Connaître les méthodes de calcul de la statistique descriptive et de l'inférence statistique. Analyser et représenter des données multi-variées.
- Etudes de cas. Choisir la ou les méthode(s) pertinente(s) et appliquer ces méthodes à des cas concrets (p. ex. TFE)
- Discuter les avantages, inconvénients et la pertinence des tests choisis
- Evaluer la pertinence des résultats et pouvoir les commenter (les critiquer)
- Utiliser le logiciel R
Savoirs et compétences prérequis
- Maîtrise de Windows et des commandes basiques d'un ordinateur (gestion des fichiers, etc.)
- Pré-requis mathématiques : Vecteurs. Matrices - Dérivée d'une fonction - Fonctions exponentielle et logarithmique - Intégration - Analyse combinatoire
Activités d'apprentissage prévues et méthodes d'enseignement
Résolution de problèmes statistiques et études de cas concrets.
Exercices, applications : études et analyses de bases de données variées.
TP sur ordinateur avec le logiciel R. S'il le désire, l'étudiant pourra installer le logiciel R sur son propre PC.
Les informations livrées durant le cours sont tout aussi importantes que celles figurant sur les notes. Les notes ne résument pas toute l'information utile aux examens.
Des notes en format PDF sont mises transmises aux étudiants.
Au fur et à mesure de l'avancée dans ces notes de cours, l'étudiant mettra en pratique les notions abordées grâce au logiciel R. La résolution des exercices se fera aussi avec R. Ceci favorisera une familiarisation progressive avec ce logiciel.
Mode d'enseignement (présentiel, à distance, hybride)
Cours donné exclusivement en présentiel
Lectures recommandées ou obligatoires et notes de cours
Modalités d'évaluation et critères
Examen(s) en session
Toutes sessions confondues
- En présentiel
évaluation écrite ( questions ouvertes )
Explications complémentaires:
Etude de cas concrets sur ordinateur à l'aide du logiciel R.
Examen écrit. Il s'agira d'analyser et résoudre des cas concrets effectuée à l'aide du logiciel R.
L'étudiant choisira la méthode la plus appropriée pour l'étude d'une base de données. L'étudiant devra justifier clairement et complètement la méthode choisie et commenter avec pertinence les codes R ainsi qu'expliquer les résultats obtenus. Il s'agira de montrer sa compréhension des concepts mis en pratique dans cette étude.
L'étudiant justifiera ses méthodes d'analyse et commentera clairement les résultats obtenus par le logiciel R. Il fera preuve d'une approche critique sur la pertinence de sa démarche et des résultats.
Stage(s)
Remarques organisationnelles et modifications principales apportées au cours
Contacts
mail HECh : r.milano@hech.be
mail ULG : robert.milano@uliege.be