Cours « science des données » à Mines Paris (2024).
Organisation de ce repo
environment.yml
permet de charger l'environnement conda pour les notebooks via l'interface graphique d'Anaconda ou
conda env create -f environment.yml -n sdd2024
conda activate sdd2024
Notez que cet environnement vous fait utiliser JupyterLab et non pas Jupyter Notebook. JupyterLab est plus moderne et plus agréable d'utilisation (voir la documentation). En particulier, JupyterLab permet de copier des cellules entre notebooks, et l'extension "Table of contents" qui facilite la navigation dans un notebook y est native.
poly/
contient tous les fichiers permettant de compiler le poly. La dernière version compilée à jour s'intitulesdd_2024_poly.pdf
pc/
contient un répertoire par PCprojet/
contient les données et instructions relatives au projet numériqueslides/
contient les supports des amphis 4 (Thibault Faney), 7 (Chloé-Agathe Azencott) et 9 (Thibault Faney)
Équipe pédagogique
- Responsables de cours : Chloé-Agathe Azencott et Bruno Figliuzzi
- Chargé·e·s d'enseignement : Julie Cartier, Théo Dumont, Paul Etheimer, Thibault Faney, Daniel Mimouni, Mathieu Molina et Corbinian Schlosser.
Emploi du temps
-
vendredi 7/06 :
- 09h00-10h30 : amphi 1 — Introduction et statistique descriptive (Chapitres 1 & 2)
- 10h45-12h15 : amphi 2 — Estimation et propriétés d'un estimateur (Chapitre 3, sections 3.1 à 3.4)
-
lundi 10/06 :
- 09h00-10h30 : amphi 3 — Techniques d'estimation (Chapitre 3, sections 3.5 & 3.6)
- 10h45-12h15 : amphi 4 — PC 1 — Statistique inférentielle (TD)
-
vendredi 14/06 :
- 09h00-10h30 : amphi 4 — Réduction de dimension (Chapitre 4)
- 10h45-12h15 : PC 2 — Réduction de dimension (TP)
-
lundi 17/06 :
- 09h00-10h30 : amphi 5 — Introduction à l'apprentissage supervisé (Chapitre 6)
- 10h45-12h15 : Mini-projet numérique (1)
-
vendredi 21/06 :
- 09h00-10h30 : PC 3 — Pré-traitement & introduction à scikit-learn pour l'apprentissage supervisé
- 10h45-12h15 : amphi 6 — Généralisation (Chapitre 7)
-
lundi 24/06 :
- 09h00-10h30 : PC 4 — Sélection de modèles (TP)
- 10h45-12h15 : amphi 7 — Modèles linéaires pour la classification (Chapitre 7)
-
vendredi 28/06 :
- 09h00-10h30 : PC 5 — Modèles linéaires pour la classification (TD)
- 10h45-12h15 : amphi 8 — Modèles d'apprentissage supervisé non-linéaires (Chapitre 8)
-
lundi 1/07 :
- 09h00-10h30 : amphi 9 — Séance d'ouverture
- 10h45-12h15 : Mini-projet numérique (2)
-
vendredi 5/07 9h-12h : examen écrit et rendu de projet numérique.
Modalités d'évaluation
- mini-projet numérique à réaliser en binôme. Deux séances de PC y sont dévouées (le 17/06 et le 1/07). À rendre le 5/07 (30%).
- examen sur table avec documents autorisés le 5/07 (70%).
Pour contribuer à ce repo
Ce repo contient un script pre-commit.sh
qui permet de le nettoyer (supprimer les fichiers auxiliaires de latex, nettoyer les notebooks avec nbstripout
).
Il est possible de lancer automatiquement ce script lors d'un git commit
grâce à un hook
. Pour cela, il suffit de le copier dans le fichier .git/hooks/pre-commit
ou d'utiliser un lien symbolique (pour conserver le contrôle de version) :
cd .git/hooks/
ln -s ../../pre-commit.sh pre-commit