Ce cours introduit les bases de pandas, la librairie de manipulation de données tabulaires de python.
Outre des notions élémentaires d'informatique, être à l'aise avec les bases du langage python va s'avérer essentiel.
- Installer python (verion 3.5+ recommandée)
Selon votre système et votre aisance, l'utilisation d'Anaconda peut être une alternative valide ou bien l'utilisation d'un inotebook Jupyter.
- Installer les paquets nécessaires
- installer pandas (
pip3 install pandas
) - installer numpy (
pip3 install numpy
) - installer matplotlib (
pip3 install matplotlib
) - installer scikit-learn (
pip3 install sklearn
)
- Préparer son environnement de travail
Créez vos répertoires pour organiser les fichiers qui seront utilisés et créés lors du cours. N'hésite pas non plus à vous construire un lexique des fonctions utilisées.
- Être curieux et ne pas avoir peur d'essayer et de se tromper!
- La documentation de pandas est l'endroit idéal pour trouver les informations complémentaires sur les paramètres des fonctions et méthodes.
- Le site de la librairie matplotlib propose de nombreux exemples et une documentation complète sur les fonctionnalités disponibles.
- La même remarque est valable pour le site de la librairie scikit-learn.
- La structure de la partie pandas de ce cours a été très influencée par le cours pandas proposé sur le site Kaggle.