Data Science Tutoriels

La Data Science propose un programme complet pour les aspirants data scientists et analystes. Nos tutoriels couvrent l'analyse statistique, l'apprentissage automatique et la visualisation des données, adaptés aux débutants comme aux apprenants intermédiaires. Grâce à des laboratoires interactifs et des exercices de codage pratiques, vous acquerrez une expérience concrète avec des ensembles de données réels. Notre terrain de jeu en Data Science vous permet d'appliquer vos compétences dans un environnement en ligne dynamique.

Diffusion NumPy pour des calculs efficaces

Diffusion NumPy pour des calculs efficaces

La diffusion (broadcasting) est une fonctionnalité puissante de NumPy qui permet d'utiliser des tableaux de formes différentes dans des opérations arithmétiques. Elle offre un moyen de vectoriser les opérations sur les tableaux et d'améliorer l'efficacité des calculs. Ce laboratoire vous guidera à travers les bases de la diffusion dans NumPy.

Introduction et configuration de Pandas

Introduction et configuration de Pandas

Dans ce laboratoire, vous débuterez avec Pandas, une puissante bibliothèque d'analyse de données en Python. Vous apprendrez à vérifier son installation, à l'importer, à créer une Series de base, à accéder à ses éléments et à inspecter ses propriétés.

Fondamentaux de la manipulation des tableaux NumPy

Fondamentaux de la manipulation des tableaux NumPy

Dans ce laboratoire, vous apprendrez les bases du travail avec les tableaux NumPy. NumPy est une bibliothèque puissante pour le calcul numérique en Python. Elle fournit des structures de données et des fonctions efficaces pour effectuer des opérations mathématiques sur les tableaux.

Tri de données avec Pandas

Tri de données avec Pandas

Dans ce laboratoire, vous apprendrez les techniques essentielles pour trier des données dans un DataFrame Pandas. Vous explorerez le tri par colonnes uniques et multiples, le contrôle de l'ordre de tri et la gestion de l'index du DataFrame après les opérations de tri.

Regroupement et Agrégation avec Pandas

Regroupement et Agrégation avec Pandas

Dans ce laboratoire, vous apprendrez les bases du regroupement et de l'agrégation de données à l'aide de la bibliothèque Pandas. Vous pratiquerez l'utilisation de groupby() pour créer des groupes et appliquer diverses fonctions d'agrégation.

Nettoyage de données de base avec Pandas

Nettoyage de données de base avec Pandas

Dans ce laboratoire, vous apprendrez les techniques fondamentales de nettoyage de données à l'aide de la bibliothèque Pandas, notamment la gestion des valeurs manquantes, la suppression des doublons et la correction des types de données.

Pandas : Lecture de données externes

Pandas : Lecture de données externes

Dans ce laboratoire, vous apprendrez les bases de la lecture de données externes dans un DataFrame Pandas. Vous utiliserez la puissante fonction `read_csv` et ses paramètres clés pour gérer divers formats de fichiers CSV du monde réel.

Installation et configuration de Scikit-learn

Installation et configuration de Scikit-learn

Dans ce laboratoire, vous apprendrez à vérifier votre installation de scikit-learn, à importer les modules nécessaires et à charger un jeu de données d'exemple pour débuter avec l'apprentissage automatique en Python.

Prétraitement des données avec Scikit-learn

Prétraitement des données avec Scikit-learn

Dans ce laboratoire, vous apprendrez les techniques fondamentales de prétraitement des données dans scikit-learn, y compris la mise à l'échelle des caractéristiques avec StandardScaler et l'encodage de la cible avec LabelEncoder, en utilisant le jeu de données classique Iris.

Création de DataFrames Pandas

Création de DataFrames Pandas

Dans ce laboratoire, vous apprendrez les méthodes fondamentales pour créer des DataFrames Pandas, y compris à partir de dictionnaires, et comment personnaliser leurs colonnes et leurs index.

Statistiques Descriptives Pandas

Statistiques Descriptives Pandas

Dans ce laboratoire, vous apprendrez à calculer diverses statistiques descriptives pour un DataFrame Pandas, notamment la moyenne, la médiane, le min/max, et plus encore.

Introduction aux Fonctions Universelles NumPy

Introduction aux Fonctions Universelles NumPy

Dans ce laboratoire, nous allons explorer les bases des Fonctions Universelles (ufuncs) de NumPy. Les ufuncs sont des fonctions qui opèrent sur les ndarrays de manière élément par élément, prenant en charge le broadcasting de tableaux, le transtypage (type casting) et d'autres fonctionnalités standard. Nous apprendrons les différentes méthodes des ufuncs, les règles de broadcasting, les règles de transtypage et comment substituer le comportement des ufuncs.

Tableaux Structurés dans NumPy

Tableaux Structurés dans NumPy

Dans ce laboratoire, nous allons découvrir les tableaux structurés dans NumPy. Les tableaux structurés sont des ndarrays dont le type de données est une composition de types de données plus simples organisés en une séquence de champs nommés. Ils sont utiles pour travailler avec des données structurées, telles que des données tabulaires, où chaque champ représente un attribut différent des données.

Sélection de données Pandas

Sélection de données Pandas

Dans ce laboratoire, vous apprendrez les techniques fondamentales pour sélectionner et sous-échantillonner des données à partir de DataFrames Pandas, y compris la sélection de colonnes, de lignes et de tranches de données spécifiques.

Création de sous-graphiques Matplotlib

Création de sous-graphiques Matplotlib

Dans ce laboratoire, vous apprendrez à créer et personnaliser plusieurs sous-graphiques dans une seule figure en utilisant Matplotlib, une bibliothèque de traçage puissante en Python. Vous pratiquerez la création de sous-graphiques, le traçage de données sur ceux-ci et l'ajustement des mises en page.

Chargement et exploration de données avec Scikit-learn

Chargement et exploration de données avec Scikit-learn

Dans ce laboratoire, vous apprendrez les bases du chargement et de l'exploration de jeux de données dans scikit-learn en utilisant le jeu de données classique Iris. Vous pratiquerez l'accès aux données, aux cibles et aux noms des caractéristiques, et effectuerez une visualisation simple.

Classification KNN avec Scikit-learn

Classification KNN avec Scikit-learn

Dans ce laboratoire, vous apprendrez à utiliser scikit-learn pour construire un classificateur K-Nearest Neighbors (KNN), l'entraîner sur l'ensemble de données Iris et faire des prédictions sur de nouvelles données.

Validation Croisée avec Scikit-learn

Validation Croisée avec Scikit-learn

Dans ce laboratoire, vous apprendrez à effectuer une validation croisée avec scikit-learn pour évaluer plus robustement la performance d'un modèle d'apprentissage automatique.

Précédent
1
2
3
4
5
6
...
165
Suivant