Data Science Tutoriels
La Data Science propose un programme complet pour les aspirants data scientists et analystes. Nos tutoriels couvrent l'analyse statistique, l'apprentissage automatique et la visualisation des données, adaptés aux débutants comme aux apprenants intermédiaires. Grâce à des laboratoires interactifs et des exercices de codage pratiques, vous acquerrez une expérience concrète avec des ensembles de données réels. Notre terrain de jeu en Data Science vous permet d'appliquer vos compétences dans un environnement en ligne dynamique.
Autres Arbres de Compétences
LinuxDevOpsCybersécuritéKali LinuxDevOps EngineerCybersecurity EngineerBase de donnéesScience des donnéesRed Hat Enterprise LinuxCompTIADockerFormation CKSFormation CKADFormation CKAKubernetesDevSecOpsFormation LFCSPythonGitShellNmapWiresharkHydraJavaSQLitePostgreSQLMySQLRedisMongoDBGolangC++CJenkinsAnsiblePandasNumPyscikit-learnMatplotlibDéveloppement webHTMLCSSJavaScriptReact
Diffusion NumPy pour des calculs efficaces
La diffusion (broadcasting) est une fonctionnalité puissante de NumPy qui permet d'utiliser des tableaux de formes différentes dans des opérations arithmétiques. Elle offre un moyen de vectoriser les opérations sur les tableaux et d'améliorer l'efficacité des calculs. Ce laboratoire vous guidera à travers les bases de la diffusion dans NumPy.
NumPyPython
Introduction et configuration de Pandas
Dans ce laboratoire, vous débuterez avec Pandas, une puissante bibliothèque d'analyse de données en Python. Vous apprendrez à vérifier son installation, à l'importer, à créer une Series de base, à accéder à ses éléments et à inspecter ses propriétés.
Pandas
Fondamentaux de la manipulation des tableaux NumPy
Dans ce laboratoire, vous apprendrez les bases du travail avec les tableaux NumPy. NumPy est une bibliothèque puissante pour le calcul numérique en Python. Elle fournit des structures de données et des fonctions efficaces pour effectuer des opérations mathématiques sur les tableaux.
NumPyPython
Tri de données avec Pandas
Dans ce laboratoire, vous apprendrez les techniques essentielles pour trier des données dans un DataFrame Pandas. Vous explorerez le tri par colonnes uniques et multiples, le contrôle de l'ordre de tri et la gestion de l'index du DataFrame après les opérations de tri.
Pandas
Regroupement et Agrégation avec Pandas
Dans ce laboratoire, vous apprendrez les bases du regroupement et de l'agrégation de données à l'aide de la bibliothèque Pandas. Vous pratiquerez l'utilisation de groupby() pour créer des groupes et appliquer diverses fonctions d'agrégation.
Pandas
Nettoyage de données de base avec Pandas
Dans ce laboratoire, vous apprendrez les techniques fondamentales de nettoyage de données à l'aide de la bibliothèque Pandas, notamment la gestion des valeurs manquantes, la suppression des doublons et la correction des types de données.
Pandas
Pandas : Lecture de données externes
Dans ce laboratoire, vous apprendrez les bases de la lecture de données externes dans un DataFrame Pandas. Vous utiliserez la puissante fonction `read_csv` et ses paramètres clés pour gérer divers formats de fichiers CSV du monde réel.
Pandas
Installation et configuration de Scikit-learn
Dans ce laboratoire, vous apprendrez à vérifier votre installation de scikit-learn, à importer les modules nécessaires et à charger un jeu de données d'exemple pour débuter avec l'apprentissage automatique en Python.
scikit-learn
Prétraitement des données avec Scikit-learn
Dans ce laboratoire, vous apprendrez les techniques fondamentales de prétraitement des données dans scikit-learn, y compris la mise à l'échelle des caractéristiques avec StandardScaler et l'encodage de la cible avec LabelEncoder, en utilisant le jeu de données classique Iris.
scikit-learn
Création de DataFrames Pandas
Dans ce laboratoire, vous apprendrez les méthodes fondamentales pour créer des DataFrames Pandas, y compris à partir de dictionnaires, et comment personnaliser leurs colonnes et leurs index.
Pandas
Statistiques Descriptives Pandas
Dans ce laboratoire, vous apprendrez à calculer diverses statistiques descriptives pour un DataFrame Pandas, notamment la moyenne, la médiane, le min/max, et plus encore.
Pandas
Introduction aux Fonctions Universelles NumPy
Dans ce laboratoire, nous allons explorer les bases des Fonctions Universelles (ufuncs) de NumPy. Les ufuncs sont des fonctions qui opèrent sur les ndarrays de manière élément par élément, prenant en charge le broadcasting de tableaux, le transtypage (type casting) et d'autres fonctionnalités standard. Nous apprendrons les différentes méthodes des ufuncs, les règles de broadcasting, les règles de transtypage et comment substituer le comportement des ufuncs.
NumPyPython
Tableaux Structurés dans NumPy
Dans ce laboratoire, nous allons découvrir les tableaux structurés dans NumPy. Les tableaux structurés sont des ndarrays dont le type de données est une composition de types de données plus simples organisés en une séquence de champs nommés. Ils sont utiles pour travailler avec des données structurées, telles que des données tabulaires, où chaque champ représente un attribut différent des données.
NumPyPython
Sélection de données Pandas
Dans ce laboratoire, vous apprendrez les techniques fondamentales pour sélectionner et sous-échantillonner des données à partir de DataFrames Pandas, y compris la sélection de colonnes, de lignes et de tranches de données spécifiques.
Pandas
Création de sous-graphiques Matplotlib
Dans ce laboratoire, vous apprendrez à créer et personnaliser plusieurs sous-graphiques dans une seule figure en utilisant Matplotlib, une bibliothèque de traçage puissante en Python. Vous pratiquerez la création de sous-graphiques, le traçage de données sur ceux-ci et l'ajustement des mises en page.
Matplotlib
Chargement et exploration de données avec Scikit-learn
Dans ce laboratoire, vous apprendrez les bases du chargement et de l'exploration de jeux de données dans scikit-learn en utilisant le jeu de données classique Iris. Vous pratiquerez l'accès aux données, aux cibles et aux noms des caractéristiques, et effectuerez une visualisation simple.
scikit-learn
Classification KNN avec Scikit-learn
Dans ce laboratoire, vous apprendrez à utiliser scikit-learn pour construire un classificateur K-Nearest Neighbors (KNN), l'entraîner sur l'ensemble de données Iris et faire des prédictions sur de nouvelles données.
scikit-learn
Validation Croisée avec Scikit-learn
Dans ce laboratoire, vous apprendrez à effectuer une validation croisée avec scikit-learn pour évaluer plus robustement la performance d'un modèle d'apprentissage automatique.
scikit-learn
- Précédent
- 1
- 2
- 3
- 4
- 5
- 6
- ...
- 165
- Suivant