Manipulation de données avec Pandas

PythonPythonBeginner
Pratiquer maintenant

This tutorial is from open-source community. Access the source code

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Ce laboratoire vous guidera sur la manière de lire, d'écrire et de manipuler des données à l'aide de Pandas, une puissante bibliothèque d'analyse et de manipulation de données pour Python. Nous utiliserons un ensemble de données du naufrage du Titanic pour cet exercice.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter Notebook pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importation des bibliothèques nécessaires

Tout d'abord, nous devons importer les bibliothèques nécessaires à notre tâche. Pour ce laboratoire, nous n'aurons besoin que de pandas.

## Importation de la bibliothèque pandas
import pandas as pd

Lecture des données à partir d'un fichier CSV

L'étape suivante consiste à lire les données à partir d'un fichier CSV. Nous utiliserons la fonction read_csv de pandas pour ce faire.

## Lecture des données à partir du fichier CSV
titanic = pd.read_csv("data/titanic.csv")

Vérification des données

Après avoir lu les données, il est toujours judicieux de vérifier à quoi elles ressemblent. Nous allons afficher les premières lignes du DataFrame.

## Affichage des premières lignes du DataFrame
titanic.head()

Vérification des types de données

Nous pouvons vérifier les types de données de chaque colonne en utilisant l'attribut dtypes du DataFrame.

## Vérification des types de données de chaque colonne
titanic.dtypes

Écriture des données dans un fichier Excel

Vous pouvez également écrire les données dans un fichier Excel en utilisant la méthode to_excel. Enregistrons notre DataFrame dans un fichier Excel.

## Enregistrement du DataFrame dans un fichier Excel
titanic.to_excel("titanic.xlsx", sheet_name="passagers", index=False)

Lecture des données à partir d'un fichier Excel

La lecture des données à partir d'un fichier Excel est aussi facile que la lecture des données à partir d'un fichier CSV. Nous utiliserons la fonction read_excel de pandas.

## Lecture des données à partir d'un fichier Excel
titanic = pd.read_excel("titanic.xlsx", sheet_name="passagers")

Vérification des informations sur un DataFrame

La méthode info fournit un résumé technique d'un DataFrame. Cela peut être utile pour vérifier les types de données, le nombre de valeurs non nulles et l'utilisation de mémoire.

## Vérification des informations sur un DataFrame
titanic.info()

Sommaire

Dans ce laboratoire, nous avons appris à lire et à écrire des données à l'aide de pandas, et à vérifier les informations d'un DataFrame. Pandas offre un large éventail de fonctionnalités pour manipuler et traiter les données, ce qui en fait un outil puissant pour l'analyse de données.