Основы манипуляции данными с использованием Pandas

PythonPythonBeginner
Практиковаться сейчас

This tutorial is from open-source community. Access the source code

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

Этот практикум по Python Pandas 旨在向您介绍 pandas 库的基本操作,pandas 是 Python 中强大的数据处理工具。在整个实践中,您将使用大量示例和代码片段来巩固对 pandas 的理解。

Советы по работе с ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике с использованием Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений в Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импорт библиотеки Pandas

Во - первых, нам нужно импортировать библиотеку pandas. Это можно сделать с помощью следующей команды:

## Importing pandas library
import pandas as pd
import numpy as np

Создание DataFrame

Далее мы создадим DataFrame, который представляет собой двухмерную структуру данных с метками, где столбцы могут иметь разные типы. Это, как правило, наиболее часто используемый объект в pandas.

## Creating a DataFrame with a dictionary
df = pd.DataFrame({'A': [1, 2, 3]})

Разбор DataFrame

Теперь давайте попробуем лучше понять DataFrame, который мы только что создали.

## Displaying the DataFrame
print(df)

## Info about the DataFrame
df.info()

Работа с пропущенными данными

Pandas предоставляет различные методы для очистки данных и заполнения пропущенных значений.

## Creating a DataFrame with missing values
df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [5, np.nan, np.nan], 'C': [1, 2, 3]})

## Filling missing values
df.fillna(value=0, inplace=True)

Визуализация данных

Pandas позволяет интегрироваться с библиотекой Matplotlib для визуализации данных.

## Importing matplotlib library
import matplotlib.pyplot as plt

## Plotting a graph
df['A'].plot()
plt.show()

Резюме

В этом практическом занятии мы рассмотрели основы библиотеки pandas в Python, включая импорт библиотеки, создание и манипуляцию с DataFrame, обработку пропущенных данных и визуализацию данных. Эти навыки являются фундаментальными для любого задания по анализу данных в Python, и овладение pandas позволит вам эффективно обрабатывать и анализировать данные.