Введение
Этот практикум по Python Pandas 旨在向您介绍 pandas 库的基本操作,pandas 是 Python 中强大的数据处理工具。在整个实践中,您将使用大量示例和代码片段来巩固对 pandas 的理解。
Советы по работе с ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике с использованием Jupyter Notebook.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений в Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импорт библиотеки Pandas
Во - первых, нам нужно импортировать библиотеку pandas. Это можно сделать с помощью следующей команды:
## Importing pandas library
import pandas as pd
import numpy as np
Создание DataFrame
Далее мы создадим DataFrame, который представляет собой двухмерную структуру данных с метками, где столбцы могут иметь разные типы. Это, как правило, наиболее часто используемый объект в pandas.
## Creating a DataFrame with a dictionary
df = pd.DataFrame({'A': [1, 2, 3]})
Разбор DataFrame
Теперь давайте попробуем лучше понять DataFrame, который мы только что создали.
## Displaying the DataFrame
print(df)
## Info about the DataFrame
df.info()
Работа с пропущенными данными
Pandas предоставляет различные методы для очистки данных и заполнения пропущенных значений.
## Creating a DataFrame with missing values
df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [5, np.nan, np.nan], 'C': [1, 2, 3]})
## Filling missing values
df.fillna(value=0, inplace=True)
Визуализация данных
Pandas позволяет интегрироваться с библиотекой Matplotlib для визуализации данных.
## Importing matplotlib library
import matplotlib.pyplot as plt
## Plotting a graph
df['A'].plot()
plt.show()
Резюме
В этом практическом занятии мы рассмотрели основы библиотеки pandas в Python, включая импорт библиотеки, создание и манипуляцию с DataFrame, обработку пропущенных данных и визуализацию данных. Эти навыки являются фундаментальными для любого задания по анализу данных в Python, и овладение pandas позволит вам эффективно обрабатывать и анализировать данные.