Работа с Pandas

This tutorial is from open-source community. Access the source code

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

Pandas - это мощный инструмент для манипуляции данными, разработанный на языке Python. Он часто используется в анализе и очистке данных, так как обладает гибкостью и простотой в использовании. В этом практическом занятии мы научимся использовать Pandas для выполнения основных операций, таких как загрузка данных, создание DataFrame, доступ к данным и проведение простой статистики.

Советы по использованию ВМ

После запуска виртуальной машины щелкните в левом верхнем углу, чтобы переключиться на вкладку Ноутбук и получить доступ к Jupyter Notebook для практики.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/FunctionsGroup(["Functions"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) python(("Python")) -.-> python/BasicConceptsGroup(["Basic Concepts"]) pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) python(("Python")) -.-> python/DataStructuresGroup(["Data Structures"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python/BasicConceptsGroup -.-> python/comments("Comments") pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") python/DataStructuresGroup -.-> python/lists("Lists") python/DataStructuresGroup -.-> python/tuples("Tuples") python/DataStructuresGroup -.-> python/dictionaries("Dictionaries") python/FunctionsGroup -.-> python/build_in_functions("Build-in Functions") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/DataScienceandMachineLearningGroup -.-> python/numerical_computing("Numerical Computing") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills python/comments -.-> lab-65430{{"Работа с Pandas"}} pandas/select_columns -.-> lab-65430{{"Работа с Pandas"}} python/lists -.-> lab-65430{{"Работа с Pandas"}} python/tuples -.-> lab-65430{{"Работа с Pandas"}} python/dictionaries -.-> lab-65430{{"Работа с Pandas"}} python/build_in_functions -.-> lab-65430{{"Работа с Pandas"}} python/importing_modules -.-> lab-65430{{"Работа с Pandas"}} python/numerical_computing -.-> lab-65430{{"Работа с Pandas"}} python/data_analysis -.-> lab-65430{{"Работа с Pandas"}} end

Импортируем пакет Pandas

Прежде чем использовать Pandas, его необходимо импортировать. Обычно Pandas импортируют с псевдонимом pd.

## Importing pandas package
import pandas as pd

Создаем DataFrame

Данные в pandas хранятся в DataFrame, который представляет собой двухмерную структуру данных с метками, в которой столбцы могут иметь разные типы.

## Creating a DataFrame
df = pd.DataFrame(
    {
        "Name": [
            "Braund, Mr. Owen Harris",
            "Allen, Mr. William Henry",
            "Bonnell, Miss. Elizabeth",
        ],
        "Age": [22, 35, 58],
        "Sex": ["male", "male", "female"],
    }
)

Выбираем столбец

Если вы хотите работать с данными в определенном столбце, вы можете выбрать его по метке столбца. Результатом будет pandas Series.

## Selecting the 'Age' column
df["Age"]

Выполняем базовую статистику

Pandas предоставляет много функций для выполнения статистики. Например, вы можете найти максимальное значение в столбце с помощью max().

## Finding the maximum age
df["Age"].max()

Вы также можете получить быстрый обзор числовых данных в DataFrame с помощью describe().

## Describing the numerical data
df.describe()

Резюме

В этом практическом занятии мы узнали, как импортировать пакет Pandas, создавать DataFrame, выбирать столбец и выполнять базовую статистику. Pandas - это универсальный инструмент, который может обрабатывать данные разных типов, что делает его отличным выбором для анализа и манипуляции данными.