Работа с колонками в Pandas

PythonPythonBeginner
Практиковаться сейчас

This tutorial is from open-source community. Access the source code

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии мы научимся работать с колонками в Pandas. Мы изучим, как создавать новые колонки на основе существующих, применять математические и логические операции к колонкам, переименовывать метки колонок и выполнять операции по колонкам с использованием метода apply.

Советы по работе с ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импорт Pandas и загрузка данных

Сначала мы импортируем библиотеку pandas и загружаем данные о качестве воздуха из CSV-файла.

## Import pandas library
import pandas as pd

## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)

Создание новой колонки

Мы создадим новую колонку "london_mg_per_cubic", умножив колонку "station_london" на коэффициент преобразования.

## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882

Проверить отношение значений в двух колонках

Далее мы проверим отношение значений в колонках "station_paris" и "station_antwerp" и сохраним результат в новую колонку.

## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]

Переименовать метки колонок

Мы переименуем метки колонок, чтобы они соответствовали идентификаторам станций, используемым OpenAQ.

## Rename column labels
air_quality_renamed = air_quality.rename(
    columns={
        "station_antwerp": "BETR801",
        "station_paris": "FR04014",
        "station_london": "London Westminster",
    }
)

Преобразовать метки колонок в нижний регистр

Наконец, мы преобразуем метки колонок в нижний регистр с использованием функции.

## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)

Резюме

В этом практическом занятии мы узнали, как создавать новые колонки на основе существующих, выполнять математические и логические операции над колонками, переименовывать метки колонок и преобразовывать метки колонок в нижний регистр. С этими навыками мы можем более эффективно манипулировать и преобразовывать данные в pandas.