Введение
В этом практическом занятии мы научимся работать с колонками в Pandas. Мы изучим, как создавать новые колонки на основе существующих, применять математические и логические операции к колонкам, переименовывать метки колонок и выполнять операции по колонкам с использованием метода apply.
Советы по работе с ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импорт Pandas и загрузка данных
Сначала мы импортируем библиотеку pandas и загружаем данные о качестве воздуха из CSV-файла.
## Import pandas library
import pandas as pd
## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
Создание новой колонки
Мы создадим новую колонку "london_mg_per_cubic", умножив колонку "station_london" на коэффициент преобразования.
## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882
Проверить отношение значений в двух колонках
Далее мы проверим отношение значений в колонках "station_paris" и "station_antwerp" и сохраним результат в новую колонку.
## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]
Переименовать метки колонок
Мы переименуем метки колонок, чтобы они соответствовали идентификаторам станций, используемым OpenAQ.
## Rename column labels
air_quality_renamed = air_quality.rename(
columns={
"station_antwerp": "BETR801",
"station_paris": "FR04014",
"station_london": "London Westminster",
}
)
Преобразовать метки колонок в нижний регистр
Наконец, мы преобразуем метки колонок в нижний регистр с использованием функции.
## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)
Резюме
В этом практическом занятии мы узнали, как создавать новые колонки на основе существующих, выполнять математические и логические операции над колонками, переименовывать метки колонок и преобразовывать метки колонок в нижний регистр. С этими навыками мы можем более эффективно манипулировать и преобразовывать данные в pandas.