Метод вставки DataFrame в Pandas

Beginner

Введение

В этом практическом занятии мы научимся использовать метод DataFrame.insert() из библиотеки pandas для Python. Этот метод позволяет вставлять столбец в DataFrame в заданном месте. Также мы можем выбрать, разрешать ли дублирование столбцов или нет.

Советы по работе с ВМ

После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем библиотеку pandas

Начнем с импорта библиотеки pandas, которая позволит нам работать с DataFrame.

import pandas as pd

Создаем DataFrame

Далее, создадим DataFrame, с которым будем работать. В этом примере мы создадим DataFrame с двумя столбцами 'A' и 'B' и четырьмя строками.

df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]})

Вставляем новый столбец в DataFrame

Теперь вставим новый столбец под названием 'C' по индексу 2 в DataFrame. Для всех строк установим значение этого столбца равным 1.

df.insert(2, 'C', 1)

Выводим DataFrame

Для просмотра обновленного DataFrame выведем его с помощью функции print().

print(df)

Вставить Series в качестве столбца

Вместо этого мы можем вставить объект Series в качестве столбца в DataFrame. Создадим новый объект Series с значениями [1, 2, 3, 4] и вставим его по индексу 0 в DataFrame.

series = pd.Series([1, 2, 3, 4])
df.insert(0, 'C', series)

Распечатать DataFrame

Один раз снова, выведем DataFrame на печать, чтобы увидеть изменения.

print(df)

Обработка дублирующихся столбцов

По умолчанию метод DataFrame.insert() вызывает ValueError, если мы пытаемся вставить столбец с меткой, которая уже существует в DataFrame. Однако, мы можем переопределить это поведение, установив allow_duplicates в True. Попробуем вставить столбец с дублирующейся меткой и посмотрим на результат.

df.insert(2, 'A', 1, allow_duplicates = True)

Распечатать DataFrame

После попытки вставить дублирующийся столбец, выведем DataFrame на печать, чтобы увидеть сообщение об ошибке.

print(df)

Резюме

В этом практическом занятии мы узнали, как использовать метод DataFrame.insert() в pandas для вставки новых столбцов в DataFrame в определенных местах. Мы узнали, как вставлять столбцы с постоянными значениями и с объектами Series. Также мы увидели, как обрабатывать дубликаты при вставке столбцов. Этот метод полезен, когда нам нужно добавить новые признаки или изменить структуру нашего DataFrame.