Введение
В этом практическом занятии мы научимся использовать метод DataFrame.insert() из библиотеки pandas для Python. Этот метод позволяет вставлять столбец в DataFrame в заданном месте. Также мы можем выбрать, разрешать ли дублирование столбцов или нет.
Советы по работе с ВМ
После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортируем библиотеку pandas
Начнем с импорта библиотеки pandas, которая позволит нам работать с DataFrame.
import pandas as pd
Создаем DataFrame
Далее, создадим DataFrame, с которым будем работать. В этом примере мы создадим DataFrame с двумя столбцами 'A' и 'B' и четырьмя строками.
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]})
Вставляем новый столбец в DataFrame
Теперь вставим новый столбец под названием 'C' по индексу 2 в DataFrame. Для всех строк установим значение этого столбца равным 1.
df.insert(2, 'C', 1)
Выводим DataFrame
Для просмотра обновленного DataFrame выведем его с помощью функции print().
print(df)
Вставить Series в качестве столбца
Вместо этого мы можем вставить объект Series в качестве столбца в DataFrame. Создадим новый объект Series с значениями [1, 2, 3, 4] и вставим его по индексу 0 в DataFrame.
series = pd.Series([1, 2, 3, 4])
df.insert(0, 'C', series)
Распечатать DataFrame
Один раз снова, выведем DataFrame на печать, чтобы увидеть изменения.
print(df)
Обработка дублирующихся столбцов
По умолчанию метод DataFrame.insert() вызывает ValueError, если мы пытаемся вставить столбец с меткой, которая уже существует в DataFrame. Однако, мы можем переопределить это поведение, установив allow_duplicates в True. Попробуем вставить столбец с дублирующейся меткой и посмотрим на результат.
df.insert(2, 'A', 1, allow_duplicates = True)
Распечатать DataFrame
После попытки вставить дублирующийся столбец, выведем DataFrame на печать, чтобы увидеть сообщение об ошибке.
print(df)
Резюме
В этом практическом занятии мы узнали, как использовать метод DataFrame.insert() в pandas для вставки новых столбцов в DataFrame в определенных местах. Мы узнали, как вставлять столбцы с постоянными значениями и с объектами Series. Также мы увидели, как обрабатывать дубликаты при вставке столбцов. Этот метод полезен, когда нам нужно добавить новые признаки или изменить структуру нашего DataFrame.