Метод append в Pandas

PythonPythonBeginner

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом руководстве вы узнаете, как использовать метод append() в Python Pandas. Метод append() позволяет добавлять строки из одного DataFrame в другой и возвращает новый объект DataFrame. Он также может добавлять столбцы из присоединяемого DataFrame, если они отсутствуют в вызывающем DataFrame.

Советы по работе с ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Ноутбук и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Создание двух DataFrame

Во - первых, нам нужно создать два DataFrame, которые мы будем использовать для примеров в этом руководстве.

import pandas as pd

## Создание DataFrame 1
df1 = pd.DataFrame([['Abhishek', 100, 'Science', 90],
                    ['Anurag', 101, 'Science', 85]],
                   columns=['Name', 'Roll No', 'Subject', 'Marks'])

## Создание DataFrame 2
df2 = pd.DataFrame([['Chetan', 103, 'Maths', 75],
                    ['Divya', 104, 'Science', 80],
                    ['Diya', 105, 'Maths', 92]],
                   columns=['Name', 'Roll No', 'Subject', 'Marks'])

Добавление строк с использованием метода append()

Вы можете добавить один DataFrame к другому с использованием метода append(). Для этого просто вызовите метод append() для DataFrame, к которому вы хотите добавить, и передайте в качестве параметра DataFrame, который вы хотите добавить.

## Добавление DataFrame 2 к DataFrame 1
appended_df = df1.append(df2)

## Вывод результата
print(appended_df)

Избегайте совпадения значений индекса

Когда вы добавляете один DataFrame к другому, значения индекса могут совпадать. Чтобы избежать этого, вы можете установить параметр ignore_index в значение True. Это пере-assignит новые значения индекса для присоединяемого DataFrame.

## Добавьте DataFrame 2 к DataFrame 1 с параметром ignore_index, установленным в True
appended_df = df1.append(df2, ignore_index=True)

## Распечатайте результат
print(appended_df)

Предотвратите совпадение значений индекса

Если вы хотите вызывать ошибку, когда значения индекса совпадают, вы можете установить параметр verify_integrity в значение True.

## Добавьте DataFrame 2 к DataFrame 1 с параметром verify_integrity, установленным в True
try:
    appended_df = df1.append(df2, verify_integrity=True)
except ValueError as e:
    print(e)

Добавление строки из Series

Вы также можете добавить одну строку, представленную в виде Series, к DataFrame. Для этого создайте объект Series с значениями и индексом строки, а затем вызовите метод append() для DataFrame с Series в качестве параметра.

## Создание Series
series = pd.Series(['Chetan', 103, 'Maths', 75], index=['Name', 'Roll No', 'Subject', 'Marks'])

## Добавление Series к DataFrame 1
appended_df = df1.append(series, ignore_index=True)

## Распечатайте результат
print(appended_df)

Добавление строки из словаря

Вы также можете добавить строку, представленную в виде словаря, к DataFrame. Для этого создайте словарь, в котором имена столбцов будут ключами, а значения строки - значениями, а затем вызовите метод append() для DataFrame с словарем в качестве параметра.

## Создание словаря
dictionary = {'Name': 'Chetan', 'Roll No': 103, 'Subject': 'Maths', 'Marks': 75}

## Добавление словаря к DataFrame 1
appended_df = df1.append(dictionary, ignore_index=True)

## Распечатайте результат
print(appended_df)

Резюме

В этом уроке вы узнали, как использовать метод append() в Python Pandas. Вы можете использовать этот метод для добавления строк из одного DataFrame в другой, а также для добавления столбцов из присоединяемого DataFrame, если они отсутствуют в вызывающем DataFrame. Не забудьте использовать соответствующие параметры, такие как ignore_index и verify_integrity, для управления поведением операции добавления. Этот метод позволяет легко объединять и манипулировать DataFrame в задачах анализа данных. Удачной разработки!