Метод сравнения DataFrame в Pandas

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии вы научитесь использовать метод compare() библиотеки pandas для сравнения двух DataFrame и выявления их различий. Метод compare() представляет собой удобный способ обнаружить расхождения между двумя DataFrame, показывая отличающиеся значения в сравнении "между собой".

Советы по работе с ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортировать необходимые библиотеки

Сначала вам нужно импортировать библиотеку pandas, чтобы использовать метод compare(). Запустите следующий код:

import pandas as pd

Создать DataFrame

Далее вы создадите два DataFrame для сравнения. Каждый DataFrame должен иметь одинаковые метки, но могут иметь разные значения. Запустите следующий код, чтобы создать DataFrame:

df1 = pd.DataFrame([['Abhishek',100,'Science',90], ['Anurag',101,'Science',85]], columns=['Name', 'Roll No', 'Subject', 'Marks'])
df2 = pd.DataFrame([['Abhishek',100,'Maths',95], ['Anurag',101,'Maths',80]], columns=['Name', 'Roll No', 'Subject', 'Marks'])

Сравнить DataFrame

Теперь вы можете использовать метод compare() для сравнения двух DataFrame и отображения различий. Метод сравнивает значения между двумя DataFrame и возвращает новый DataFrame с отличающимися значениями рядом. Запустите следующий код:

differences = df1.compare(df2)
print(differences)

Изменить DataFrame и сравнить снова

Вы можете изменить значения в любом из DataFrame и сравнить их снова, чтобы увидеть обновленные различия. Запустите следующий код, чтобы изменить значение во втором DataFrame:

df2.at[1, 'Marks'] = 85

Затем запустите код сравнения из шага 3 снова, чтобы увидеть обновленные различия.

Указать ось выравнивания и включение равных значений

Вы также можете указать ось выравнивания и включение равных значений в результирующий DataFrame. По умолчанию ось выравнивания установлена в 1 (столбцы), и равные значения не включаются. Запустите следующий код, чтобы продемонстрировать эти параметры:

differences_axis_0 = df1.compare(df2, align_axis=0)
differences_keep_equal = df1.compare(df2, keep_equal=True)

Резюме

В этом практическом занятии вы узнали, как использовать метод compare() в библиотеке pandas для сравнения двух DataFrame. Этот метод позволяет выявлять различия между DataFrame, отображая рядом отличающиеся значения. Вы также узнали, как указать ось выравнивания и включение равных значений в результирующий DataFrame. Теперь вы можете использовать эти знания для простого сравнения и анализа различий между наборами данных.