Введение
В этом практическом занятии вы научитесь использовать метод compare() библиотеки pandas для сравнения двух DataFrame и выявления их различий. Метод compare() представляет собой удобный способ обнаружить расхождения между двумя DataFrame, показывая отличающиеся значения в сравнении "между собой".
Советы по работе с ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортировать необходимые библиотеки
Сначала вам нужно импортировать библиотеку pandas, чтобы использовать метод compare(). Запустите следующий код:
import pandas as pd
Создать DataFrame
Далее вы создадите два DataFrame для сравнения. Каждый DataFrame должен иметь одинаковые метки, но могут иметь разные значения. Запустите следующий код, чтобы создать DataFrame:
df1 = pd.DataFrame([['Abhishek',100,'Science',90], ['Anurag',101,'Science',85]], columns=['Name', 'Roll No', 'Subject', 'Marks'])
df2 = pd.DataFrame([['Abhishek',100,'Maths',95], ['Anurag',101,'Maths',80]], columns=['Name', 'Roll No', 'Subject', 'Marks'])
Сравнить DataFrame
Теперь вы можете использовать метод compare() для сравнения двух DataFrame и отображения различий. Метод сравнивает значения между двумя DataFrame и возвращает новый DataFrame с отличающимися значениями рядом. Запустите следующий код:
differences = df1.compare(df2)
print(differences)
Изменить DataFrame и сравнить снова
Вы можете изменить значения в любом из DataFrame и сравнить их снова, чтобы увидеть обновленные различия. Запустите следующий код, чтобы изменить значение во втором DataFrame:
df2.at[1, 'Marks'] = 85
Затем запустите код сравнения из шага 3 снова, чтобы увидеть обновленные различия.
Указать ось выравнивания и включение равных значений
Вы также можете указать ось выравнивания и включение равных значений в результирующий DataFrame. По умолчанию ось выравнивания установлена в 1 (столбцы), и равные значения не включаются. Запустите следующий код, чтобы продемонстрировать эти параметры:
differences_axis_0 = df1.compare(df2, align_axis=0)
differences_keep_equal = df1.compare(df2, keep_equal=True)
Резюме
В этом практическом занятии вы узнали, как использовать метод compare() в библиотеке pandas для сравнения двух DataFrame. Этот метод позволяет выявлять различия между DataFrame, отображая рядом отличающиеся значения. Вы также узнали, как указать ось выравнивания и включение равных значений в результирующий DataFrame. Теперь вы можете использовать эти знания для простого сравнения и анализа различий между наборами данных.