Введение
Метод Pandas DataFrame.diff() вычисляет разницу между элементами в DataFrame. Он предоставляет первую дискретную разность элементов, вычисляя разницу между элементом DataFrame и другим элементом в том же DataFrame. По умолчанию метод вычисляет разницу с предыдущим элементом в строке.
Советы по виртуальной машине (VM)
После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если у вас возникнут проблемы во время обучения, не стесняйтесь обращаться к Labby. После занятия оставьте отзыв, и мы оперативно решим проблему для вас.
Импортируйте необходимые библиотеки
Для использования метода DataFrame.diff() сначала нужно импортировать библиотеку pandas:
import pandas as pd
Создайте DataFrame
Далее, создадим DataFrame, который мы будем использовать в примерах:
df = pd.DataFrame({'a': [1, 3, 8],'b': [3, 5, 8],'c': [16, 25, 36]})
Наша DataFrame имеет три столбца ('a', 'b', 'c') и три строки.
Вычислите разницу с предыдущей строкой
Для вычисления разности с предыдущей строкой мы можем просто вызвать метод diff() для нашей DataFrame:
diff_previous_row = df.diff()
Это вычислит разницу между каждым элементом и предыдущим элементом в строке.
Вычислите разницу между предыдущими столбцами
Если мы хотим вычислить разность между предыдущими столбцами вместо предыдущих строк, мы можем указать параметр axis равным 1:
diff_previous_column = df.diff(axis=1)
Это вычислит разницу между каждым элементом и предыдущим элементом в столбце.
Вычислите разницу с определенной предыдущей строкой
Мы также можем вычислить разность с определенной предыдущей строкой, указав параметр periods. Например, чтобы вычислить разность с второй предыдущей строкой, мы можем установить periods равным 2:
diff_second_previous_row = df.diff(periods=2)
Это вычислит разницу между каждым элементом и элементом, находящимся на две строки выше.
Вычислите разницу с определенным предыдущим столбцом
Аналогично, мы можем вычислить разность с определенным предыдущим столбцом, указав параметры periods и axis. Например, чтобы вычислить разность с третьим предыдущим столбцом, мы можем установить periods равным 3 и axis равным 1:
diff_third_previous_column = df.diff(periods=3, axis=1)
Это вычислит разницу между каждым элементом и элементом, находящимся на три столбца левее.
Резюме
Метод DataFrame.diff() в Pandas позволяет нам вычислить разницу между элементами в DataFrame. Мы можем вычислить разность с предыдущими строками или предыдущими столбцами, а также с определенными предыдущими строками или столбцами. Этот метод полезен при анализе временных рядов или при сравнении значений между последовательными строками или столбцами. Используя метод diff(), мы можем легко вычислить изменения или разности в нашей DataFrame.