Введение
Метод pct_change() в DataFrame библиотеки Pandas вычисляет процентное изменение между текущим и предыдущим элементом в DataFrame. Это полезно для анализа данных и расчета различий в продажах с месяцем на месяц или с годом на год.
Советы по виртуальной машине (VM)
После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если у вас возникнут проблемы во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Вычисление процентного изменения в DataFrame библиотеки Pandas
Для вычисления процентного изменения в DataFrame библиотеки Pandas следуйте этим шагам:
- Импортируйте библиотеку pandas.
import pandas as pd
- Создайте DataFrame с индексом временного ряда и нужными данными.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Выведите исходный DataFrame.
print("----------The dataset is----------")
print(df)
- Используйте метод
pct_change()для вычисления процентного изменения в DataFrame.
print("-------percentage change in the dataset-------")
print(df.pct_change())
Вычисление процентного изменения по столбцам
Для вычисления процентного изменения по столбцам измените код на шаге 1 следующим образом:
- Импортируйте библиотеку pandas.
import pandas as pd
- Создайте DataFrame с индексом временного ряда и нужными данными.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Выведите исходный DataFrame.
print("----------The dataset is----------")
print(df)
- Используйте метод
pct_change()с параметромaxis=1для вычисления процентного изменения по столбцам.
print("-------percentage change in the dataset-------")
print(df.pct_change(axis=1))
Вычисление процентного изменения с заданным периодом
Для вычисления процентного изменения с заданным периодом измените код на шаге 1 следующим образом:
- Импортируйте библиотеку pandas.
import pandas as pd
- Создайте DataFrame с индексом временного ряда и нужными данными.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Выведите исходный DataFrame.
print("----------The dataset is----------")
print(df)
- Используйте метод
pct_change()с параметромperiods=2для вычисления процентного изменения с заданным периодом.
print("-------percentage change in the dataset-------")
print(df.pct_change(periods=2))
Обработка пропущенных значений перед вычислением
Для обработки пропущенных значений перед вычислением процентного изменения измените код на шаге 1 следующим образом:
- Импортируйте библиотеку pandas.
import pandas as pd
- Создайте DataFrame с индексом временного ряда и нужными данными.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Выведите исходный DataFrame.
print("----------The dataset is----------")
print(df)
- Используйте метод
pct_change()с параметромfill_method='ffill'для обработки пропущенных значений перед вычислением.
print("-------percentage change in the dataset-------")
print(df.pct_change(fill_method='ffill'))
Резюме
Метод pct_change() в DataFrame библиотеки Pandas вычисляет процентное изменение между текущим и предыдущим элементом. Он может быть использован для анализа данных и вычисления различий, а также имеет параметры для обработки пропущенных значений и задания периода для вычислений. Следуя шагам этого руководства, вы сможете эффективно использовать метод pct_change() в своих задачах по анализу данных.