Введение
В этом практическом занятии мы научимся использовать метод DataFrame.memory_usage() в Python Pandas. Этот метод позволяет вычислить объем памяти, используемый каждым столбцом в DataFrame. Мы рассмотрим пошаговые инструкции по использованию этого метода с примерами.
Советы по работе с ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортировать необходимые библиотеки и создать DataFrame
- Перед началом работы импортируем библиотеку
pandasи создадим DataFrame. - Создадим DataFrame с некоторыми примерами данных.
## Import pandas library
import pandas as pd
## Create a DataFrame
df = pd.DataFrame({'Name': ['Abhishek', 'Anurag', 'Divya'],
'Roll No': [100, 101, 104]})
Посмотреть DataFrame и вычислить потребление памяти
- Теперь давайте посмотрим на созданный DataFrame и вычислим его потребление памяти с использованием метода
DataFrame.memory_usage().
## View the DataFrame
print("----------The DataFrame is---------")
print(df)
print("-----------------------------------")
## Calculate memory usage
print(df.memory_usage())
Исключить индекс из расчета потребления памяти
- По умолчанию метод
DataFrame.memory_usage()включает в расчет потребление памяти индексом DataFrame. Если мы хотим исключить индекс из расчета потребления памяти, мы можем установить параметрindexв значениеFalse.
## Calculate memory usage excluding index
print(df.memory_usage(index=False))
Получить общее потребление памяти
- Мы также можем получить общее потребление памяти столбцов DataFrame, используя метод
DataFrame.memory_usage()вместе с функциейsum().
## Get overall memory consumption
print(df.memory_usage(index=False).sum())
Резюме
В этом практическом занятии мы узнали, как использовать метод DataFrame.memory_usage() в Python Pandas. Этот метод позволяет нам вычислить потребление памяти каждого столбца в DataFrame. Мы можем включать или исключать индекс из расчета потребления памяти в зависимости от наших потребностей, а также получить общее потребление памяти столбцов DataFrame. Понимание потребления памяти DataFrame может помочь оптимизировать наш код и повысить производительность.