Метод использования памяти DataFrame в Pandas

Beginner

Введение

В этом практическом занятии мы научимся использовать метод DataFrame.memory_usage() в Python Pandas. Этот метод позволяет вычислить объем памяти, используемый каждым столбцом в DataFrame. Мы рассмотрим пошаговые инструкции по использованию этого метода с примерами.

Советы по работе с ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортировать необходимые библиотеки и создать DataFrame

  • Перед началом работы импортируем библиотеку pandas и создадим DataFrame.
  • Создадим DataFrame с некоторыми примерами данных.
## Import pandas library
import pandas as pd

## Create a DataFrame
df = pd.DataFrame({'Name': ['Abhishek', 'Anurag', 'Divya'],
                   'Roll No': [100, 101, 104]})

Посмотреть DataFrame и вычислить потребление памяти

  • Теперь давайте посмотрим на созданный DataFrame и вычислим его потребление памяти с использованием метода DataFrame.memory_usage().
## View the DataFrame
print("----------The DataFrame is---------")
print(df)
print("-----------------------------------")

## Calculate memory usage
print(df.memory_usage())

Исключить индекс из расчета потребления памяти

  • По умолчанию метод DataFrame.memory_usage() включает в расчет потребление памяти индексом DataFrame. Если мы хотим исключить индекс из расчета потребления памяти, мы можем установить параметр index в значение False.
## Calculate memory usage excluding index
print(df.memory_usage(index=False))

Получить общее потребление памяти

  • Мы также можем получить общее потребление памяти столбцов DataFrame, используя метод DataFrame.memory_usage() вместе с функцией sum().
## Get overall memory consumption
print(df.memory_usage(index=False).sum())

Резюме

В этом практическом занятии мы узнали, как использовать метод DataFrame.memory_usage() в Python Pandas. Этот метод позволяет нам вычислить потребление памяти каждого столбца в DataFrame. Мы можем включать или исключать индекс из расчета потребления памяти в зависимости от наших потребностей, а также получить общее потребление памяти столбцов DataFrame. Понимание потребления памяти DataFrame может помочь оптимизировать наш код и повысить производительность.