Método de Uso de Memória DataFrame do Pandas

Beginner

Introdução

Neste laboratório, aprenderemos como usar o método DataFrame.memory_usage() no Python Pandas. Este método nos permite calcular o uso de memória de cada coluna em um DataFrame. Vamos percorrer instruções passo a passo sobre como usar este método com exemplos.

Dicas da VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias e criar um DataFrame

  • Antes de começarmos, vamos importar a biblioteca pandas e criar um DataFrame.
  • Crie um DataFrame com alguns dados de exemplo.
## Import pandas library
import pandas as pd

## Create a DataFrame
df = pd.DataFrame({'Name': ['Abhishek', 'Anurag', 'Divya'],
                   'Roll No': [100, 101, 104]})

Visualizar o DataFrame e calcular o uso de memória

  • Agora, vamos visualizar o DataFrame criado e calcular seu uso de memória usando o método DataFrame.memory_usage().
## View the DataFrame
print("----------The DataFrame is---------")
print(df)
print("-----------------------------------")

## Calculate memory usage
print(df.memory_usage())

Excluir o índice no cálculo do uso de memória

  • Por padrão, o método DataFrame.memory_usage() inclui o uso de memória pelo índice do DataFrame. Se quisermos excluir o índice do cálculo do uso de memória, podemos definir o parâmetro index como False.
## Calculate memory usage excluding index
print(df.memory_usage(index=False))

Obter o consumo geral de memória

  • Também podemos obter o consumo geral de memória das colunas do DataFrame usando o método DataFrame.memory_usage() juntamente com a função sum().
## Get overall memory consumption
print(df.memory_usage(index=False).sum())

Resumo

Neste laboratório, aprendemos como usar o método DataFrame.memory_usage() em Python Pandas. Este método nos permite calcular o uso de memória de cada coluna em um DataFrame. Podemos incluir ou excluir o índice no cálculo do uso de memória com base em nossa necessidade, e também obter o consumo geral de memória das colunas do DataFrame. Compreender o uso de memória de um DataFrame pode ajudar a otimizar nosso código e melhorar o desempenho.