Introdução
Neste laboratório, aprenderemos como usar o método DataFrame.memory_usage() no Python Pandas. Este método nos permite calcular o uso de memória de cada coluna em um DataFrame. Vamos percorrer instruções passo a passo sobre como usar este método com exemplos.
Dicas da VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias e criar um DataFrame
- Antes de começarmos, vamos importar a biblioteca
pandase criar um DataFrame. - Crie um DataFrame com alguns dados de exemplo.
## Import pandas library
import pandas as pd
## Create a DataFrame
df = pd.DataFrame({'Name': ['Abhishek', 'Anurag', 'Divya'],
'Roll No': [100, 101, 104]})
Visualizar o DataFrame e calcular o uso de memória
- Agora, vamos visualizar o DataFrame criado e calcular seu uso de memória usando o método
DataFrame.memory_usage().
## View the DataFrame
print("----------The DataFrame is---------")
print(df)
print("-----------------------------------")
## Calculate memory usage
print(df.memory_usage())
Excluir o índice no cálculo do uso de memória
- Por padrão, o método
DataFrame.memory_usage()inclui o uso de memória pelo índice do DataFrame. Se quisermos excluir o índice do cálculo do uso de memória, podemos definir o parâmetroindexcomoFalse.
## Calculate memory usage excluding index
print(df.memory_usage(index=False))
Obter o consumo geral de memória
- Também podemos obter o consumo geral de memória das colunas do DataFrame usando o método
DataFrame.memory_usage()juntamente com a funçãosum().
## Get overall memory consumption
print(df.memory_usage(index=False).sum())
Resumo
Neste laboratório, aprendemos como usar o método DataFrame.memory_usage() em Python Pandas. Este método nos permite calcular o uso de memória de cada coluna em um DataFrame. Podemos incluir ou excluir o índice no cálculo do uso de memória com base em nossa necessidade, e também obter o consumo geral de memória das colunas do DataFrame. Compreender o uso de memória de um DataFrame pode ajudar a otimizar nosso código e melhorar o desempenho.