Método Pipe do DataFrame Pandas

Beginner

Introdução

O método pipe() do Pandas DataFrame permite aplicar um método ou múltiplos métodos a todo o DataFrame de forma sequencial. Este pode ser um método definido pelo usuário ou um método embutido. O método pipe() aplica o(s) método(s) especificado(s) a cada elemento individual, linha ou coluna do DataFrame.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Para usar o método pipe(), precisamos importar a biblioteca pandas como pd.

import pandas as pd

Definir um método definido pelo usuário (opcional)

Se você deseja aplicar um método definido pelo usuário, precisa defini-lo antes de usar o método pipe(). Este método será aplicado ao DataFrame.

def add(x):
    return x + 1

Criar um DataFrame

Em seguida, crie um DataFrame no qual você deseja aplicar o método pipe(). Isso pode ser feito passando um dicionário para a função pd.DataFrame().

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

Aplicar o método pipe()

Agora, podemos aplicar o método pipe() ao DataFrame. Isso pode ser feito chamando o método pipe() no objeto DataFrame e passando o método (definido pelo usuário ou embutido) como um argumento.

df.pipe(add)

Resumo

Neste laboratório, aprendemos como usar o método pipe() do pandas DataFrame para aplicar um método ou múltiplos métodos a todo o DataFrame. Vimos como definir um método definido pelo usuário e aplicá-lo ao DataFrame usando o método pipe(). Usando este método, podemos aplicar eficientemente um método a cada elemento, linha ou coluna do DataFrame.