Função DataFrame Align do Pandas

Beginner

Introdução

Neste laboratório, exploraremos a função DataFrame.align() na biblioteca Python Pandas. A função align() permite-nos alinhar dois DataFrames nos seus eixos usando diferentes métodos de junção (join) como outer, inner, left e right. Isso é útil quando queremos sincronizar dados entre dois DataFrames ou entre um DataFrame e uma Series.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias e criar os DataFrames

Primeiramente, vamos importar a biblioteca pandas e criar dois DataFrames com diferentes índices e colunas. O primeiro DataFrame, df1, terá as colunas 'Name', 'Roll No', 'Subject' e 'Marks', e o segundo DataFrame, df2, terá as colunas 'Name', 'Roll No' e 'Marks'.

import pandas as pd

df1 = pd.DataFrame([['Abhishek',100,'Science',90], ['Anurag',101,'Science',85]], columns=['Name', 'Roll No', 'Subject', 'Marks'], index=[1,2])
df2 = pd.DataFrame([['Chetan',103,75], ['Divya',104,80], ['Diya',105,92]], columns=['Name', 'Roll No', 'Marks'], index=[2,3,4])

Alinhar os DataFrames usando 'left' join nas colunas

Em seguida, vamos alinhar os dois DataFrames usando o "left" join nas colunas. Usaremos a função align() e especificaremos o método de junção (join) como "left" e o eixo como 1.

a1, a2 = df1.align(df2, join='left', axis=1)
print(a1)
print(a2)

Alinhar os DataFrames usando 'right' join nas colunas

Da mesma forma, podemos alinhar os DataFrames usando o "right" join nas colunas. Usaremos a função align() e especificaremos o método de junção (join) como "right" e o eixo como 1.

a1, a2 = df1.align(df2, join='right', axis=1)
print(a1)
print(a2)

Alinhar os DataFrames usando 'outer' join nas colunas

Também podemos alinhar os DataFrames usando o "outer" join nas colunas. Usaremos a função align() e especificaremos o método de junção (join) como "outer" e o eixo como 1.

a1, a2 = df1.align(df2, join='outer', axis=1)
print(a1)
print(a2)

Alinhar os DataFrames usando 'inner' join nas colunas

Finalmente, podemos alinhar os DataFrames usando o "inner" join nas colunas. Usaremos a função align() e especificaremos o método de junção (join) como "inner" e o eixo como 1.

a1, a2 = df1.align(df2, join='inner', axis=1)
print(a1)
print(a2)

Resumo

Neste laboratório, aprendemos como usar a função DataFrame.align() na biblioteca Pandas. Exploramos diferentes métodos de junção (join) como outer, inner, left e right para alinhar dois DataFrames em suas colunas ou índices. Esta função é útil quando queremos sincronizar dados entre diferentes fontes de dados ou realizar operações em dados alinhados.