Introdução
Neste laboratório, exploraremos a função DataFrame.align() na biblioteca Python Pandas. A função align() permite-nos alinhar dois DataFrames nos seus eixos usando diferentes métodos de junção (join) como outer, inner, left e right. Isso é útil quando queremos sincronizar dados entre dois DataFrames ou entre um DataFrame e uma Series.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias e criar os DataFrames
Primeiramente, vamos importar a biblioteca pandas e criar dois DataFrames com diferentes índices e colunas. O primeiro DataFrame, df1, terá as colunas 'Name', 'Roll No', 'Subject' e 'Marks', e o segundo DataFrame, df2, terá as colunas 'Name', 'Roll No' e 'Marks'.
import pandas as pd
df1 = pd.DataFrame([['Abhishek',100,'Science',90], ['Anurag',101,'Science',85]], columns=['Name', 'Roll No', 'Subject', 'Marks'], index=[1,2])
df2 = pd.DataFrame([['Chetan',103,75], ['Divya',104,80], ['Diya',105,92]], columns=['Name', 'Roll No', 'Marks'], index=[2,3,4])
Alinhar os DataFrames usando 'left' join nas colunas
Em seguida, vamos alinhar os dois DataFrames usando o "left" join nas colunas. Usaremos a função align() e especificaremos o método de junção (join) como "left" e o eixo como 1.
a1, a2 = df1.align(df2, join='left', axis=1)
print(a1)
print(a2)
Alinhar os DataFrames usando 'right' join nas colunas
Da mesma forma, podemos alinhar os DataFrames usando o "right" join nas colunas. Usaremos a função align() e especificaremos o método de junção (join) como "right" e o eixo como 1.
a1, a2 = df1.align(df2, join='right', axis=1)
print(a1)
print(a2)
Alinhar os DataFrames usando 'outer' join nas colunas
Também podemos alinhar os DataFrames usando o "outer" join nas colunas. Usaremos a função align() e especificaremos o método de junção (join) como "outer" e o eixo como 1.
a1, a2 = df1.align(df2, join='outer', axis=1)
print(a1)
print(a2)
Alinhar os DataFrames usando 'inner' join nas colunas
Finalmente, podemos alinhar os DataFrames usando o "inner" join nas colunas. Usaremos a função align() e especificaremos o método de junção (join) como "inner" e o eixo como 1.
a1, a2 = df1.align(df2, join='inner', axis=1)
print(a1)
print(a2)
Resumo
Neste laboratório, aprendemos como usar a função DataFrame.align() na biblioteca Pandas. Exploramos diferentes métodos de junção (join) como outer, inner, left e right para alinhar dois DataFrames em suas colunas ou índices. Esta função é útil quando queremos sincronizar dados entre diferentes fontes de dados ou realizar operações em dados alinhados.