Método Corrwith do DataFrame Pandas

Beginner

Introdução

Neste laboratório, aprenderemos como usar o método corrwith() na biblioteca Pandas para calcular a correlação em pares entre dois DataFrames.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Para usar o método corrwith(), precisamos importar a biblioteca pandas.

import pandas as pd

Criar os DataFrames

Vamos criar dois DataFrames que usaremos para este laboratório.

chart_1 = {'Name':['Chetan','yashas','yuvraj'],'Age':  [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df1 = pd.DataFrame(chart_1)

chart_2 = {'Name':['Pooja','Sindu','Renuka'],'Age':  [18,25,20],'Height': [145,155,165],'Weight': [45,55,65]}
df2 = pd.DataFrame(chart_2)

Calcular a correlação usando o método corrwith()

Podemos usar o método corrwith() para calcular a correlação entre os dois DataFrames.

df1.corrwith(df2)

Especificar o método de correlação

Por padrão, o método corrwith() usa o coeficiente de correlação de Pearson. No entanto, podemos especificar o método de correlação usando o parâmetro method.

df1.corrwith(df2, method='kendall')

Resumo

Neste laboratório, aprendemos como usar o método corrwith() na biblioteca Pandas para calcular a correlação em pares (pairwise correlation) entre dois DataFrames. Este método é útil para encontrar a correlação entre diferentes colunas em dois conjuntos de dados. Ao especificar o método de correlação, podemos calcular os coeficientes de correlação de Pearson, Kendall ou Spearman. Isso nos ajuda a entender as relações entre as variáveis e a tomar decisões baseadas em dados.