Introdução
Neste laboratório, aprenderemos como usar o método corrwith() na biblioteca Pandas para calcular a correlação em pares entre dois DataFrames.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias
Para usar o método corrwith(), precisamos importar a biblioteca pandas.
import pandas as pd
Criar os DataFrames
Vamos criar dois DataFrames que usaremos para este laboratório.
chart_1 = {'Name':['Chetan','yashas','yuvraj'],'Age': [20,25,30],'Height': [155,160,175],'Weight': [55,60,75]}
df1 = pd.DataFrame(chart_1)
chart_2 = {'Name':['Pooja','Sindu','Renuka'],'Age': [18,25,20],'Height': [145,155,165],'Weight': [45,55,65]}
df2 = pd.DataFrame(chart_2)
Calcular a correlação usando o método corrwith()
Podemos usar o método corrwith() para calcular a correlação entre os dois DataFrames.
df1.corrwith(df2)
Especificar o método de correlação
Por padrão, o método corrwith() usa o coeficiente de correlação de Pearson. No entanto, podemos especificar o método de correlação usando o parâmetro method.
df1.corrwith(df2, method='kendall')
Resumo
Neste laboratório, aprendemos como usar o método corrwith() na biblioteca Pandas para calcular a correlação em pares (pairwise correlation) entre dois DataFrames. Este método é útil para encontrar a correlação entre diferentes colunas em dois conjuntos de dados. Ao especificar o método de correlação, podemos calcular os coeficientes de correlação de Pearson, Kendall ou Spearman. Isso nos ajuda a entender as relações entre as variáveis e a tomar decisões baseadas em dados.