Pandas 데이터 조작 기본

Beginner

This tutorial is from open-source community. Access the source code

소개

이 Python Pandas Lab 은 Python 에서 강력한 데이터 조작 도구인 pandas 라이브러리의 기본적인 연산을 소개하는 것을 목표로 합니다. 이 랩을 통해 pandas 에 대한 이해를 굳건히 하기 위해 다양한 예제와 코드 조각을 사용하게 됩니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 연산의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

Pandas 임포트

먼저, pandas 라이브러리를 임포트해야 합니다. 다음 명령을 사용하여 수행할 수 있습니다.

## pandas 라이브러리 임포트
import pandas as pd
import numpy as np

DataFrame 생성

다음으로, 잠재적으로 서로 다른 유형의 열을 가진 2 차원 레이블 데이터 구조인 DataFrame 을 생성합니다. DataFrame 은 일반적으로 가장 일반적으로 사용되는 pandas 객체입니다.

## 딕셔너리로 DataFrame 생성
df = pd.DataFrame({'A': [1, 2, 3]})

DataFrame 이해

이제 방금 생성한 DataFrame 에 대해 더 자세히 알아보겠습니다.

## DataFrame 표시
print(df)

## DataFrame 정보
df.info()

결측 데이터 처리

Pandas 는 데이터를 정리하고 결측값을 채우기 위한 다양한 방법을 제공합니다.

## 결측값을 가진 DataFrame 생성
df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [5, np.nan, np.nan], 'C': [1, 2, 3]})

## 결측값 채우기
df.fillna(value=0, inplace=True)

데이터 시각화

Pandas 는 Matplotlib 라이브러리와의 통합을 통해 데이터 시각화를 제공합니다.

## matplotlib 라이브러리 임포트
import matplotlib.pyplot as plt

## 그래프 그리기
df['A'].plot()
plt.show()

요약

이 랩에서는 Python 의 pandas 라이브러리의 기본 사항을 다루었습니다. 여기에는 라이브러리 가져오기, DataFrame 생성 및 조작, 결측 데이터 처리, 데이터 시각화 등이 포함됩니다. 이러한 기술은 Python 에서 모든 데이터 분석 작업의 기본이며, pandas 에 능숙해지면 데이터를 효과적으로 처리하고 분석할 수 있습니다.