Pandas DataFrame insert 메서드

Beginner

소개

이 랩에서는 Python 의 pandas 라이브러리에서 DataFrame.insert() 메서드를 사용하는 방법을 배우겠습니다. 이 메서드를 사용하면 DataFrame 에 열을 지정된 위치에 삽입할 수 있습니다. 또한 중복 열을 허용할지 여부를 선택할 수도 있습니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수도 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

pandas 라이브러리 가져오기

DataFrame 작업을 가능하게 해주는 pandas 라이브러리를 먼저 가져오겠습니다.

import pandas as pd

DataFrame 생성

다음으로, 작업할 DataFrame 을 생성해 보겠습니다. 이 예제에서는 'A'와 'B' 두 개의 열과 네 개의 행을 가진 DataFrame 을 생성합니다.

df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]})

DataFrame 에 새로운 열 추가

이제 DataFrame 의 인덱스 2 에 'C'라는 새로운 열을 삽입해 보겠습니다. 이 열의 값을 모든 행에 대해 1 로 설정합니다.

df.insert(2, 'C', 1)

DataFrame 출력

업데이트된 DataFrame 을 확인하기 위해 print() 함수를 사용하여 출력해 보겠습니다.

print(df)

Series 를 열로 삽입

또는, Series 객체를 DataFrame 의 열로 삽입할 수 있습니다. 값 [1, 2, 3, 4]를 가진 새로운 Series 객체를 생성하고 DataFrame 의 인덱스 0 에 삽입해 보겠습니다.

series = pd.Series([1, 2, 3, 4])
df.insert(0, 'C', series)

DataFrame 출력

다시 한 번, 변경 사항을 확인하기 위해 DataFrame 을 출력해 보겠습니다.

print(df)

중복 열 처리

기본적으로, DataFrame.insert() 메서드는 DataFrame 에 이미 존재하는 레이블을 가진 열을 삽입하려고 하면 ValueError 를 발생시킵니다. 하지만, allow_duplicates를 True 로 설정하여 이 동작을 재정의할 수 있습니다. 중복 레이블을 가진 열을 삽입하고 결과를 확인해 보겠습니다.

df.insert(2, 'A', 1, allow_duplicates = True)

DataFrame 출력

중복 열 삽입을 시도한 후, 오류 메시지를 확인하기 위해 DataFrame 을 출력해 보겠습니다.

print(df)

요약

이 랩에서는 pandas 의 DataFrame.insert() 메서드를 사용하여 DataFrame 에 새로운 열을 특정 위치에 삽입하는 방법을 배웠습니다. 상수 값과 Series 객체를 사용하여 열을 삽입하는 방법을 배웠습니다. 또한 열을 삽입할 때 중복을 처리하는 방법도 살펴보았습니다. 이 메서드는 새로운 기능을 추가하거나 DataFrame 의 구조를 수정해야 할 때 유용합니다.