Pandas DataFrame between_time 메서드 사용법

Beginner

소개

이 랩에서는 Pandas DataFrame 의 between_time() 메서드를 사용하는 방법을 배우겠습니다. 이 메서드를 사용하면 특정 시간대의 값을 선택할 수 있습니다. DataFrame 에서 특정 시간 기반 데이터를 필터링하고 추출하는 데 사용할 수 있습니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리 가져오기

between_time() 메서드를 사용하기 전에 필요한 라이브러리를 가져와야 합니다. 이 랩에서는 Pandas 라이브러리를 사용합니다.

import pandas as pd

DataFrame 생성

다음으로, 시간 기반 데이터를 포함하는 DataFrame 을 생성해 보겠습니다. Pandas 의 date_range() 함수를 사용하여 일련의 날짜를 생성한 다음, 이를 DataFrame 의 인덱스로 설정할 수 있습니다.

values = pd.date_range('2021-01-01', periods=4, freq='20T')
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [1, 2, 3, 4]}, index=values)

특정 시간 범위 내 값 선택

이제 DataFrame 이 있으므로 between_time() 메서드를 사용하여 특정 시작 및 종료 시간 사이의 값을 선택해 보겠습니다. 시작 및 종료 시간을 메서드의 인수로 전달하기만 하면 됩니다. 이 메서드는 지정된 시간 사이에 속하는 행만 포함하는 새로운 DataFrame 을 반환합니다.

df_selected = df.between_time('00:00', '01:00')

include_start 및 include_end 매개변수 사용자 정의

between_time() 메서드는 또한 include_startinclude_end 매개변수를 사용자 정의할 수 있도록 합니다. 기본적으로 이러한 매개변수는 True로 설정되어 있으며, 이는 시작 및 종료 시간이 결과에 포함된다는 의미입니다.

df_selected = df.between_time('00:00', '01:00', include_start=False, include_end=False)

DatetimeIndex 오류 처리

DataFrame 의 인덱스가 DatetimeIndex가 아닌 경우, between_time() 메서드는 TypeError를 발생시킵니다. 이 오류를 방지하려면 DataFrame 의 인덱스가 DatetimeIndex인지 확인하십시오.

df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [1, 2, 3, 4]}, index=[1, 2, 3, 4])
## This will raise a TypeError
df_selected = df.between_time('00:00', '01:00')

요약

이 랩에서는 Pandas DataFrame 에서 between_time() 메서드를 사용하는 방법을 배웠습니다. 이 메서드를 사용하면 특정 시간대의 값을 선택할 수 있습니다. 시작 및 종료 시간, 그리고 시작 및 종료 시간의 포함 여부를 사용자 정의하여 DataFrame 에서 특정 시간 기반 데이터를 필터링하고 추출할 수 있습니다. TypeError 오류를 방지하려면 DataFrame 의 인덱스가 DatetimeIndex인지 확인하는 것이 중요합니다. 이 메서드는 시계열 데이터를 분석하고 데이터 세트에서 특정 기간을 추출하는 등 다양한 응용 분야에서 유용할 수 있습니다.