Método between_time de DataFrame de Pandas

Beginner

Introducción

En este laboratorio, aprenderemos a usar el método between_time() en un DataFrame de Pandas. Este método nos permite seleccionar valores entre determinados momentos del día. Puede usarse para filtrar y extraer datos específicos basados en el tiempo de un DataFrame.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos rápidamente el problema para usted.

Importar las bibliotecas necesarias

Antes de poder usar el método between_time(), necesitamos importar las bibliotecas necesarias. En este laboratorio, usaremos la biblioteca Pandas.

import pandas as pd

Crear un DataFrame

A continuación, creemos un DataFrame que contenga datos basados en el tiempo. Podemos usar la función date_range() de Pandas para generar una secuencia de fechas y luego establecerla como el índice del DataFrame.

values = pd.date_range('2021-01-01', periods=4, freq='20T')
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [1, 2, 3, 4]}, index=values)

Seleccionar valores entre un momento específico

Ahora que tenemos nuestro DataFrame, usemos el método between_time() para seleccionar valores entre un momento de inicio y un momento de finalización específicos. Simplemente podemos pasar el momento de inicio y el momento de finalización como argumentos al método. El método devolverá un nuevo DataFrame que contendrá solo las filas que se encuentran entre los momentos especificados.

df_selected = df.between_time('00:00', '01:00')

Personalizar los parámetros include_start e include_end

El método between_time() también nos permite personalizar los parámetros include_start e include_end. Por defecto, estos parámetros se establecen en True, lo que significa que los momentos de inicio y finalización se incluyen en el resultado.

df_selected = df.between_time('00:00', '01:00', include_start=False, include_end=False)

Manejar el error de no ser un DatetimeIndex

Si el índice del DataFrame no es un DatetimeIndex, el método between_time() generará un error TypeError. Para evitar este error, asegúrese de que el índice de su DataFrame sea un DatetimeIndex.

df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [1, 2, 3, 4]}, index=[1, 2, 3, 4])
## Esto generará un TypeError
df_selected = df.between_time('00:00', '01:00')

Resumen

En este laboratorio, aprendimos cómo usar el método between_time() en un DataFrame de Pandas. Este método nos permite seleccionar valores entre momentos particulares del día. Podemos personalizar los momentos de inicio y finalización, así como la inclusión del momento de inicio y finalización, para filtrar y extraer datos específicos basados en el tiempo de un DataFrame. Es importante asegurar que el índice del DataFrame sea un DatetimeIndex para evitar errores TypeError. Este método puede ser útil en diversas aplicaciones, como el análisis de datos de series de tiempo y la extracción de períodos de tiempo específicos de un conjunto de datos.