Introdução
Neste laboratório, aprenderemos como usar o método between_time() em um DataFrame do Pandas. Este método nos permite selecionar valores entre horários específicos do dia. Ele pode ser usado para filtrar e extrair dados específicos baseados em tempo de um DataFrame.
Dicas da VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias
Antes de podermos usar o método between_time(), precisamos importar as bibliotecas necessárias. Neste laboratório, usaremos a biblioteca Pandas.
import pandas as pd
Criar um DataFrame
Em seguida, vamos criar um DataFrame que contenha dados baseados em tempo. Podemos usar a função date_range() do Pandas para gerar uma sequência de datas e, em seguida, defini-la como o índice do DataFrame.
values = pd.date_range('2021-01-01', periods=4, freq='20T')
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [1, 2, 3, 4]}, index=values)
Selecionar valores entre um período de tempo específico
Agora que temos nosso DataFrame, vamos usar o método between_time() para selecionar valores entre um horário de início e fim específico. Podemos simplesmente passar o horário de início e fim como argumentos para o método. O método retornará um novo DataFrame contendo apenas as linhas que se enquadram entre os horários especificados.
df_selected = df.between_time('00:00', '01:00')
Personalizar os parâmetros include_start e include_end
O método between_time() também nos permite personalizar os parâmetros include_start e include_end. Por padrão, esses parâmetros são definidos como True, o que significa que os horários de início e fim são incluídos no resultado.
df_selected = df.between_time('00:00', '01:00', include_start=False, include_end=False)
Lidar com o erro non-DatetimeIndex
Se o índice do DataFrame não for um DatetimeIndex, o método between_time() irá lançar um TypeError. Para evitar este erro, certifique-se de que o índice do seu DataFrame é um DatetimeIndex.
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [1, 2, 3, 4]}, index=[1, 2, 3, 4])
## This will raise a TypeError
df_selected = df.between_time('00:00', '01:00')
Resumo
Neste laboratório, aprendemos como usar o método between_time() em DataFrames do Pandas. Este método nos permite selecionar valores entre horários específicos do dia. Podemos personalizar os horários de início e fim, bem como a inclusão dos horários de início e fim, para filtrar e extrair dados específicos baseados em tempo de um DataFrame. É importante garantir que o índice do DataFrame seja um DatetimeIndex para evitar erros de TypeError. Este método pode ser útil em várias aplicações, como analisar dados de séries temporais e extrair períodos de tempo específicos de um conjunto de dados.