Метод фильтрации Pandas DataFrame

Beginner

Введение

В этом практическом занятии мы научимся использовать метод filter() в DataFrame библиотеки Pandas. Метод filter() позволяет выбирать строки или столбцы DataFrame на основе заданных меток индекса. Важно отметить, что этот метод фильтрует DataFrame на основе меток индекса, а не содержимого DataFrame.

Советы по виртуальной машине

После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если у вас возникнут проблемы во время обучения, не стесняйтесь обращаться к Labby. После занятия оставьте отзыв, и мы оперативно решим проблему для вас.

Создание DataFrame

Сначала создадим пример DataFrame для работы.

#import pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({
    "Name":["Navya","Vindya","Sinchana","Amrutha","Akshatha"],
    "Age":[25,24,25,25,26],
    "Education":["M.Tech","M.Tech","M.Tech","Ph.d","Ph.d"],
    "YOP":[2019,2020,2018,None,None]},
    index=["Group_1", "Group_1","Group_1","Group_2","Group_2"])

#printing DataFrame
print("-------DataFrame is----------")
print(df)

Фильтрация по именам столбцов с использованием метода filter()

Мы можем использовать параметр items метода filter() для фильтрации DataFrame по определенным столбцам.

#filter by column names
filtered_df = df.filter(items=["Name","Education"])

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Фильтрация по именам строк с использованием метода filter()

Мы можем использовать параметр like метода filter() для фильтрации DataFrame по определенным строкам.

#filter by row names
filtered_df = df.filter(like='Group_2', axis=0)

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Фильтрация по именам столбцов с использованием параметра regex

Мы можем использовать параметр regex метода filter() для фильтрации DataFrame по определенным столбцам на основе регулярного выражения.

#filter by column names with regex
filtered_df = df.filter(regex ='[g]')

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Резюме

В этом практическом занятии (лабораторной работе) мы научились использовать метод filter() в Pandas DataFrame. Мы рассмотрели, как фильтровать DataFrame по именам столбцов и строк, а также как фильтровать на основе регулярного выражения. Этот метод полезен для создания подмножества DataFrame на основе определенных меток индекса.