Введение
В этом практическом занятии мы научимся использовать метод filter() в DataFrame библиотеки Pandas. Метод filter() позволяет выбирать строки или столбцы DataFrame на основе заданных меток индекса. Важно отметить, что этот метод фильтрует DataFrame на основе меток индекса, а не содержимого DataFrame.
Советы по виртуальной машине
После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если у вас возникнут проблемы во время обучения, не стесняйтесь обращаться к Labby. После занятия оставьте отзыв, и мы оперативно решим проблему для вас.
Создание DataFrame
Сначала создадим пример DataFrame для работы.
#import pandas as pd
import pandas as pd
#creating DataFrame
df=pd.DataFrame({
"Name":["Navya","Vindya","Sinchana","Amrutha","Akshatha"],
"Age":[25,24,25,25,26],
"Education":["M.Tech","M.Tech","M.Tech","Ph.d","Ph.d"],
"YOP":[2019,2020,2018,None,None]},
index=["Group_1", "Group_1","Group_1","Group_2","Group_2"])
#printing DataFrame
print("-------DataFrame is----------")
print(df)
Фильтрация по именам столбцов с использованием метода filter()
Мы можем использовать параметр items метода filter() для фильтрации DataFrame по определенным столбцам.
#filter by column names
filtered_df = df.filter(items=["Name","Education"])
#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)
Фильтрация по именам строк с использованием метода filter()
Мы можем использовать параметр like метода filter() для фильтрации DataFrame по определенным строкам.
#filter by row names
filtered_df = df.filter(like='Group_2', axis=0)
#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)
Фильтрация по именам столбцов с использованием параметра regex
Мы можем использовать параметр regex метода filter() для фильтрации DataFrame по определенным столбцам на основе регулярного выражения.
#filter by column names with regex
filtered_df = df.filter(regex ='[g]')
#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)
Резюме
В этом практическом занятии (лабораторной работе) мы научились использовать метод filter() в Pandas DataFrame. Мы рассмотрели, как фильтровать DataFrame по именам столбцов и строк, а также как фильтровать на основе регулярного выражения. Этот метод полезен для создания подмножества DataFrame на основе определенных меток индекса.