Введение
В этом практическом занятии мы изучим метод DataFrame.iterrows() библиотеки Python Pandas. Этот метод позволяет итерироваться по строкам объекта DataFrame, возвращая индекс и данные каждой строки.
Советы по работе с ВМ
После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Создать DataFrame
Сначала нам нужно создать DataFrame, с которым будем работать. Создадим простой DataFrame с использованием библиотеки Pandas.
#importing pandas as pd
import pandas as pd
#creating DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['id001', 'id002'])
Итерироваться по строкам с использованием метода iterrows()
Для итерирования по строкам DataFrame мы можем использовать метод iterrows(). Этот метод возвращает объект-генератор, содержащий кортеж из индекса и данных для каждой строки.
#print the DataFrame
print("The DataFrame is:")
print(df)
#print the generator object
print("Iterate over rows:")
print(df.iterrows())
Использовать цикл for для доступа к строкам
Для доступа к индексу и данным каждой строки мы можем использовать цикл for. Данные строки можно получить с помощью переменной row_data, а индекс - с помощью переменной row_index.
#for loop to iterate over rows
print("Iterate over rows:")
for row_index, row_data in df.iterrows():
print("Index:", row_index)
print("Data:", row_data)
Доступ к конкретным данным из строки
Мы также можем получить доступ к конкретным данным из строки, указав номер индекса. Распечатаем значение столбца "Name" для каждой строки.
#for loop to access the "Name" column for each row
print("Accessing specific data:")
for row_index, row_data in df.iterrows():
print("Name:", row_data['Name'])
Резюме
В этом практическом занятии мы узнали, как использовать метод iterrows() в Pandas для итерирования по строкам DataFrame. Мы изучили, как получить доступ к индексу и данным каждой строки с использованием цикла for, а также как получить доступ к конкретным данным из строки. Метод iterrows() - это полезный инструмент для анализа и манипуляции данными в DataFrame.