Метод dropna для DataFrame в Pandas

Beginner

Введение

В этом практическом занятии мы узнаем о методе dropna() для DataFrame в pandas. Этот метод используется для удаления пропущенных значений из DataFrame путём удаления строк или столбцов, содержащих значения null или NaN.

Советы по работе с ВМ

После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортировать библиотеку pandas

Прежде чем начать, нам нужно импортировать библиотеку pandas. Для этой библиотеки мы будем использовать псевдоним pd.

import pandas as pd

Создать DataFrame

Создадим DataFrame, содержащий некоторые пропущенные значения.

df = pd.DataFrame([
    ['Abhishek', 100, 'Science', None],
    ['Anurag', 101, 'Science', 85],
    ['Chetan', 103, 'Maths', None]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

Использовать метод dropna() для удаления строк с пропущенными значениями

Мы можем использовать метод dropna(), чтобы удалить строки, содержащие пропущенные значения. По умолчанию он удаляет любую строку, которая содержит хотя бы одно значение null или NaN.

df_dropped = df.dropna()

Показать результат

Распечатайте исходный DataFrame и результирующий DataFrame после удаления строк с пропущенными значениями.

print("Original DataFrame:")
print(df)

print("DataFrame after dropping rows with missing values:")
print(df_dropped)

Резюме

В этом практическом занятии мы узнали о методе dropna() библиотеки pandas для DataFrame, который используется для удаления строк или столбцов с пропущенными значениями. Удаляя эти пропущенные значения, мы можем очистить наш DataFrame и сделать его пригодным для дальнейшего анализа. Помните, что этот метод изменяет DataFrame и по умолчанию возвращает новый DataFrame, но мы также можем выбрать изменить DataFrame "на месте", установив параметр inplace в значение True.