Метод dropna для DataFrame в Pandas

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии мы узнаем о методе dropna() для DataFrame в pandas. Этот метод используется для удаления пропущенных значений из DataFrame путём удаления строк или столбцов, содержащих значения null или NaN.

Советы по работе с ВМ

После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем библиотеку pandas

Прежде чем начать, нам нужно импортировать библиотеку pandas. Для этой библиотеки мы будем использовать псевдоним pd.

import pandas as pd

Создаем DataFrame

Создадим DataFrame, содержащий некоторые пропущенные значения.

df = pd.DataFrame([
    ['Abhishek', 100, 'Science', None],
    ['Anurag', 101, 'Science', 85],
    ['Chetan', 103, 'Maths', None]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

Используем метод dropna() для удаления строк с пропущенными значениями

Мы можем использовать метод dropna(), чтобы удалить строки, содержащие пропущенные значения. По умолчанию он удаляет любую строку, которая содержит хотя бы одно значение null или NaN.

df_dropped = df.dropna()

Отобразим результат

Распечатайте исходный DataFrame и результирующий DataFrame после удаления строк с пропущенными значениями.

print("Original DataFrame:")
print(df)

print("DataFrame after dropping rows with missing values:")
print(df_dropped)

Резюме

В этом практическом занятии мы узнали о методе dropna() библиотеки pandas для DataFrame, который используется для удаления строк или столбцов с пропущенными значениями. Удаляя эти пропущенные значения, мы можем очистить наш DataFrame и сделать его пригодным для дальнейшего анализа. Помните, что этот метод изменяет DataFrame и по умолчанию возвращает новый DataFrame, но мы также можем выбрать изменить DataFrame "на месте", установив параметр inplace в значение True.