Метод count() для DataFrame в Pandas

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии мы узнаем о методе count() класса Pandas DataFrame. Метод count() используется для подсчета количества непустых значений в DataFrame, либо для каждой колонки, либо для каждой строки.

Советы по работе с ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки

Сначала импортируем необходимые библиотеки для этого практического занятия:

import pandas as pd
import numpy as np

Создаем DataFrame

Далее создадим DataFrame, который будем использовать для примеров в этом практическом занятии. Нашем DataFrame будут содержать информацию о студентах, таких как их имена, номера зачетных книжек, предметы и оценки.

df = pd.DataFrame([
    ['Abhishek', '101', 'Science', 90],
    ['Anurag', '102', None, 85]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

Подсчитываем количество непустых значений для каждой колонки

Для подсчета количества непустых значений для каждой колонки в DataFrame мы можем использовать метод count() без каких-либо параметров. Это вернет объект Series, где индекс представляет имена колонок, а значения - количество непустых значений в каждой колонке.

column_counts = df.count()
print(column_counts)

Результат:

Name       2
Roll No    2
Subject    1
Marks      2
dtype: int64

Подсчитываем количество непустых значений для каждой строки

Для подсчета количества непустых значений для каждой строки в DataFrame мы можем использовать метод count() с параметром axis, установленным в 1. Это вернет объект Series, где индекс представляет номера строк, а значения - количество непустых значений в каждой строке.

row_counts = df.count(axis=1)
print(row_counts)

Результат:

0    4
1    3
dtype: int64

Подсчитываем количество числовых непустых значений для каждой строки

Если мы хотим подсчитывать только числовые непустые значения для каждой строки, мы можем использовать метод count() с параметром numeric_only, установленным в True. Это будет учитывать только колонки с числовыми типами данных (float, int) и исклюать колонки с нечисловыми типами данных (object).

numeric_counts = df.count(numeric_only=True)
print(numeric_counts)

Результат:

Roll No    2
Marks      2
dtype: int64

Резюме

Поздравляем! Вы успешно завершили это практическое занятие по методу count() для DataFrame в Pandas. В этом практическом занятии вы узнали, как подсчитывать количество непустых значений в DataFrame для каждой колонки или строки с использованием метода count(). Также вы узнали, как подсчитывать только числовые непустые значения с использованием параметра numeric_only. Продолжайте практиковаться и изучать разные методы библиотеки Pandas, чтобы стать более опытным в анализе и манипуляции данными с использованием Python. Удачной разработки!