Введение
В этом практическом занятии мы узнаем о методе count() класса Pandas DataFrame. Метод count() используется для подсчета количества непустых значений в DataFrame, либо для каждой колонки, либо для каждой строки.
Советы по работе с ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортировать необходимые библиотеки
Сначала импортируем необходимые библиотеки для этого практического занятия:
import pandas as pd
import numpy as np
Создать DataFrame
Далее создадим DataFrame, который будем использовать для примеров в этом практическом занятии. Нашем DataFrame будут содержать информацию о студентах, таких как их имена, номера зачетных книжек, предметы и оценки.
df = pd.DataFrame([
['Abhishek', '101', 'Science', 90],
['Anurag', '102', None, 85]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])
Подсчитать количество непустых значений для каждой колонки
Для подсчета количества непустых значений для каждой колонки в DataFrame мы можем использовать метод count() без каких-либо параметров. Это вернет объект Series, где индекс представляет имена колонок, а значения - количество непустых значений в каждой колонке.
column_counts = df.count()
print(column_counts)
Результат:
Name 2
Roll No 2
Subject 1
Marks 2
dtype: int64
Подсчитать количество непустых значений для каждой строки
Для подсчета количества непустых значений для каждой строки в DataFrame мы можем использовать метод count() с параметром axis, установленным в 1. Это вернет объект Series, где индекс представляет номера строк, а значения - количество непустых значений в каждой строке.
row_counts = df.count(axis=1)
print(row_counts)
Результат:
0 4
1 3
dtype: int64
Подсчитать количество числовых непустых значений для каждой строки
Если мы хотим подсчитывать только числовые непустые значения для каждой строки, мы можем использовать метод count() с параметром numeric_only, установленным в True. Это будет учитывать только колонки с числовыми типами данных (float, int) и исклюать колонки с нечисловыми типами данных (object).
numeric_counts = df.count(numeric_only=True)
print(numeric_counts)
Результат:
Roll No 2
Marks 2
dtype: int64
Резюме
Поздравляем! Вы успешно завершили это практическое занятие по методу count() для DataFrame в Pandas. В этом практическом занятии вы узнали, как подсчитывать количество непустых значений в DataFrame для каждой колонки или строки с использованием метода count(). Также вы узнали, как подсчитывать только числовые непустые значения с использованием параметра numeric_only. Продолжайте практиковаться и изучать разные методы библиотеки Pandas, чтобы стать более опытным в анализе и манипуляции данными с использованием Python. Удачной разработки!