Метод info() для DataFrame в Pandas

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

Метод info() в библиотеке Python Pandas используется для получения сводки по DataFrame. Он предоставляет ценную информацию о DataFrame, включая тип данных индекса и столбцов, непустые значения и использование памяти.

Советы по работе с ВМ

После завершения запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки

Во - первых, нам нужно импортировать библиотеку pandas, которая является мощной библиотекой для манипуляций с данными в Python.

import pandas as pd

Создаем DataFrame

Далее, нам нужно создать DataFrame. Мы можем сделать это, используя функцию pd.DataFrame() и передав в нее словарь с данными.

int_values = [1, 2, 3, 4, 5]
text_values = ['alpha', 'beta', 'gamma', 'delta', 'epsilon']
float_values = [0.0, 0.25, 0.5, 0.75, 1.0]
df = pd.DataFrame({"int_col": int_values, "text_col": text_values, "float_col": float_values})

Используем метод info()

Теперь, когда у нас есть DataFrame, мы можем использовать метод info() для получения сводной информации. По умолчанию метод info() выводит полную сводку по DataFrame.

df.info()

Анализируем вывод

После запуска кода вы увидите сводную информацию о DataFrame, включая тип данных каждого столбца, количество непустых значений и использование памяти. Вот пример вывода:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5 entries, 0 to 4
Data columns (total 3 columns):
 ##   Column    Non-Null Count  Dtype
---  ------    --------------  -----
 0   int_col   5 non-null      int64
 1   text_col  5 non-null      object
 2   float_col 5 non-null      float64
dtypes: float64(1), int64(1), object(1)
memory usage: 248.0+ bytes

Резюме

Метод info() в библиотеке Python Pandas - это полезный метод для быстрого получения сводки по DataFrame. Он предоставляет информацию о типе индекса и столбцах, непустых значениях и использовании памяти. По умолчанию он отображает полную сводку, но вы также можете изменить параметры для настройки вывода. Этот метод полезен для понимания структуры DataFrame, особенно при работе с большими наборами данных. С помощью информации, полученной из info(), вы можете принимать обоснованные решения по очистке, манипуляциям и анализу данных.