курс в Pandas Skill Tree

Pandas для начинающих

Начинающий

Этот комплексный курс охватывает фундаментальные концепции и практические методы Pandas, основной библиотеки для манипулирования и анализа данных в Python. Научитесь эффективно создавать, обрабатывать и анализировать данные с помощью DataFrames и Series.

pandaspythondata-science

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Добро пожаловать на курс Pandas для начинающих! Этот комплексный курс разработан специально для новичков в Pandas, фундаментальной библиотеке для манипулирования и анализа данных в Python. С помощью практических лабораторных работ вы освоите основные навыки, необходимые для работы с DataFrames и Series, выполнения операций с данными и построения прочной основы для анализа данных и машинного обучения.

🎯 Цели обучения

В этом курсе вы научитесь:

  • Введение в Pandas и настройка: Начните с установки Pandas и основных концепций
  • Создание DataFrames: Освойте различные методы создания Pandas DataFrames из разных источников
  • Чтение внешних данных: Научитесь читать данные из CSV, Excel, SQL баз данных и других форматов
  • Выборка данных: Поймите различные методы доступа и манипулирования данными DataFrame
  • Фильтрация данных: Применяйте условную фильтрацию для извлечения конкретных подмножеств данных
  • Сортировка данных: Научитесь сортировать данные по одному или нескольким столбцам
  • Базовая очистка данных: Обработка пропущенных значений, дубликатов и преобразование типов данных
  • Описательная статистика: Генерация сводных статистик и понимание распределений данных
  • Группировка и агрегация: Применение групповых операций и агрегаций для анализа данных

🏆 Чего вы достигнете

После завершения этого курса вы сможете:

  • Настроить Pandas и понять его основные структуры данных (DataFrames и Series)
  • Создавать DataFrames из различных источников, включая списки, словари и внешние файлы
  • Читать и импортировать данные из множества форматов, включая CSV, Excel, JSON и базы данных
  • Выбирать, срезать и манипулировать данными, используя различные методы индексации
  • Применять условия фильтрации для извлечения конкретных подмножеств данных из больших наборов данных
  • Эффективно сортировать данные по одному или нескольким столбцам с пользовательскими критериями
  • Выполнять базовые операции по очистке данных, включая обработку пропущенных значений и дубликатов
  • Генерировать описательную статистику для понимания распределений и закономерностей данных
  • Применять операции группировки и агрегации для продвинутого анализа данных
  • Построить прочную основу для проектов в области науки о данных, машинного обучения и аналитики

Преподаватель

labby
Labby
Labby is the LabEx teacher.