
处理时间增量
本实验指导你使用 pandas 库在 Python 中处理时间增量的过程。时间增量表示持续时间或时间差。我们将探索构建、操作和处理时间增量的不同方法。
PythonPandas

在 Pandas 中使用稀疏结构
本实验将指导你如何在 pandas 库中使用稀疏数据结构。这在我们有大量数据,其中大部分数据相似(如零或 NaN)的情况下非常有用,因此可以在内存中更有效地表示。我们将学习 SparseArray、SparseDtype、稀疏访问器、稀疏计算以及与 scipy 稀疏矩阵的交互。
PythonPandas

使用 Pandas 进行数据重塑
在数据分析中,经常会遇到数据排列不符合我们需求的数据集。数据重塑指的是改变数据在行和列中的组织方式的过程。在本实验中,我们将探索 Pandas 中一些用于数据重塑的关键方法,包括透视(Pivot)、堆叠(Stack)、拆栈(Unstack)、熔化(Melt)、交叉制表、平铺(Tiling)、因式分解(Factorizing)和爆炸(Exploding)。
PythonPandas

在 Pandas 中处理文本数据
本实验介绍如何在 Pandas 中处理文本数据。我们将学习如何存储文本数据、使用字符串方法进行数据预处理和转换,以及使用正则表达式提取子字符串。我们还将学习如何为机器学习算法创建虚拟变量。
PythonPandas

使用 PyArrow 增强 Pandas
本实验将指导你完成在 Pandas 中使用 PyArrow 的过程,以扩展功能并提升各种 API 的性能。PyArrow 通过更广泛的数据类型、对所有数据类型的缺失数据支持、IO 读取器集成以及与其他数据框库的互操作性来增强 Pandas。
PythonPandas

扩展大型数据集
本实验重点介绍如何使用 pandas 将数据分析扩展到更大的数据集。它涵盖了诸如加载更少数据、使用高效数据类型、分块以及利用像 Dask 这样的其他库等方法。需要注意的是,pandas 更适合内存内分析,对于非常大的数据集可能不是最佳工具。
PandasPython

Pandas 中的窗口操作
在本实验中,我们将探索 pandas 中的窗口操作,包括滚动窗口、扩展窗口和指数加权窗口。窗口操作对于在值的滑动分区上执行聚合很有用。
PythonPandas

处理缺失数据
在本实验中,我们将学习如何处理 pandas 中的缺失数据,这是数据分析中常见的问题。我们将介绍如何识别缺失数据、填充缺失值以及删除不需要的数据。我们还将讨论 pandas 中可用于表示缺失值的实验性 NA 标量。
PythonPandas

处理可空整数
在本实验中,我们将探索如何在 pandas 中使用可空整数数据类型,这是一种处理可能包含缺失值的整数数据的有效方法。我们将学习如何使用这种数据类型构建数组、执行操作以及有效地处理缺失值。
PythonPandas

Pandas 数据操作基础
本 Python Pandas 实验旨在向你介绍 pandas 库的基本操作,它是 Python 中一个强大的数据操作工具。在整个实验过程中,你将通过大量示例和代码片段来巩固对 pandas 的理解。
PythonPandas

Pandas 基础:DataFrame 内存与操作
欢迎来到 Pandas 基础实验!在本实验中,我们将探索 Pandas 库的一些基本方面:DataFrame 的内存使用、处理 if/真值语句、使用用户定义函数 (UDF) 方法、处理 NA 值、与 NumPy 的差异以及线程安全注意事项。
PythonPandas

处理重复标签
在本实验中,我们将学习如何在 pandas 中处理重复标签。Pandas 是 Python 中一个强大的数据处理库。我们经常会遇到带有重复行或列标签的数据,了解如何检测和处理这些重复项至关重要。
PythonPandas

使用 Pandas 中的数据结构
Pandas 是一个强大的用于数据处理和分析的 Python 库。其基本数据结构 Series 和 DataFrame 使你能够存储和处理结构化数据。本实验将提供一份关于如何使用这些数据结构的详细指南,从创建到操作和对齐。
PythonPandas

Pandas 写时复制实现指南
本实验提供了一份循序渐进的指南,用于理解和在 Python 的 Pandas 中实现写时复制(Copy-On-Write,简称 CoW)的概念。CoW 是一种优化策略,通过尽可能延迟复制来提高性能和内存使用效率。它还有助于避免意外修改多个对象。
PythonPandas

处理可空布尔数据
在本实验中,我们将探索 Python 中 Pandas 库提供的可空布尔数据类型。我们将学习如何在索引和逻辑运算中使用此功能,以及由于存在'NA'值,它与传统布尔运算有何不同。
PythonPandas

Pandas 简介
在本实验中,我们将向你介绍 Pandas 的基础知识,Pandas 是 Python 中一个强大的数据处理库。我们将指导你完成各种任务,例如导入 Pandas、创建和查看数据、数据选择、操作等等。
PythonPandas

Pandas 文本数据
在本实验中,我们将探索如何使用 Python 的 Pandas 库来处理文本数据。你将学习如何使用各种内置的 Pandas 方法将字符串字符转换为小写、提取字符串的部分内容、替换字符串值等等。
PythonPandas

使用 Pandas 重塑数据
在本实验中,我们将探索如何使用 sort_values、pivot、pivot_table 和 melt 等各种函数在 pandas 中重塑数据。我们将使用泰坦尼克号和空气质量数据集来演示重塑技术。
PythonPandas