简介
本实验着重于理解如何配置和定制与 Pandas DataFrame 显示、数据行为等相关的全局行为。我们将探索如何获取/设置选项、将选项重置为默认值以及描述选项。我们还将学习如何使用一组选项执行代码块,这些选项在执行后会恢复到先前的设置。
虚拟机提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们会立即为你解决问题。
导入 Pandas
让我们从导入 Pandas 库开始。这是 Python 中一个强大的数据处理库。
## 导入 pandas 库
import pandas as pd
获取和设置选项
我们可以分别使用 pd.get_option 或 pd.set_option 来获取或设置单个选项的值。在这里,我们将最大显示行数设置为 999。
## 获取当前最大显示行数的设置
print(pd.options.display.max_rows)
## 将最大显示行数设置为 999
pd.options.display.max_rows = 999
## 验证新设置
print(pd.options.display.max_rows)
重置选项
如果我们希望将一个或多个选项重置为其默认值,可以使用 pd.reset_option。
## 将最大显示行数重置为默认值
pd.reset_option("display.max_rows")
## 验证重置
print(pd.options.display.max_rows)
描述选项
要打印一个或多个选项的描述,请使用 pd.describe_option。
## 描述'display.max_rows'选项
pd.describe_option("display.max_rows")
使用 option_context
option_context 函数允许我们在一组选项的环境下执行一个代码块,这些选项在执行后会恢复到之前的设置。
## 使用一组选项执行一个代码块
with pd.option_context("display.max_rows", 10):
## 尽管全局设置不同,这里仍会打印 10
print(pd.get_option("display.max_rows"))
## 由于上下文块已结束,这里会打印全局设置
print(pd.get_option("display.max_rows"))
设置启动选项
你可以在 Python/IPython 环境中创建一个启动脚本,用于导入 pandas 并设置选项,这能让使用 pandas 更加高效。
## 这是一个启动脚本的示例
## 将此脚本放在 IPython 配置文件的启动目录下的一个.py 文件中
import pandas as pd
pd.set_option("display.max_rows", 999)
pd.set_option("display.precision", 5)
总结
本实验指南解释了如何在 pandas 中获取、设置和重置选项。我们还讨论了如何描述选项以及使用 option_context 函数。最后,我们探讨了如何在 Python/IPython 环境中设置启动选项。这些技术使我们能够根据自身需求定制和配置 pandas 的行为。