Pandas DataFrame の convert_dtypes メソッド

PandasPandasBeginner
オンラインで実践に進む

💡 このチュートリアルは英語版からAIによって翻訳されています。原文を確認するには、 ここをクリックしてください

はじめに

Python Pandas の DataFrame.convert_dtypes() メソッドは、DataFrame の列を最適なデータ型に変換するために使用されます。混合データ型を含む DataFrame の列を扱う場合や、最適なデータ型でデータを格納することでメモリ使用量を最適化したい場合に特に役立ちます。

VM のヒント

VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替えて、Jupyter Notebook を使って練習しましょう。

Jupyter Notebook の読み込みには数秒かかる場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。

学習中に問題がある場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。

必要なライブラリをインポートして DataFrame を作成する

まず、pandas ライブラリをインポートする必要があります。このライブラリは DataFrame クラスと convert_dtypes() メソッドを提供します。その後、異なるデータ型の列を持つ DataFrame を作成できます。

import pandas as pd

df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': ['d', 'e', 'f'], 'C': [1, 2, 3], 'D': [True, False, True]})

DataFrame の現在のデータ型を確認する

DataFrame の列の現在のデータ型を確認するには、dtypes 属性を使用できます。

print("Current data types:")
print(df.dtypes)

DataFrame の列を最適なデータ型に変換する

DataFrame の列を最適なデータ型に変換するには、convert_dtypes() メソッドを使用できます。デフォルトでは、オブジェクト データ型を最適な型に変換しようとします。たとえば、文字列を含むオブジェクト列に対しては StringDtype に、ブール値を含むオブジェクト列に対しては BooleanDtype に変換します。

df_converted = df.convert_dtypes()

変換後のデータ型を確認する

これで、変換後の DataFrame の列のデータ型を確認できます。

print("Data types after conversion:")
print(df_converted.dtypes)

まとめ

この実験では、Python Pandas の DataFrame.convert_dtypes() メソッドを使って、DataFrame の列を最適なデータ型に変換する方法を学びました。このメソッドは、列に混在するデータ型を扱う場合や、メモリ使用量を最適化する際に役立ちます。列を最適なデータ型に変換することで、データ分析と操作の効率を向上させることができます。