はじめに
この実験では、pandas を使用してデータ分析をより大きなデータセットに拡張する方法に焦点を当てます。データの部分的な読み込み、効率的なデータ型の使用、チャンク分割、および Dask などの他のライブラリの活用などの手法をカバーしています。pandas はメモリ内分析に適しており、非常に大きなデータセットには必ずしも最適なツールではないことに注意することが重要です。
VM のヒント
VM の起動が完了したら、左上隅をクリックして Notebook タブに切り替え、Jupyter Notebook を開いて練習を行ってください。
時々、Jupyter Notebook の読み込みが完了するまで数秒待つ必要がある場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題が発生した場合は、Labby に質問してください。セッション終了後にフィードバックを提供していただければ、迅速に問題を解決します。