프로젝트 의 Python 스킬 트리

Python 을 이용한 데이터 정제 및 정화

초급

본 프로젝트에서는 불완전하고, 부정확하며, 유효하지 않은 데이터를 제거하여 CSV 데이터를 정제하고 정화하는 방법을 배우게 됩니다. 목표는 원시 데이터로부터 깨끗한 데이터 세트를 생성하여 추가 분석 또는 처리에 사용할 수 있도록 하는 것입니다.

pythondata-science

💡 이 튜토리얼은 영어로 번역되었습니다. 원본을 보려면 영어로 전환

소개

이 프로젝트에서는 불완전하고, 부정확하며, 유효하지 않은 데이터를 제거하여 CSV 데이터를 정리하고 정제하는 방법을 배우게 됩니다. 목표는 원시 데이터로부터 깨끗한 데이터 세트를 생성하여 추가 분석 또는 처리에 사용할 수 있도록 하는 것입니다.

🎯 과제

이 프로젝트에서 다음을 배우게 됩니다:

  • 프로젝트 환경을 설정하고 필요한 파일을 준비하는 방법
  • 데이터 정리에 필요한 라이브러리를 가져오는 방법
  • 다양한 유형의 더러운 데이터를 확인하면서 원시 데이터를 읽고 처리하는 방법
  • 정리된 데이터를 새로운 CSV 파일에 쓰는 방법

🏆 성과

이 프로젝트를 완료하면 다음을 수행할 수 있습니다:

  • Python 과 표준 라이브러리를 사용하여 CSV 데이터를 처리할 수 있습니다.
  • 누락된 값, 유효하지 않은 형식 및 비현실적인 데이터 등을 확인하는 데이터 유효성 검사 및 정리 기술을 적용할 수 있습니다.
  • 고품질 데이터 세트를 생성하기 위해 데이터 정리 프로세스를 구현할 수 있습니다.
  • 정리된 데이터로 새로운 CSV 파일을 생성할 수 있습니다.

강사

labby
Labby
Labby is the LabEx teacher.