소개
이 프로젝트에서는 불완전하고, 부정확하며, 유효하지 않은 데이터를 제거하여 CSV 데이터를 정리하고 정제하는 방법을 배우게 됩니다. 목표는 원시 데이터로부터 깨끗한 데이터 세트를 생성하여 추가 분석 또는 처리에 사용할 수 있도록 하는 것입니다.
🎯 과제
이 프로젝트에서 다음을 배우게 됩니다:
- 프로젝트 환경을 설정하고 필요한 파일을 준비하는 방법
- 데이터 정리에 필요한 라이브러리를 가져오는 방법
- 다양한 유형의 더러운 데이터를 확인하면서 원시 데이터를 읽고 처리하는 방법
- 정리된 데이터를 새로운 CSV 파일에 쓰는 방법
🏆 성과
이 프로젝트를 완료하면 다음을 수행할 수 있습니다:
- Python 과 표준 라이브러리를 사용하여 CSV 데이터를 처리할 수 있습니다.
- 누락된 값, 유효하지 않은 형식 및 비현실적인 데이터 등을 확인하는 데이터 유효성 검사 및 정리 기술을 적용할 수 있습니다.
- 고품질 데이터 세트를 생성하기 위해 데이터 정리 프로세스를 구현할 수 있습니다.
- 정리된 데이터로 새로운 CSV 파일을 생성할 수 있습니다.





