프로젝트 의 Python 스킬 트리

레이블을 One-Hot 으로 인코딩

초급

이 프로젝트에서는 단일 레이블 분류 작업에 대한 레이블 데이터에 원 - 핫 인코딩을 수행하는 방법을 배우게 됩니다. 원 - 핫 인코딩은 범주형 변수를 머신 러닝 알고리즘에서 사용할 수 있는 형식으로 변환하는 데 사용되는 일반적인 기술입니다.

pythondata-science

💡 이 튜토리얼은 영어로 번역되었습니다. 원본을 보려면 영어로 전환

소개

이 프로젝트에서는 단일 레이블 분류 작업에 대한 레이블 데이터에 원 - 핫 인코딩 (one-hot encoding) 을 수행하는 방법을 배우게 됩니다. 원 - 핫 인코딩은 범주형 변수를 머신 러닝 알고리즘에서 사용할 수 있는 형식으로 변환하는 데 사용되는 일반적인 기술입니다.

🎯 과제

이 프로젝트에서 다음을 배우게 됩니다:

  • 원 - 핫 인코딩의 개념과 머신 러닝에서의 중요성을 이해하는 방법.
  • 샘플 레이블 목록에 대해 원 - 핫 인코딩을 수행하는 함수를 구현하는 방법.
  • 샘플 데이터를 사용하여 레이블 인코딩 함수를 테스트하는 방법.

🏆 성과

이 프로젝트를 완료하면 다음을 수행할 수 있습니다:

  • 범주형 레이블을 머신 러닝 모델에 적합한 숫자 형식으로 변환합니다.
  • 머신 러닝 파이프라인에서 데이터 전처리 및 특징 공학 (feature engineering) 의 중요성을 이해합니다.
  • 머신 러닝 작업을 위해 데이터를 조작하고 변환하는 데 필요한 Python 코딩 기술을 실습합니다.

강사

labby
Labby
Labby is the LabEx teacher.