소개
이 실습에서는 숫자가 아닌 입력 데이터 (예: 사전이나 텍스트 문서) 를 실수 벡터로 표현하는 텍스트 벡터화 과정을 살펴봅니다. 사용자 정의 파이썬 함수를 사용하여 사전처리 (토큰화) 된 텍스트 문서를 벡터화하는 두 가지 방법인 FeatureHasher와 DictVectorizer를 비교해 보겠습니다.
VM 팁
VM 시작이 완료되면 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 연습용 Jupyter Notebook에 접근합니다.
때때로 Jupyter Notebook 이 완전히 로드되기까지 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.
학습 중 문제가 발생하면 Labby 에 문의하십시오. 세션 후 피드백을 제공하면 문제를 신속하게 해결해 드리겠습니다.