소개
이 실험실에서는 역사적인 시세 변동으로부터 주식 시장의 구조를 추출하기 위해 여러 가지 비지도 학습 기법을 사용할 것입니다. 우리는 다른 시세에 조건부로 상관 관계가 있는 시세를 찾기 위해 일일 시세 변동을 사용할 것입니다. 그런 다음 유사한 방식으로 행동하는 시세를 그룹화하기 위해 군집화를 사용할 것입니다. 마지막으로 다양한 기호를 2 차원 캔버스에 배치하여 2 차원 임베딩을 검색하기 위해 다양한 기법을 사용할 것입니다.
VM 팁
VM 시작이 완료되면 왼쪽 상단 모서리를 클릭하여 연습을 위해 Jupyter Notebook에 접근할 수 있는 Notebook 탭으로 전환하십시오.
때때로 Jupyter Notebook 이 완전히 로드되기까지 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사를 자동화할 수 없습니다.
학습 중 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공하면 문제를 신속하게 해결해 드리겠습니다.
인터넷에서 데이터 가져오기
데이터는 2003 년부터 2008 년까지입니다. 이 기간은 상대적으로 안정적이며 data.nasdaq.com 및 alphavantage.co와 같은 API 를 통해 얻을 수 있습니다.
그래프 구조 학습
희소 역공분산 추정을 사용하여 다른 시세에 조건부로 상관 관계가 있는 시세를 찾습니다. 구체적으로 희소 역공분산은 연결 목록인 그래프를 제공합니다. 각 기호에 대해, 그 기호의 변동을 설명하는 데 유용한 기호는 연결된 기호입니다.
친화도 전파를 이용한 클러스터링
유사한 행동을 보이는 시세를 그룹화하기 위해 클러스터링을 사용합니다. 여기서는 affinity_propagation 을 사용하는데, 이는 클러스터 크기를 동일하게 강제하지 않고 데이터에서 자동으로 클러스터 수를 선택할 수 있기 때문입니다.
2 차원 공간에 대한 임베딩
시각화를 위해 다양한 기호들을 2 차원 캔버스에 배치해야 합니다. 이를 위해 다양한 기법을 사용하여 2 차원 임베딩을 얻습니다.
시각화
3 개 모델의 출력 결과를 2 차원 그래프에 결합합니다. 노드는 주식을, 에지 (간선) 는 클러스터 레이블을 나타냅니다. 클러스터 레이블은 노드의 색상을 정의하는 데 사용됩니다. 희소 공분산 모델은 에지의 강도를 표시하는 데 사용되고, 2 차원 임베딩은 노드를 평면에 배치하는 데 사용됩니다.
요약
이 실험에서는 비지도 학습 기법을 사용하여 역사적인 시세 변동으로부터 주식 시장의 구조를 추출했습니다. 데이터를 가져오는 방법, 그래프 구조를 학습하는 방법, 친화도 전파를 사용한 클러스터링, 2 차원 공간에 대한 임베딩, 그리고 마지막으로 3 개 모델의 출력을 2 차원 그래프로 시각화하는 방법을 배웠습니다.