Techniques d'apprentissage non supervisé | Analyse du marché boursier

Introduction

Dans ce laboratoire, nous utiliserons plusieurs techniques d'apprentissage non supervisé pour extraire la structure du marché boursier à partir des variations des cotations historiques. Nous utiliserons la variation journalière du prix de cotation pour trouver quelles cotations sont corrélées en fonction des autres. Ensuite, nous utiliserons le regroupement pour regrouper les cotations qui se comportent de manière similaire. Enfin, nous disposerons les différents symboles sur une toile 2D en utilisant des techniques de variété pour récupérer une projection 2D.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder au carnet Jupyter pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que le carnet Jupyter ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations du carnet Jupyter.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Récupérer les données sur Internet

Les données sont de 2003 à 2008. Ceci est relativement calme et peut être obtenu à partir d'APIs telles que data.nasdaq.com et alphavantage.co.

Apprendre une structure de graphe

Nous utilisons l'estimation de covariance inverse sparse pour trouver quelles cotations sont corrélées en fonction des autres. Plus précisément, la covariance inverse sparse nous donne un graphe, qui est une liste de connexions. Pour chaque symbole, les symboles auxquels il est connecté sont ceux utiles pour expliquer ses fluctuations.

Groupement par propagation d'affinité

Nous utilisons le groupement pour regrouper les cotations qui se comportent de manière similaire. Ici, nous utilisons la propagation d'affinité car elle n'impose pas des groupes de taille égale et peut choisir automatiquement le nombre de groupes à partir des données.

Projection dans l'espace 2D

Pour des fins de visualisation, nous devons disposer les différents symboles sur une toile 2D. Pour cela, nous utilisons des techniques de variété pour obtenir une projection 2D.

Visualisation

La sortie des 3 modèles est combinée dans un graphe 2D où les nœuds représentent les actions et les arêtes les étiquettes de cluster sont utilisées pour définir la couleur des nœuds. Le modèle de covariance sparse est utilisé pour afficher la force des arêtes, et la projection 2D est utilisée pour positionner les nœuds dans le plan.

Sommaire

Dans ce laboratoire, nous avons utilisé des techniques d'apprentissage non supervisé pour extraire la structure du marché boursier à partir des variations des cotations historiques. Nous avons appris à récupérer les données, à apprendre une structure de graphe, à effectuer un groupement par propagation d'affinité, à projeter dans l'espace 2D et finalement, à visualiser la sortie des 3 modèles dans un graphe 2D.

Visualisation de la structure du marché boursier