简介
在本实验中,我们将使用几种无监督学习技术,从历史报价的变化中提取股票市场的结构。我们将使用报价价格的每日变化来找出哪些报价在其他报价的条件下是相关的。然后,我们将使用聚类方法将行为相似的报价组合在一起。最后,我们将使用流形技术在二维画布上布置不同的符号,以获取二维嵌入。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到“笔记本”标签,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟,让 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作的验证无法自动化。
如果你在学习过程中遇到问题,随时向 Labby 提问。课程结束后提供反馈,我们将立即为你解决问题。
从互联网获取数据
数据来自 2003 年至 2008 年。这段时间市场相对平稳,可以从诸如 data.nasdaq.com 和 alphavantage.co 等应用程序编程接口(API)获取。
学习图结构
我们使用稀疏逆协方差估计来找出哪些报价在其他报价的条件下是相关的。具体来说,稀疏逆协方差为我们提供了一个图,即一个连接列表。对于每个符号,与之相连的符号是那些有助于解释其波动的符号。
使用亲和传播进行聚类
我们使用聚类方法将行为相似的报价组合在一起。在这里,我们使用亲和传播算法,因为它不强制要求聚类大小相等,并且可以根据数据自动选择聚类的数量。
二维空间嵌入
为了便于可视化,我们需要在二维画布上布置不同的符号。为此,我们使用流形技术来获取二维嵌入。
可视化
三个模型的输出结果被整合到一个二维图表中,其中节点代表股票,而边则使用聚类标签来定义节点的颜色。稀疏协方差模型用于显示边的强度,二维嵌入用于在平面中定位节点。
总结
在本实验中,我们使用无监督学习技术从历史报价的变化中提取股票市场的结构。我们学习了如何获取数据、学习图结构、使用亲和传播进行聚类、在二维空间中嵌入,最后在二维图表中可视化三个模型的输出。