平时就喜欢琢磨点东西,特别是股市这玩意儿,总觉得这里头有门道。最近不是远光软件和东方财富网挺火的吗?我就想着,能不能自己搞一套东西,来预测一下它们的股价,看看能不能赚点小钱。
初期摸索与数据收集
刚开始动手的时候,真是抓瞎。你说预测股价,得靠什么?技术分析?基本面分析?我都不是专业的,只能摸着石头过河。
- 第一步,找数据。 我直接跑去网上,把远光软件和东方财富网的历史股价数据,还有一些财务报告、新闻公告都扒拉了下来。这个过程挺费劲的,特别是要整理成能用的格式,用了好几天时间。
- 第二步,选工具。 我听说Python搞数据分析挺牛的,就硬着头皮学了点皮毛。装了Anaconda,用Pandas处理数据,Matplotlib画图看趋势。不得不说,这玩意儿上手是有点难,但我这个人,认准了就得搞下去。
模型搭建与尝试
光有数据没用,得建立模型来跑。我一开始想得简单,觉得用线性回归就能搞定,结果一跑,那预测曲线跟实际股价完全是两码事,笑死个人。
然后我就开始琢磨更复杂的模型:
- 尝试LSTM。 听说深度学习在时间序列预测上效果特别是LSTM(长短期记忆网络),专门处理序列数据的。我找了几个开源项目,依葫芦画瓢开始搭模型。
- 清洗数据。 在训练模型之前,数据清洗和归一化是重头戏。我把一些异常值剔除了,然后把股价数据缩放到0到1之间,不然模型根本跑不动。
- 特征工程。 我不光用了股价本身,还尝试加入了成交量、MACD、KDJ这些技术指标作为输入特征,希望能提高预测的准确性。
这个训练过程,那真是煎熬。我的破电脑风扇呼呼地转,跑一个模型得好几个小时。每次跑完一看结果,虽然比线性回归强了点,但离“专业预测”还差得远。
深入调整与实践记录
我发现,光靠历史数据还是不够。股价受市场情绪、政策变化影响太大了。我加入了“情感分析”这个环节。
怎么做情感分析?
- 我写了个简单的爬虫,去抓取股、财经新闻里关于远光软件和东方财富网的评论。
- 用一个简单的词典匹配方法(我知道这很简陋),来判断这些评论是偏积极、偏消极还是中性的。
- 把这个“情感得分”作为一个新的特征,扔进我的LSTM模型里重新训练。
这回调整之后,模型的表现确实有点意思了。特别是当有一些突发利好或利空消息出来时,模型对股价的短期波动预测能力明显增强了。
我的最终结论是,短期预测,比如未来三五天的走势,通过结合技术指标、历史股价和市场情绪,能做到七八成的准确率。但要预测到具体的“股价是多少”,那是真难,因为股市里太多黑天鹅事件了。
我现在手头跑的模型,对远光软件和东方财富网接下来的走势,给出的信号是“短期震荡偏上”。但这只是我的实践记录,大家看看就真要拿去炒股,那风险自负!我就是图个乐子,分享一下自己折腾的过程。
这趟下来,最大的收获不是预测了股价,而是把Python和深度学习的路子摸熟了一点,也算是没白忙活。




还没有评论,来说两句吧...