2024年8月19日发(作者:)
基于大数据的股票量化分析及趋势研究
作者:余怀 娄必伟 余廷忠
来源:《今日财富》2022年第31期
针对股市常规基本面和技术面分析的局限性,基于大数据的股市预测及投资分析越加凸显
其投资收益的科学性和可靠性。文章从大数据技术视角,对神经网络和机器学习等算法、以及
对投资情绪和量化投资等问题进行研究综述。
股票投资是高收益与高风险并存的,自股市诞生以来,股票波动及走势一直是每个投资者
高度关注和研究的话题。投资者希望通过股市研究,揭示大盘及个股走势规律,从而对个股行
情及走势进行预判。但由于股票投资市场存在非线性、不平稳性及高度复杂性等特征,使得投
资者对股票走势预测研判具有很多不确定性。但随着大数据技术在各个行列的应用不断普及和
深入,特别对股票走势预测及研判的指导作用必将越来越凸显其重要性。
一、股市行情分析概述
(一)常规股市行情分析方法
人们通常对股市行情分析主要包括基本面和技术面两方面。
1.基本面分析
基本面分析有广义和狭义之分:广义的基本面分析,是指以经济学中的供求关系为研究基
础,通过分析历史经济数据和政治环境,主要对利率水平及通货膨胀等为主要指标的宏观经济
运行状况、企业素质等为主导的微观经济情况和政治环境等进行分析,以便对金融市场趋势进
行预测;狭义的基本面分析,主要针对企业财务报表中的机构管理成员素质、财务指标、所属
行业发展及主打产品竞争强度等进行分析,着重对公司的经营管理分析、市场状况和行业地位
等方面的分析,主要分析公司主营业务成长性和宏观经济运行态势,对公司价值及股价走势的
影响进行预测及研判。基本面分析将为中长线投资者提供投资决策的主要依据。
2.技术面分析
技术面分析是通过对市场行为研究来预判市场运作趋势,通过市场运作趋势的变化周期来
进行股票交易的决策。技术分析者认为股票市场行为具有重复性,市场交易的历史必会重演。
技术面分析着重以供求关系为基础对股市行情进行分析研究。主要研究股票价格动向、换手
率、交易量、交易趋势等技术指标(包括持股人对未来的希望、担心及恐惧等,都将直接反映
在股票价格和交易量上),使用这些指标,以便对该股票的未来价格进行预判,从而进行投资
决策。
二、基于大数据技术的股市分析
随着大数据技术应用的普及,股票市场交易海量数据越来越引起众多学者关注。当前大数
据在证券行业中的应用大致分为三个方面,一是对股价进行预测;二是对客户关系进行管理;
三是对投资景气指数预测。基于大数据技术的股市分析包含可视化分析、数据挖掘算法、预测
性分析能力、语义引擎、数据质量和数据管理、数据存储与数据仓库等六个基本方面。特别值
得关注的是,支持向量机、神经网络、决策树等方法已被广泛应用于股票预测领域。
(一)基于神经网络算法分析
基于神经网络的算法对股票进行技术分析,主要通过确定预测样本并设定目标变量进行预
测,将实际值与预测值相互比较,最后通过建立拟合方程得出实际值与预测值之间的关系,以
便为投资者提供决策参考。
(二)基于机器学习算法分析
股票研究学者还通过股票交易过程中获得的历史大数据使用机器学习算法,进行建模和训
练,并将训练出来的模型对股票预期走势进行预测研判。例如,就股票成交量来说,它是取值
于非负整数的时间序列数据,对此类数据的建模,常常会出现估计偏差过大或预测值是非整数
等问题,使传统时间序列模型不再适用。因此其主流建模方法采用基于各类稀疏算子所建立的
整数值时间序列模型。由于INAR 模型结构较简单、解释性强,因此受到广大学者普遍关注。
当前许多学者还利用大数据将股票每日收盘价,按时间先后次序排列构造成股票交易的时间序
列模型,根据该模型来对股票未来变化趋势预测。其中相当著名的是ARIMA模型。
(三)基于高频大数据的应用
当前基于大数据的仓库存储技术愈加成熟,而高频数据是其中最常见的数据之一。人们对
高频数据的分析越来越关注和重视,特别是对金融交易规律高频数据的分析, 已成为众多投
资者和金融研究者的共同诉求。每日股票交易成交量已真实地记录并反馈出股市的走势及盘口
变化的趋势,同时也反映出证券市场的交易活跃程度,研究股票日内交易的高频成交量变化规
律,不仅能够辅助机构投资者有效评估并预测股市走势及动态,还可使股民及时规避投资风
险,因此研究股票交易的高频数据其重要性不言而喻。
(四)基于大数据的投资情绪分析
投资情绪包含影响投资者对股票估值及市场预期看法的众多因素。长期以来,券商或证券
研究者对投资者情绪的评估测量及量化分析,既是突出的难题也显得至关重要。当前利用大数
据技术对投资情绪的分析,主要体现在通过网民微博、论坛、博客及各种庞大繁杂的网络媒体
介质中挖掘获取有价值的非结构化的信息,并经过数据分析和处理转化为结构化信息,结合情
感词典,应用情感分析引擎获取投资者情绪评价指标,从而得到投资者情绪分析的结果。
(五)基于大数据的量化投资分析
量化投资,是指对证券市场及产品根据历史交易相关数据进行量化分析,建立相关数据算
法模型,并根据模型做出投资决策,再由算法自动完成下单交易。通过人工智能、数据挖掘、
支持向量机等大数据分析工具,可使证券投资实现智能化和高频化。应用量化投资,其特点是
借助建模和编程方法,使用Python、MATLAB、R等工具软件建立投资策略。通过投资策略
进行量化选股,可使工作效率大大提高,并且使用机器操作可排除人工操作的不理智及随意
性,使决策结果更加客观,避免了盲目跟风等决策方式。
下面我们将根据上市公司财务报表、股市行情基本数据及股票相关影响因素,结合学者盛
光进的股票价值量化投资模型,建立的股票量化分析模型如表1所示:
可根据股票量化分析模型对任何一个股票量化出一个分数,根据该分数的高与低表示此股
票的好与坏(得分越高,表明股票的投资价值越大)。
充分考虑股票得分,并结合股票所属板块、题材及国家政策支持等各種其他因素综合分
析,进行股票买卖决策,投资收益概率会更高。
三、大数据及人工智能技术在股票交易市场中的应用
显然应用股票量化分析模型进行投资决策,需要对其模型中的各项指标参数进行量化,这
需要统计和分析大量数据资料,才可能获得真实可靠的参数,其难度较大。这不是一般投资者
能掌握的,为此下面介绍一般投资者都能掌握的方法。
目前很多股票交易软件都使用了大数据及人工智能技术为投资者提供股市及股票咨询、智
能诊股及选股,以及智能统计交易产生的各种数据等诸多服务。例如,同花顺软件提供了基于
大数据的AI信息查询及数据分析和智能选股的“问财”、动态板块、竞价分析等功能,可以为
投资者对当日及未来的大盘指数及股票走势预测作辅助研判;指南针炒股软件应用大数据技术
为投资者提供了实时直观显示的主力资金流向图(包括主力大单、主力资金、敢死队资金及多
空资金)。
下面以同花顺“问财”投资策略为例,对基于大数据及人工智能技术的投资策略进行分析。
(一)“问财”功能的技术背景分析
同花顺的“问财”热搜策略是基于人工智能技术,利用多因子模型构建的选股策略,洞察智
能投资行业未来发展趋势,致力于将人工智能、大数据、知识图谱等信息技术和专业的投资理
念相结合,打造下一代智能投资平台,致力于为中小投资者提供专业的数据服务,具有对话算
法、知识图谱及智能搜索等功能。对话算法功能将多轮对话、图谱问答、全双工、多模态、机
器阅读等领域前沿算法技术转化为智能投资、智能客服、智能营销等智能机器人产品;知识图
谱功能将自然语言、图像中的深度学习技术、本体推理技术、因果推理技术,以及传统机器学
习技术集成到金融信息生产线、金融知识融合、金融逻辑框架自动生成等产品中,为智能投资
提供坚实的数据支撑和逻辑支撑;智能搜索功能拥有百万级站点的分布式抓取,整合百亿级全
网文本、视频以及金融领域多年积累数据,利用语义理解,情感分析和知识图谱技术,通过在
海量信息中挖掘行业、公司及人物之间关系,构建事件图谱,为千万用户提供全面及时准确的
一站式智能搜索服务。
(二)“问财”投资策略功能的应用分析同花顺的“问财”投资策略在每个交易日都将根据大
数据及人工智能算法模型,在集合进价结束,即9:25及盘中的时候,分别按照跟着主力、温
和放量、趋势向上、机构大举买入、主力进入及趋势良好等板块推出1只或多只股票。
跟着主力板块:系统将根据量能理论,使用成交量,主力资金等多维度指标分析,在每日
9:25开盘,选出当日最具上涨潜力的股票。
温和放量板块:系统将根据量能理论,使用近两日成交量,前一交易日涨停封流比等多维
度指标分析,在每日9:25开盘,选出当日最具连板潜力的股票。
趋势向上板块:系统将根据道氏理论,使用均线,CR机构多空线等多维度指标分析,在
每日9:25开盘,选出最具上涨潜力的股票。
机构大举买入板块:系统根据机构席位大额净买入,筹码集中在机构手中等维度分析,在
每日9:25开盘,选出近期最具上涨潜力的股票。
主力进入板块:系统将通过DDE大单、中单等多个资金指标综合判断主力强弱,同时选
取成交量放量,股价低于最高点50%以上的个股。
趋势良好板块:系统将根据均线和量能理论,结合近3天振幅大于5%、近5天涨跌幅小
于15%,在盘中选出符合条件的股票,代表具备一定的趋势潜力。
例如,表2表示“问财”投资策略系统从2021年8月10日至2021年8月20日(共9个交
易日),跟着主力、股价低估、温和放量、趋势向上、机构买入、主力进入共六个板块所推出
的131支股票交易按板块平均值计算的行情数据。
从表中可看出,在股票推出当天如果投资者以开盘价买进,等到次日再以开盘价卖出都会
获得普遍不错的收益。特别是属于机构买入和趋势向上的板块,平均收益率会更高。如果按开
盘价当天买入所属“机构买入”板块推出的股票,当天的平均收益率将达到4.54%,次日开盘平
均收益率为2.38%,若以次日开盘价卖出,平均收益率将达到6.92%。
结 语
虽然大数据及人工智能技术在证券市场得到广泛應用,为投资者提供股市及股票咨询、智
能诊股及选股,以及智能统计交易产生的各种数据等诸多服务,使投资者对股票的交易行为更
加理智和科学。但投资者应当知道,影响证券市场的因素极其复杂,任何软件和技术都有一定
的局限性,故大数据及人工智能技术的使用只能作为参考。
(作者单位:贵州工程应用技术学院;信息工程学院)
本文系2021年贵州工程应用技术学院大学生创新训练省级项目“基于大数据的股票量化分
析及趋势研究” (编号:S2)。
更多推荐
分析,数据,技术,股票,投资,进行,投资者,预测
发布评论