基于大数据的预测证券市场多空情绪指标方法技术

技术编号:13995854 阅读:63 留言:0更新日期:2016-11-15 03:12
本发明专利技术涉及大数据的预测证券市场多空情绪指标方法,属于计算机应用技术领域。包括如下步骤:步骤一:每日获取情绪数据;步骤二:利用智能分词、情感分析技术对步骤一获得的资讯、文章进行文本分析,获得相应的情感属性;步骤三:将步骤二获取到的大量情绪数据的情感属性整理放置到相应的历史数据库中,供调用计算。在本发明专利技术提出之前,对于证券市场的散户投资者观点以及机构投资者的观点与情绪的统计,均分布于各个媒体、平台、产品/服务之中,较为零散单薄,数据样本存在数量不足、数据噪音过多、数据属性不统一的问题,无法较为准确综合反映投资者的整体情绪。

【技术实现步骤摘要】

本专利技术涉及基于大数据的预测证券市场多空情绪指标方法,属于计算机应用

技术介绍
随着证券市场和互联网财经媒体的发展,证券市场投资者、投资研究机构数量快速增长,同时每日有海量的财经资讯在互联网上呈现。国内财经互联网媒体纷纷设立专门的频道(页面)对投资者多空情绪进行调查统计,或搜集发布各大研究机构、分析师对于证券市场后市的多空观点。这些个人/机构的后市情绪观点在一定程度上反应了市场参与者、研究者对于市场走向的心理预期,对于判断市场趋势具备很大的应用价值。大数据理论认为,当样本数据越多时,大数据越趋近反映事物的真实性。随着大数据理念在金融市场中的逐步实施利用,针对国内证券市场中的各种数据、资讯进行情绪挖掘的探索越来越多。本指标系统即是基于大数据方法论,创造性的将上述这些大量散落在各媒体中的市场情绪数据进行搜集整理聚合,并使用一定的计算模型将数据最终进行整合分析,能够综合反应市场整体多空情绪观点。
技术实现思路
为了实现上述目的,本专利技术提供一种涉及基于大数据的预测证券市场多空情绪指标方法。本专利技术采取的技术方案如下:基于大数据的预测证券市场多空情绪指标方法,包括如下步骤:步骤1:每日获取情绪数据,所述情绪数据可以通过程序抓取或人工记录,尽可能多的每日从各大媒体的投资者后市多空调查频道中分别获取看多、看空、看平等不同属性的情绪数据,包括尽可能多的每日从各大财经资讯网站以及证券研究报告中获取足够多的研究机构、著名分析师的后市预测观点文章;步骤2:利用智能分词、情感分析技术对步骤1获得的资讯、文章进行文本分析,获得相应的情感属性,情感属性包括看多、看空及看平;然后采用人工进行排查勘误,最终获得正确的情感属性,情感属性为多空看法;步骤3:将步骤2获取到的大量情绪数据的情感属性整理放置到相应的历史数据库中,供调用计算;步骤4:使用简单平均或加权平均计算模型对步骤3所述的历史数据库中获取到的所有统计情绪数据的情感属性样本来源中多个数据进行综合计算,得出每日近似整体市场的多空情绪综合属性,多空情绪综合属性包括看多、看空、看平;综合计算的方法如下:从每日海量资讯中,标记出对当天大盘趋势观点的资讯,结合资讯热度、数据来源权重,得出市场评论人员对于市场的情绪:R3=∑(H1*DS)/(∑(H1*DS)+∑(H2*DS)),R3:市场评论员对于市场看多的情绪,H1:各看多资讯所对应热度,H2:各看空资讯所对应热度,DS:各财经门户网站权权重;步骤5:将步骤4最终获得的多空情绪综合指标在前端分别用看多指数以及分歧指数的形式进行展示,以呈现每日市场投资者对于下一交易日的多空观点。步骤1中所述的每日获取情绪数据的方式包括如下:①分析数据来源的可靠性、可参考性,以及数据的多维度属性差异和页面的技术特征,确定原始数据来源范围,以及相应的合理获取方式;②对于通过程序可以直接抓取的来源,在本公司自主研发的网络爬虫软件中编写相应的抓取规则脚本,每日定时联网自动抓取,并存储成统一规范的可用基础数据;③对于不便于用程序自动抓取的来源,安排对应的数据录入人员,每日定时浏览来源网站,进行人工查看并录入数据库。本专利技术所具有的有益效果是:1.在本专利技术提出之前的现有技术中,对于证券市场的散户投资者观点以及机构投资者的观点与情绪的统计,均分布于各个媒体、平台、产品/服务之中,较为零散单薄,数据样本存在数量不足、数据噪音过多、数据属性不统一的问题,无法较为准确综合反映投资者的整体情绪。而本专利技术基于“大数据”的理念,将众多有价值的各大调查数据、报告数据进行再聚合整理,并将数据属性进行统一,建立综合得分模型,相对于上述的“小数据”,本专利技术能更准确、更全面的反映市场中整体投资者的情绪指标。2.基于金融资讯语义分析的情感分析(智能+人工)多空辨别系统。说明书附图图1示例性地示出了本专利技术的流程示意图。具体实施方式下面结合附图对本专利技术做进一步详细说明:如图1所示,基于大数据的预测证券市场多空情绪指标方法,包括如下步骤:步骤1:每日获取情绪数据,所述情绪数据可以通过程序抓取或人工记录;尽可能多的每日从各大媒体的投资者后市多空调查频道中分别获取看多、看空、看平等不同属性的情绪数据,包括尽可能多的每日从各大财经资讯网站以及证券研究报告中获取足够多的研究机构、著名分析师的后市预测观点文章。每日获取情绪数据的方式可以如下所述:1.分析数据来源的可靠性、可参考性,以及数据的多维度属性差异和页面的技术特征,确定原始数据来源范围,以及相应的合理获取方式;2.对于通过程序可以直接抓取的来源,在本公司自主研发的网络爬虫软件中编写相应的抓取规则脚本,每日定时联网自动抓取,并存储成统一规范的可用基础数据;3.对于不便于用程序自动抓取的来源,安排对应的数据录入人员,每日定时浏览来源网站,进行人工查看并录入数据库。步骤2:利用智能分词、情感分析技术对步骤1获得的资讯、文章进行文本分析,获得相应的情感属性,情感属性包括看多、看空及看平;然后采用人工进行排查勘误,最终获得正确的情感属性,情感属性为多空看法;步骤3:将步骤2获取到的大量情绪数据的情感属性整理放置到相应的历史数据库中,供调用计算;步骤4:使用简单平均或加权平均计算模型对步骤3所述的历史数据库中获取到的所有统计情绪数据的情感属性样本来源中多个数据进行综合计算,得出每日近似整体市场的多空情绪综合属性,多空情绪综合属性包括看多、看空、看平;综合计算的方法如下:综合计算方法:从每日海量资讯中,标记出对当天大盘趋势观点的资讯,结合资讯热度、数据来源权重,得出市场评论人员对于市场的情绪:R3=∑(H1*DS)/(∑(H1*DS)+∑(H2*DS))R3:市场评论员对于市场看多的情绪,H1:各看多资讯所对应热度,H2:各看空资讯所对应热度,DS:各财经门户网站权权重。步骤5:将步骤4最终获得的多空情绪综合指标在前端分别用看多指数以及分歧指数的形式进行展示,以呈现每日市场投资者对于下一交易日的多空观点。本专利技术相较于现有技术而言,现有技术对证券市场的散户投资者观点以及机构投资者的观点与情绪的统计,均分布于各个媒体、平台、产品/服务之中,较为零散单薄,数据样本存在数量不足、数据噪音过多、数据属性不统一的问题,无法较为准确综合反映投资者的整体情绪。而本专利技术基于“大数据”的理念,将众多有价值的各大调查数据、报告数据进行再聚合整理,并将数据属性进行统一,建立综合得分模型,相对于上述的“小数据”,本专利技术能更准确、更全面的反映市场中整体投资者的情绪指标。本专利技术还有基于金融资讯语义分析的情感分析(智能+人工)多空辨别系统。对于本领域的普通技术人员而言,上述实施例只是对本专利技术进行了示例性描述,显然本专利技术具体实现并不受上述方式的限制,只要采用了本专利技术的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本专利技术的构思和技术方案直接应用于其它场合的,均在本专利技术的保护范围之内。本文档来自技高网...

【技术保护点】
基于大数据的预测证券市场多空情绪指标方法,其特征在于:包括如下步骤;步骤1:每日获取情绪数据,所述情绪数据可以通过程序抓取或人工记录,每日从各大媒体的投资者后市多空调查频道中分别获取看多、看空和看平的不同属性的情绪数据,包括每日从各大财经资讯网站以及证券研究报告中获取足够多的研究机构、著名分析师的后市预测观点文章;步骤2:利用智能分词、情感分析技术对步骤1获得的资讯、文章进行文本分析,获得相应的情感属性,情感属性包括看多、看空及看平;然后采用人工进行排查勘误,最终获得正确的情感属性,情感属性为多空看法;步骤3:将步骤2获取到的大量情绪数据的情感属性整理放置到相应的历史数据库中,供调用计算;步骤4:使用简单平均或加权平均计算模型对步骤3所述的历史数据库中获取到的所有统计情绪数据的情感属性样本来源中多个数据进行综合计算,得出每日近似整体市场的多空情绪综合属性,多空情绪综合属性包括看多、看空、看平;综合计算的方法如下:从每日海量资讯中,标记出对当天大盘趋势观点的资讯,结合资讯热度、数据来源权重,得出市场评论人员对于市场的情绪:R3=∑(H1*DS)/(∑(H1*DS)+∑(H2*DS)),R3:市场评论员对于市场看多的情绪,H1:各看多资讯所对应热度,H2:各看空资讯所对应热度,DS:各财经门户网站权权重;步骤5:将步骤4最终获得的多空情绪综合属性指标在前端分别用看多指数以及分歧指数的形式进行展示,以呈现每日市场投资者对于下一交易日的多空观点。...

【技术特征摘要】
1.基于大数据的预测证券市场多空情绪指标方法,其特征在于:包括如下步骤;步骤1:每日获取情绪数据,所述情绪数据可以通过程序抓取或人工记录,每日从各大媒体的投资者后市多空调查频道中分别获取看多、看空和看平的不同属性的情绪数据,包括每日从各大财经资讯网站以及证券研究报告中获取足够多的研究机构、著名分析师的后市预测观点文章;步骤2:利用智能分词、情感分析技术对步骤1获得的资讯、文章进行文本分析,获得相应的情感属性,情感属性包括看多、看空及看平;然后采用人工进行排查勘误,最终获得正确的情感属性,情感属性为多空看法;步骤3:将步骤2获取到的大量情绪数据的情感属性整理放置到相应的历史数据库中,供调用计算;步骤4:使用简单平均或加权平均计算模型对步骤3所述的历史数据库中获取到的所有统计情绪数据的情感属性样本来源中多个数据进行综合计算,得出每日近似整体市场的多空情绪综合属性,多空情绪综合属性包括看多、看空、看平;综合计算的方法如下:从每日海量资讯中,标记出对当天大盘趋势观点的...

【专利技术属性】
技术研发人员:陈志雄胡浩胡春华
申请(专利权)人:优品财富管理有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1