一种股票情感指数构建方法及系统技术方案

技术编号:18426259 阅读:28 留言:0更新日期:2018-07-12 01:58
本发明专利技术提供一种股票情感指数构建方法及系统,所述方法包括:S1,根据当前时间段发布的与目标股票相关的各文档中的标点符号,将各所述文档划分为语句;S2,根据各所述语句中各词语的情感极性确定各所述语句的情感极性,根据各所述文档中各语句的情感极性确定各所述文档的情感极性;S3,根据各所述文档的情感极性,构建所述目标股票当前时间段的情感指数。本发明专利技术构建方法简单,更精确反应人们对目标股票所持有的态度,有助于指导投资者进行风险规避和投资决策。

A method and system for building stock sentiment index

The present invention provides a method and system for building an emotional index of stock. The method includes: S1, according to the punctuation marks in the documents related to the target stock issued at the current time period, the documents are divided into statements; S2, based on the polarity of each word in each statement, determines the emotional polarity of each statement. The emotional polarity of each document is determined according to the emotional polarity of each statement in each of the documents. S3, based on the emotional polarity of each document, constructs the emotional index of the current period of the target stock. The method of the invention is simple and accurate, which reflects people's attitude towards the target stocks, and helps to guide investors in risk aversion and investment decisions.

【技术实现步骤摘要】
一种股票情感指数构建方法及系统
本专利技术属于数据分析
,更具体地,涉及一种股票情感指数构建方法及系统。
技术介绍
对股市具有深刻了解的证券分析人员根据股票行情的发展对未来股市发展方向以及涨跌程度进行预测。投资者可以参考对股市的预测结果进行风险规避和投资决策。因此,预测结果的精确程度对投资的成败具有重要影响。在股票市场中,股票价格的变化与国家的宏观经济发展,法律法规的制定、公司的运营、投资心理和交易技术等都有关联,很难准确预测。证券分析师的预测行为只是基于假定因素为既定前提条件进行预测,其预测只能作为投资者的参考意见。目前通用的股票预测方法一般基于股票开盘价格、收盘价格和交易量等标准化金融数据。近年来,金融学界大量学术研究发现非标准化金融数据,例如投资者关于市场的情感极性波动指数、关于监管层面政策不确定性的相关指数,以及投资者在网络上发表的关于投资的正负言论等,对于解释和分析股票市场的波动起到关键性作用。目前构建非标准化金融数据的方法很少且不精确,因此,亟需构建新的非标准化金融数据用于股票预测。
技术实现思路
为克服上述目前构建非标准化金融数据的方法很少且不精确的问题或者至少部分地解决上述问题,本专利技术提供了一种股票情感指数构建方法及系统。根据本专利技术的第一方面,提供一种股票情感指数构建方法,包括:S1,根据当前时间段发布的与目标股票相关的各文档中的标点符号,将各所述文档划分为语句;S2,根据各所述语句中各词语的情感极性确定各所述语句的情感极性,根据各所述文档中各语句的情感极性确定各所述文档的情感极性;S3,根据各所述文档的情感极性,构建所述目标股票当前时间段的情感指数。具体地,所述步骤S2中根据各所述语句中各词语的情感极性确定各所述语句的情感极性具体包括:对于任一所述语句,若该语句中积极情感的词语的个数大于该语句中消极情感的词语的个数,则该语句的情感极性为积极情感;对于任一所述语句,若该语句中积极情感的词语的个数等于该语句中消极情感的词语的个数,则该语句的情感极性为中性情感;对于任一所述语句,若该语句中积极情感的词语的个数小于该语句中消极情感的词语的个数,则该语句的情感极性为消极情感。具体地,所述步骤S2中根据各所述文档中各语句的情感极性确定各所述文档的情感极性具体包括:对于任一所述文档,若该文档中积极情感的语句的个数大于该文档中消极情感的语句的个数,则该文档的情感极性为积极情感;对于任一所述文档,若该文档中积极情感的语句的个数等于该文档中消极情感的语句的个数,则该文档的情感极性为中性情感;对于任一所述文档,若该文档中积极情感的语句的个数小于该文档中消极情感的语句的个数,则该文档的情感极性为消极情感。具体地,所述步骤S3中通过以下公式构建所述目标股票当前时间段的情感指数:其中,St为第t个时间段目标股票的情感指数,为第t个时间段发布的积极情感的文档的个数,为第t个时间段发布的消极情感的文档的个数。具体地,所述步骤S2还包括:对于任一所述词语,若该词语的情感极性为积极情感且该词语的前一个词语为否定词,则将该词语和所述否定词合成为一个词语,合成的词语的情感极性为消极情感;对于任一所述词语,若该词语的情感极性为消极情感且该词语的前一个词语为否定词,则将该词语和所述否定词合成为一个词语,合成的词语的情感极性为积极情感。具体地,所述步骤S3之后还包括当所述当前时间段为周一时,通过以下公式对所述目标股票当前时间段的情感指数进行调整:其中,St'为所述目标股票第t个时间段调整后的情感指数,St为所述目标股票第t个时间段调整前的情感指数,St-1为所述目标股票第t-1个时间段调整前的情感指数,St-2为所述目标股票第t-2个时间段调整前的情感指数,a1、a2和a3为常数,a1>a2>a3,λ为预设参数。具体地,所述步骤S3之后还包括当所述目标股票连续k天休市时,通过以下公式对所述目标股票当前时间段的情感指数进行调整:Sk+1'=e-kλS1+e-(k-1)λS2+…+e-λSk+Sk+1;其中,k表示所述当前时间段的前k个时间段休市,Sk+1'为所述目标股票当前时间段调整后的情感指数,Sk+1为所述目标股票当前时间段调整前的情感指数,S1为所述休市的第一个时间段目标股票的情感指数,S2为所述休市的第二个时间段目标股票的情感指数,Sk为所述休市的第k个时间段目标股票的情感指数,λ为预设参数。根据本专利技术的第二方面,提供一种股票情感指数构建系统,包括:划分模块,用于根据当前时间段发布的与目标股票相关的各文档中的标点符号,将各所述文档划分为语句;获取模块,用于根据各所述语句中各种情感极性的词语的个数获取各所述语句的情感极性,根据各所述文档中各种情感极性的所述语句的个数获取各所述文档的情感极性;构建模块,用于根据各种情感极性的所述文档的个数,构建所述目标股票当前时间段的情感指数。根据本专利技术的第三方面,提供一种股票情感指数构建设备,包括:至少一个处理器、至少一个存储器和总线;其中,所述处理器和存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如前所述的方法。根据本专利技术的第四方面,提供一种非暂态计算机可读存储介质,用于存储如前所述方法的计算机程序。本专利技术提供一种股票情感指数构建方法及系统,该方法通过获取与目标股票相关的各文档,根据文档中组成各语句的词语的情感极性确定文档中各语句的情感极性,根据组成文档的各语句的情感极性确定各文档的情感极性,根据各文档的情感极性构建目标股票的情感指数,构建方法简单,更精确反应人们对目标股票所持有的态度,有助于指导投资者进行风险规避和投资决策。附图说明图1为本专利技术实施例提供的股票情感指数构建方法整体流程示意图;图2为本专利技术实施例提供的股票情感指数构建系统整体结构示意图;图3为本专利技术实施例提供的股票情感指数构建设备整体结构示意图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。在本专利技术的一个实施例中提供一种股票情感指数构建方法,图1为本专利技术实施例提供的股票情感指数构建方法整体流程示意图,该方法包括:S1,根据当前时间段发布的与目标股票相关的各文档中的标点符号,将各所述文档划分为语句;S2,根据各所述语句中各种情感极性的词语的个数获取各所述语句的情感极性,根据各所述文档中各种情感极性的语句的个数获取各所述文档的情感极性;S3,根据各种情感极性的所述文档的个数,构建所述目标股票当前时间段的情感指数。具体地,S1中,所述当前时间段可以为一个月、一天、一周、一小时或一分钟,因此可以对目标股票每个时间段的情感指数进行构建,形成时间序列的情感指数。所述目标股票为需要构建情感指数的股票。所述与目标股票相关的文档包括从网页中获取的用户关于所述目标股票的言论,以及证券分析人员、股票研究人员或投资者发布的关于所述目标股票的文章等。根据各所述文档中的标点符合,将各所述文档划分成一个或多个语句。所述标点符合包括句号、逗号、冒号、分号和感叹号中的一种或多种。S2中,对各所述语句进行分词,通过语义分析领域通用的情感极性词典确定各所述语句中各词语的情感极本文档来自技高网...

【技术保护点】
1.一种股票情感指数构建方法,其特征在于,包括:S1,根据当前时间段发布的与目标股票相关的各文档中的标点符号,将各所述文档划分为语句;S2,根据各所述语句中各词语的情感极性确定各所述语句的情感极性,根据各所述文档中各语句的情感极性确定各所述文档的情感极性;S3,根据各所述文档的情感极性,构建所述目标股票当前时间段的情感指数。

【技术特征摘要】
1.一种股票情感指数构建方法,其特征在于,包括:S1,根据当前时间段发布的与目标股票相关的各文档中的标点符号,将各所述文档划分为语句;S2,根据各所述语句中各词语的情感极性确定各所述语句的情感极性,根据各所述文档中各语句的情感极性确定各所述文档的情感极性;S3,根据各所述文档的情感极性,构建所述目标股票当前时间段的情感指数。2.根据权利要求1所述的方法,其特征在于,所述步骤S2中根据各所述语句中各词语的情感极性确定各所述语句的情感极性具体包括:对于任一所述语句,若该语句中积极情感的词语的个数大于该语句中消极情感的词语的个数,则该语句的情感极性为积极情感;对于任一所述语句,若该语句中积极情感的词语的个数等于该语句中消极情感的词语的个数,则该语句的情感极性为中性情感;对于任一所述语句,若该语句中积极情感的词语的个数小于该语句中消极情感的词语的个数,则该语句的情感极性为消极情感。3.根据权利要求1所述的方法,其特征在于,所述步骤S2中根据各所述文档中各语句的情感极性确定各所述文档的情感极性具体包括:对于任一所述文档,若该文档中积极情感的语句的个数大于该文档中消极情感的语句的个数,则该文档的情感极性为积极情感;对于任一所述文档,若该文档中积极情感的语句的个数等于该文档中消极情感的语句的个数,则该文档的情感极性为中性情感;对于任一所述文档,若该文档中积极情感的语句的个数小于该文档中消极情感的语句的个数,则该文档的情感极性为消极情感。4.根据权利要求1所述的方法,其特征在于,所述步骤S3中通过以下公式构建所述目标股票当前时间段的情感指数:其中,St为第t个时间段目标股票的情感指数,为第t个时间段发布的积极情感的文档的个数,为第t个时间段发布的消极情感的文档的个数。5.根据权利要求1-4任一所述的方法,其特征在于,所述步骤S2还包括:对于任一所述词语,若该词语的情感极性为积极情感且该词语的前一个词语为否定词,则将该词语和所述否定词合成为一个词语,合成的词语的情感极性为消极情感;对于任一所述词语,若该词语的情感极性为消极情感且该词语的前一个词语为否定词,则将该词语和所述否定词合成为一个词语,...

【专利技术属性】
技术研发人员:吴德胜任蕊梁樑
申请(专利权)人:中国科学院大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1