The present invention provides a method and system for building an emotional index of stock. The method includes: S1, according to the punctuation marks in the documents related to the target stock issued at the current time period, the documents are divided into statements; S2, based on the polarity of each word in each statement, determines the emotional polarity of each statement. The emotional polarity of each document is determined according to the emotional polarity of each statement in each of the documents. S3, based on the emotional polarity of each document, constructs the emotional index of the current period of the target stock. The method of the invention is simple and accurate, which reflects people's attitude towards the target stocks, and helps to guide investors in risk aversion and investment decisions.
【技术实现步骤摘要】
一种股票情感指数构建方法及系统
本专利技术属于数据分析
,更具体地,涉及一种股票情感指数构建方法及系统。
技术介绍
对股市具有深刻了解的证券分析人员根据股票行情的发展对未来股市发展方向以及涨跌程度进行预测。投资者可以参考对股市的预测结果进行风险规避和投资决策。因此,预测结果的精确程度对投资的成败具有重要影响。在股票市场中,股票价格的变化与国家的宏观经济发展,法律法规的制定、公司的运营、投资心理和交易技术等都有关联,很难准确预测。证券分析师的预测行为只是基于假定因素为既定前提条件进行预测,其预测只能作为投资者的参考意见。目前通用的股票预测方法一般基于股票开盘价格、收盘价格和交易量等标准化金融数据。近年来,金融学界大量学术研究发现非标准化金融数据,例如投资者关于市场的情感极性波动指数、关于监管层面政策不确定性的相关指数,以及投资者在网络上发表的关于投资的正负言论等,对于解释和分析股票市场的波动起到关键性作用。目前构建非标准化金融数据的方法很少且不精确,因此,亟需构建新的非标准化金融数据用于股票预测。
技术实现思路
为克服上述目前构建非标准化金融数据的方法很少且不精确的问题或者至少部分地解决上述问题,本专利技术提供了一种股票情感指数构建方法及系统。根据本专利技术的第一方面,提供一种股票情感指数构建方法,包括:S1,根据当前时间段发布的与目标股票相关的各文档中的标点符号,将各所述文档划分为语句;S2,根据各所述语句中各词语的情感极性确定各所述语句的情感极性,根据各所述文档中各语句的情感极性确定各所述文档的情感极性;S3,根据各所述文档的情感极性,构建所述目标股票 ...
【技术保护点】
1.一种股票情感指数构建方法,其特征在于,包括:S1,根据当前时间段发布的与目标股票相关的各文档中的标点符号,将各所述文档划分为语句;S2,根据各所述语句中各词语的情感极性确定各所述语句的情感极性,根据各所述文档中各语句的情感极性确定各所述文档的情感极性;S3,根据各所述文档的情感极性,构建所述目标股票当前时间段的情感指数。
【技术特征摘要】
1.一种股票情感指数构建方法,其特征在于,包括:S1,根据当前时间段发布的与目标股票相关的各文档中的标点符号,将各所述文档划分为语句;S2,根据各所述语句中各词语的情感极性确定各所述语句的情感极性,根据各所述文档中各语句的情感极性确定各所述文档的情感极性;S3,根据各所述文档的情感极性,构建所述目标股票当前时间段的情感指数。2.根据权利要求1所述的方法,其特征在于,所述步骤S2中根据各所述语句中各词语的情感极性确定各所述语句的情感极性具体包括:对于任一所述语句,若该语句中积极情感的词语的个数大于该语句中消极情感的词语的个数,则该语句的情感极性为积极情感;对于任一所述语句,若该语句中积极情感的词语的个数等于该语句中消极情感的词语的个数,则该语句的情感极性为中性情感;对于任一所述语句,若该语句中积极情感的词语的个数小于该语句中消极情感的词语的个数,则该语句的情感极性为消极情感。3.根据权利要求1所述的方法,其特征在于,所述步骤S2中根据各所述文档中各语句的情感极性确定各所述文档的情感极性具体包括:对于任一所述文档,若该文档中积极情感的语句的个数大于该文档中消极情感的语句的个数,则该文档的情感极性为积极情感;对于任一所述文档,若该文档中积极情感的语句的个数等于该文档中消极情感的语句的个数,则该文档的情感极性为中性情感;对于任一所述文档,若该文档中积极情感的语句的个数小于该文档中消极情感的语句的个数,则该文档的情感极性为消极情感。4.根据权利要求1所述的方法,其特征在于,所述步骤S3中通过以下公式构建所述目标股票当前时间段的情感指数:其中,St为第t个时间段目标股票的情感指数,为第t个时间段发布的积极情感的文档的个数,为第t个时间段发布的消极情感的文档的个数。5.根据权利要求1-4任一所述的方法,其特征在于,所述步骤S2还包括:对于任一所述词语,若该词语的情感极性为积极情感且该词语的前一个词语为否定词,则将该词语和所述否定词合成为一个词语,合成的词语的情感极性为消极情感;对于任一所述词语,若该词语的情感极性为消极情感且该词语的前一个词语为否定词,则将该词语和所述否定词合成为一个词语,...
【专利技术属性】
技术研发人员:吴德胜,任蕊,梁樑,
申请(专利权)人:中国科学院大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。