计算股票涨跌概率的方法和装置制造方法及图纸

技术编号:20161248 阅读:441 留言:0更新日期:2019-01-19 00:14
本发明专利技术公开了一种计算股票涨跌概率的方法和装置,该方法包括:获取针对同一支股票sj的股票评论数据集

【技术实现步骤摘要】
计算股票涨跌概率的方法和装置
本专利技术涉及人工智能和大数据领域,具体涉及一种计算股票涨跌概率的方法、装置、电子设备和计算机可读存储介质。
技术介绍
投资者通常会利用搜索引擎寻找相关价值信息帮助其最终决策,而这些决策过程大部分是依靠人的分析判断以及经验。事实上,互联网中的股票评论数据包含了丰富且有价值的语义信息,能够帮助投资者理解市场走势以及股票动态。已有的股票评论分析方法通常仅仅聚焦在捕获股票评论的情感极性,从而理解股票评论对于市场走势的宏观作用。然而,互联网中的股票评论往往包含了大量的噪声,如水军以及个人主观倾向从众心理等,从而严重地影响投资者的判断。因此利用人工智能技术对股票评论信息进行细粒度权威性分析,进而自动地为股民和股票分析师从海量信息中精选优质股票是非常有意义的。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的计算股票涨跌概率的方法、装置、电子设备和计算机可读存储介质。依据本专利技术的一个方面,提供了一种计算股票涨跌概率的方法,该方法包括:获取针对同一支股票sj的股票评论数据集根据如下公式计算该支股票的涨跌概率cf(sj):本文档来自技高网...

【技术保护点】
1.一种计算股票涨跌概率的方法,其中,该方法包括:获取针对同一支股票sj的股票评论数据集

【技术特征摘要】
1.一种计算股票涨跌概率的方法,其中,该方法包括:获取针对同一支股票sj的股票评论数据集根据如下公式计算该支股票的涨跌概率cf(sj):其中,表示股票评论数据集中的股票评论数据数量,ci表示一条股票评论数据,为该条股票评论数据的观点极性,为该条股票评论数据的可靠性指数,rυ(ci)为对该条股票评论数据进行可靠性分类的准确值;当cf(sj)≥0时,股票sj涨,且涨的概率是|cf(sj)|;当cf(sj)<0时,股票sj跌,且跌的概率是|cf(sj)|。2.如权利要求1所述的方法,其中,根据如下方法确定一条股票评论数据的观点极性获取由股票评论数据组成的训练集和验证集,并为训练集和验证集中的每条股票评论数据标注观点极性;基于标注后的训练集,对机器学习模型进行训练,并基于标注后的测试集对所述学习模型的效果进行评测,得到训练后的机器学习模型;将待预测的股票评论数据的相关信息输入到所述训练后的机器学习模型,得到该机器学习模型输出的该股票评论数据的观点极性分类信息,并根据该观点极性分类信息确定该股票评论数据的观点极性。3.如权利要求1所述的方法,其中,根据如下公式确定一条股票评论数据的可靠性指数其中,代表日期,是的股票价格,是后一天的股票价格,是股票评论观点极性。4.如权利要求1所述的方法,其中,根据如下方式确定对一条股票评论数据进行可靠性分类的准确值rυ(ci):基于股票评论数据集和股价序列集提取特征向量;利用所提取的特征向量训练基于径向基核函数的支持向量机SVM模型;利用股价序列集训练用于预测股价的机器学习模型;集成所述SVM模型和用于预测股价的机器学习模型,得到用于评价股票评论可靠性的分类模型则rυ(ci)的值越大,表示对股票评论可靠性的分类结果越可靠。5.如权利要求4所述的方法,其中,所述基于股票评论数据集和股价序列集提取特征向量包括:基于所述股票评论数据集中的至少部分股票评论数据中的每一条股票评论数据,提取如下特征中的一种或多种组成一个特征向量:该条股票评论数据的看涨或看跌的观点极性信息;在t当日发布的所有针对股票s的股票评论数据中,看涨的股票评论数据数量、看跌的股票评论数据数量;从t日起过去的第一预设长度时间内发布的,所有针对股票s的股票评论数据中,看涨的股票评论数据数量、看跌的股票评论数据数量、观点正确的股票评论数据数量和观点错误的股票评论数据数量;从t日起过去的第二预设长度时间内的股票s的价格序列;所述用于预测股价的机器学习模型预测的股票s在下一个交易日的价格以及该模型输出的标准差;从t日起过去的第三预设长度时间内,股票评论员a发布的所有股票评论数据中,看涨的股票评论数据数量、看跌的股票评论数据数量、观点正确的股票评论数据数量和观点错误的股票评论数据数量;从t日...

【专利技术属性】
技术研发人员:王浩张晨庞旭林杜长营杨康
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1