当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于高维数据结构关系的预测方法技术

技术编号:17561935 阅读:73 留言:0更新日期:2018-03-28 12:24
本发明专利技术公开了一种基于高维数据结构关系的预测方法,包括以下步骤:通过爬虫技术获取新浪股吧和东方财富股吧的帖子和回帖,又获得了百度高级搜索的特定新闻。对帖子和新闻进行自然语义处理得到特征,再结合通过公式计算得到技术指标特征。对三个特征进行张量构造,并通过高阶奇异值分解对张量进行重构,达到降噪和加强各因素关系的目的。每一天获取以上步骤的张量信息体,通过与升降价格信息的对应关系,进行我们提出的重构算法重构数据,得到新的张量序列。这里面通过重构限制,使升降程度相似或升降方向一直的信息体相似。对新的张量序列进行优化张量岭回归。回归预测,作为辅助交易系统。

A prediction method based on the structure relationship of high dimension data

The invention discloses a prediction method based on the relationship of high-dimensional data structure, including the following steps: obtaining the posts and replies of Sina stock bar and orient fortune stock by reptile technology, and obtaining the specific news of Baidu's advanced search. The characteristics of natural semantic processing of Posts and news are obtained, and then the characteristics of technical indexes are obtained by formula calculation. The tensor is constructed for three features, and the tensor is reconstructed by high order singular value decomposition to reduce the noise and strengthen the relationship between various factors. Each day, we get the tensor information body of the above steps, and reconstruct the data through the corresponding relation between the lifting price information and the lifting price information, and get the new tensor sequence. In this, it is similar to the information body that is similar to or in the direction of ascending and descending. The new tensor ridge regression is optimized for the new tensor sequence. Regression forecasting, as an auxiliary trading system.

【技术实现步骤摘要】
一种基于高维数据结构关系的预测方法
本专利技术涉及高维数据结构领域,尤其涉及一种基于高维数据结构关系的预测方法。
技术介绍
股市预测长期以来一直是特别活跃的研究领域。有效市场假说(EMH)表明,股票市场价格主要受到新闻,股票市场情绪,公司业绩(如资产回报率,杠杆率)等因素的影响,因为股市效率导致现有股价始终纳入并反映所有相关信息。有两个有趣的例子,一个是联合航空公司最近因为“重新安置”事件,损失了3亿美元的市值,另一个是由于浑水机构的看跌报告,辉山乳业的市场价值下滑了90%。在这两个事件中,事件本身的力量和在线讨论的力量都得出最终结果,这些说明了信息的市场价值。近几十年来,社交网络数据更易于访问,比以往更为重要。许多研究试图在各种应用中使用社会情感和社交网络数据,例如,Asur和Huberman提供了一个示范,如Twitter上表达的,与电影相关的公众情绪如何可以预测盒子收据。然后Bollen等表明情绪时间序列预示了道琼斯工业平均指数(DJIA)收盘价值的变化。传统的方法简单,正确预测的能力就会降低。如果使用稀疏的社会信息,就会有太多的噪音。缺乏复杂数据结构的有效预测模型,如张量。专本文档来自技高网...
一种基于高维数据结构关系的预测方法

【技术保护点】
一种基于高维数据结构关系的预测方法,其特征在于,所述预测方法包括以下步骤:1)通过爬虫技术获取新浪股吧和东方财富股吧的帖子和回帖,获得了百度高级搜索的特定新闻;2)对帖子和新闻进行自然语义处理得到特征,再结合通过公式计算得到技术指标特征;3)对三个特征进行张量构造,并通过高阶奇异值分解对张量进行重构,达到降噪和加强各因素关系的目的;4)通过算法重构限制,使升降程度相似或升降方向一直的信息体相似;5)对新的张量序列进行优化张量岭回归;6)回归预测,作为辅助交易系统。

【技术特征摘要】
1.一种基于高维数据结构关系的预测方法,其特征在于,所述预测方法包括以下步骤:1)通过爬虫技术获取新浪股吧和东方财富股吧的帖子和回帖,获得了百度高级搜索的特定新闻;2)对帖子和新闻进行自然语义处理得到特征,再结合通过公式计算得到技术指标...

【专利技术属性】
技术研发人员:李岳楠张桐喆苏育挺井佩光
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1