The invention discloses a media information tensor supervised learning method, using tensor to represent media information space, which can be of different dimensions and the relationship between information record, and based on the relationship between the fluctuation of media information tensor by supervised learning algorithm to capture the Internet media and the stock market, thus to predict the stock market. The invention has the following advantages: (1) tensor is used to represent the media information space, so that the relationship between different dimension information is recorded; (2) tensor supervised learning algorithm realizes the expansion of computer learning algorithm from vector to tensor.
【技术实现步骤摘要】
媒体信息张量监督学习方法
本专利技术涉及一种监督学习方法,尤其涉及一种媒体信息张量监督学习方法。
技术介绍
随着信息技术的发展,互联网媒体逐渐成为主流的媒体形式。特别是以博客、微博、社会化新闻、维基百科和网络论坛为主的社会化媒体的兴起,其媒体影响力日益加剧。海量信息和裂变式传播使互联网媒体对股票市场产生了举足轻重的影响。当结合不同纬度信息预测股票价格波动时,现有技术是将不同维度的信息特征值拼接为一个超级特征向量,然后运用基于向量预测模型去探测互联网媒体信息对股市的影响。但是,由于不同维度的信息是交互影响,并且紧密相关、互为补充,将不同维度的信息之间的关联隔断后直接拼接成一为一个超级特征向量,这样容易出现维度灾难。维度灾难,即在机器学习算法中输入的属性向量长度过长,导致算法性能不再随信息量的增多而提高,反而使算法效果降低。并且在拼接超级特征向量的时候,认为不同维度的信息特征是相互独立的,减弱了不同维度信息特征间的相互作用,甚至是忽略了他们之间的联系。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种用张量来表示媒体信息空间,从而可以将不同维度的信息和之间的相互关系纪录下来的方式,并基于媒体信息张量利用监督学习算法来捕捉互联网媒体与股票市场的波动关系,对股票市场进行预测。为达到上述目的,本专利技术的实施例采用如下技术方案:本专利技术实施例提供一种媒体信息张量监督学习方法,具体包括:S1、收集媒体信息;可选地,所述媒体信息包括市场交易信息、媒体新闻信息、股民情感信息;市场交易信息来自于公司的基本数据,如股票的交易价格、公司的规模、交易数量等信息,能从数 ...
【技术保护点】
一种媒体信息张量监督学习方法,其特征在于:它包括如下步骤:S1、收集媒体信息;S2、构建n阶媒体信息张量x;S3、构建n阶张量监督学习算法的超平面函数f(χ)=χ×1a1×2a2...×nan+b;S4、基于媒体信息训练样本集求解超平面函数中的参数ak、b,其中k=1、2、…n;S5、基于计算的超平面函数f(χ)=χ×1a1×2a2...×nan+b对股票波动进行预测。
【技术特征摘要】
1.一种媒体信息张量监督学习方法,其特征在于:它包括如下步骤:S1、收集媒体信息;S2、构建n阶媒体信息张量x;S3、构建n阶张量监督学习算法的超平面函数f(χ)=χ×1a1×2a2...×nan+b;S4、基于媒体信息训练样本集求解超平面函数中的参数ak、b,其中k=1、2、…n;S5、基于计算的超平面函数f(χ)=χ×1a1×2a2...×nan+b对股票波动进行预测。2.根据权利要求1所述的媒体信息张量监督学习方法,其特征在于:所述媒体信息包括市场交易信息、媒体新闻信息、股民情感信息。3.根据权利要求1所述的媒体信息张量监督学习方法,其特征在于:所述步骤S4中求解ak、b,其中k=1、2、…n的步骤为:S41、设置m=0;S42、m=m+1;S43、令βk,k≠m=||ak||2,S44、通过计算am;其中,为目标函数,为约束条件;C为惩罚因子,ε为误差,ξ为松弛变量;S45、判断问题是否收敛,若是则执行步骤S46,若不是,则执行步骤S42;S46、输出:ak、b,其中k=1、2、…n,惩罚因子C,误差ε。4.根据权利要求3所述的媒体信息张量监督学习方法,其特征在于:所述目标函数及所述约束条件的构建过程为:当张量为二阶张量时,令其张量监督学习算法的回归函数为f(x)=uTxv+b,通过张量的内积计算,转换后f(x)=〈x,uvT〉+b;其中,向量目标值通过||uvT||保证回归函数的泛化能力,构建张量回归问题如下:引入松弛变量ξ和惩罚因子C对异常点进行处理,引入异常点后,其张量回归问题如下:其中,C值越大则松弛变量在目标问题中所占比重越大,异常点付出的成本就越多,回归函数允许出现的异常点就更少,反之亦然。5.根据权利要求4所述的媒体信息张量监督学习方法,其特征在于:求解所述u,v,b的步骤为:引入拉格朗日因子,张量回归问题转换为:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。