【技术实现步骤摘要】
确定新闻与股票之间的关联状态的方法、设备和存储介质
[0001]本公开总体上涉及信息处理领域,并且更具体地,涉及用于确定新闻与股票之间的关联状态的方法、设备和存储介质。
技术介绍
[0002]事件通常会影响股票的走势,为了用户在阅读网页中的与事件有关的新闻时能够快速确定该事件可能对哪些股票产生影响,通常将与事件有关的新闻关联到可能受影响的股票,例如为与事件有关的新闻增加相关联的股票的标签或链接。传统的确定新闻与股票之间的关联状态(例如,关联程度)的技术方案通常将股票的特征词直接与新闻的全文进行正则匹配,基于股票的特征词在新闻的全文中出现的次数来确定新闻与股票之间的关联状态,但并未考虑到股票的特征词在新闻中出现的位置不同对关联状态的影响不同、股票的不同特征词对关联状态的影响不同、股票的部分特征词可能存在歧义等问题,从而所确定的新闻与股票之间的关联状态的准确度低。
[0003]综上,传统的确定新闻与股票之间的关联状态的方法的不足之处在于:无法准确地确定新闻与股票之间的关联状态。
技术实现思路
[0004]...
【技术保护点】
【技术特征摘要】
1.一种用于确定新闻与股票之间的关联状态的方法,其特征在于,所述方法包括:将所获取的网页中的目标新闻的标题与股票的特征词进行匹配;如果所述目标新闻的所述标题与所述股票的所述特征词相匹配,则基于第一算法,计算所述目标新闻的所述标题相对于所述股票的标题关联状态表征数据;将所述目标新闻的正文与所述股票的所述特征词进行匹配;如果所述目标新闻的所述正文与所述股票的所述特征词相匹配,则基于第二算法,计算所述目标新闻的所述正文相对于所述股票的正文关联状态表征数据,其中所述第二算法与所述第一算法不同;以及基于所述标题关联状态表征数据和所述正文关联状态表征数据,确定所述目标新闻相对于所述股票的关联状态。2.根据权利要求1所述的方法,其特征在于,将所述目标新闻的所述标题与所述股票的所述特征词进行匹配包括:对所述目标新闻的所述标题进行分词以得到与所述目标新闻的所述标题相对应的标题词语集合;判断所述标题词语集合中的词语是否与所述股票的所述特征词相同;以及将所述目标新闻的所述正文与所述股票的所述特征词进行匹配包括:对所述目标新闻的所述正文进行分词以得到与所述目标新闻的所述正文相对应的正文词语集合;判断所述正文词语集合中的词语是否与所述股票的所述特征词相同;其中,所述股票的所述特征词包括所述股票的股票代码、所述股票的股票名称、所述股票的上市公司全称、所述股票的上市公司简称、所述股票的上市公司关联主体标识、用于指示所述股票主营方向的信息。3. 根据权利要求1所述的方法,其特征在于,计算所述目标新闻的所述标题相对于所述股票的所述标题关联状态表征数据包括:响应于所述第一算法指示所述股票的第一特征词对应于第一加权表征数据,并且所述目标新闻的所述标题与所述第一特征词相匹配,则所述标题关联状态表征数据增加所述第一加权表征数据;以及计算所述目标新闻的所述正文相对于所述股票的所述正文关联状态表征数据包括:响应于所述第二算法指示所述股票的所述第一特征词对应于第二加权表征数据,并且所述目标新闻的所述正文与所述第一特征词相匹配,则所述正文关联状态表征数据增加所述第二加权表征数据,所述第二加权表征数据与所述第一加权表征数据不同。4. 根据权利要求3所述的方法,其特征在于,计算所述目标新闻的所述标题相对于所述股票的所述标题关联状态表征数据还包括:响应于所述第一算法指示所述股票的第二特征词对应于第三加权表征数据,并且所述目标新闻的所述标题与所述第二特征词相匹配,则所述标题关联状态表征数据增加所述第三加权表征数据,其中所述第三加权表征数据与所述第一加权表征数据不同;以及计算所述目标新闻的所述正文相对于所述股票的所述正文关联状态表征数据还包括:响应于所述第二算法指示所述股票的所述第二特征词对应于第四加权表征数据,并且所述目标新闻的所述正文与所述第二特征词相匹配,则所述正文关联状态表征数据增加所述第
四加权表征数据,其中所述第四加权表征数据与所述第二加权表征数据不同。5.根据权利要求3所述的方法,其特征在于,计算所述目标新闻的所述标题相对于所述股票的所述标题关联状态表征数据还包括:响应于所述第一算法指示所述股票的所述第一特征词是歧义特征词且对应于第五加权表征数据,并且所述目标新闻的所述标题与所述第一特征词相匹配,则所述标题关联状态表征数据增加所述第五加权表征数据,其中所述第五加权表征数据与所述第一加权表征数据不同;计算所述目标新闻的所述正文相对于所述股票的所述正文关联状态表征数据还包括:响应于所述第二算法指示所述股票的所述第一特征词是歧义特征词且对应于第六加权表征数据,并且所述目标新闻的所述正文与所述第一特征词...
【专利技术属性】
技术研发人员:黄少森,朱峰,
申请(专利权)人:上海朝阳永续信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。