关联信息的推送方法及装置制造方法及图纸

技术编号:15792097 阅读:299 留言:0更新日期:2017-07-09 23:19
本发明专利技术公开了一种关联信息的推送方法及装置,至少能够解决现有技术中由于并未考虑语义之间的关联关系,导致推送结果无法更好地迎合用户需求的技术问题。该方法包括:根据机器学习算法对获取到的原始语料数据进行机器学习,确定获取到的原始语料数据之间的关联关系;将原始语料数据以及原始语料数据之间的关联关系存储到预设的语料数据库中;根据语料数据库中存储的原始语料数据之间的关联关系,确定与显示信息相对应的关联信息,并对关联信息进行推送。

【技术实现步骤摘要】
关联信息的推送方法及装置
本专利技术涉及信息
,具体涉及一种关联信息的推送方法及装置。
技术介绍
随着互联网的飞速发展,越来越多的用户习惯于通过网络获取各类信息。很多用户为了加深对当前浏览信息的了解,会针对当前浏览信息进行扩展阅读。在传统方式中,用户为了实现扩展阅读的目的,需要自行确定当前浏览信息中包含的关键内容,然后根据该关键内容进行手动搜索,最后还要从众多搜索结果中过滤出用户需要了解的信息。该种方式操作繁琐,无疑增加了用户的时间成本。目前,已经出现了能够自动地针对当前浏览信息推送关联信息的技术方案:首先,对当前浏览信息进行分词处理,得到当前浏览信息中包含的主要词汇;然后,根据各个词汇的出现次数等因素,挑选部分词汇作为关键词;最后,将包含上述关键词的信息作为关联信息推送给用户。但是,专利技术人在实现本专利技术的过程中发现现有技术中的上述方案至少存在下述缺陷:一方面,汉语中存在各种各样的近义词,并且,很多情况下,同一主题可以通过截然不同的表达方式进行描述,例如,“双十一”和“网购节”虽字面表达方式不同,但语义完全相同;另一方面,上述简单的关键词匹配方式也无法体现出事物之间更深层次的关联关系,例如,“姚明”和“科比”同为篮球运动员,阅读“姚明”的有关信息的用户很可能希望对“科比”的近况进行扩展阅读,而现有的推送方式显然无法实现。由此可见,现有的关联信息推送方式由于并未考虑语义之间的关联关系,导致推送结果无法更好地迎合用户需求。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的关联信息的推送方法及装置。根据本专利技术的一个方面,提供了一种关联信息的推送方法,包括:根据机器学习算法对获取到的原始语料数据进行机器学习,确定所述获取到的原始语料数据之间的关联关系;将所述原始语料数据以及所述原始语料数据之间的关联关系存储到预设的语料数据库中;根据所述语料数据库中存储的原始语料数据之间的关联关系,确定与显示信息相对应的关联信息,并对所述关联信息进行推送。可选地,所述根据机器学习算法对获取到的原始语料数据进行机器学习,以确定所述获取到的原始语料数据之间的关联关系的步骤具体包括:将所述获取到的原始语料数据转换成对应的词向量,将所述词向量输入预设的神经网络模型中的输入层,并通过所述神经网络模型中的输出层获取所述词向量对应的关联输出结果。可选地,所述神经网络模型进一步包括:位于所述输入层和所述输出层之间的隐藏层;则所述通过所述神经网络模型中的输出层获取所述词向量对应的关联输出结果的步骤具体包括:通过所述隐藏层对所述输入层输入的词向量进行特征提取,由所述输出层根据特征提取的结果输出所述词向量对应的关联输出结果。可选地,所述根据机器学习算法对获取到的原始语料数据进行机器学习的步骤中进一步包括:判断所述词向量对应的关联输出结果是否满足预设的精度条件,当判断结果为否时,根据反向传播算法对所述神经网络模型进行修正。可选地,所述根据所述语料数据库中存储的原始语料数据之间的关联关系,确定与显示信息相对应的关联信息的步骤具体包括:获取各个网络信息对应的关键词,根据所述网络信息对应的关键词以及所述语料数据库中存储的原始语料数据之间的关联关系,确定各个网络信息之间的关联映射关系;将所述各个网络信息之间的关联映射关系存储到预设的映射数据库中,根据所述显示信息对应的关键词以及所述映射数据库确定与显示信息相对应的关联信息。可选地,所述获取各个网络信息对应的关键词的步骤之后,进一步包括步骤:根据关键词与网络信息之间的对应关系建立用于根据关键词查询网络信息的信息索引。可选地,所述根据所述显示信息对应的关键词以及所述映射数据库确定与显示信息相对应的关联信息的步骤之后进一步包括:当所述关联信息的数量为多个时,进一步根据相似度算法确定各个关联信息与所述显示信息之间的相似度,将相似度大于预设的第一阈值,和/或相似度小于预设的第二阈值的关联信息删除;其中,所述第一阈值大于所述第二阈值。可选地,所述原始语料数据通过分布式消息队列进行获取,且所述语料数据库能够根据所述分布式消息队列的更新结果进行更新。可选地,所述关联信息包括以下中的至少一个:新闻信息、导航信息、网页信息以及搜索信息。根据本专利技术的另一个方面,提供了一种关联信息的推送装置,包括:学习模块,适于根据机器学习算法对获取到的原始语料数据进行机器学习,确定所述获取到的原始语料数据之间的关联关系;存储模块,适于将所述原始语料数据以及所述原始语料数据之间的关联关系存储到预设的语料数据库中;确定模块,适于根据所述语料数据库中存储的原始语料数据之间的关联关系,确定与显示信息相对应的关联信息;推送模块,适于对所述关联信息进行推送。可选地,所述学习模块具体用于:将所述获取到的原始语料数据转换成对应的词向量,将所述词向量输入预设的神经网络模型中的输入层,并通过所述神经网络模型中的输出层获取所述词向量对应的关联输出结果。可选地,所述神经网络模型进一步包括:位于所述输入层和所述输出层之间的隐藏层;则所述学习模块进一步用于:通过所述隐藏层对所述输入层输入的词向量进行特征提取,由所述输出层根据特征提取的结果输出所述词向量对应的关联输出结果。可选地,所述学习模块进一步用于:判断所述词向量对应的关联输出结果是否满足预设的精度条件,当判断结果为否时,根据反向传播算法对所述神经网络模型进行修正。可选地,所述确定模块包括:第一确定单元,适于获取各个网络信息对应的关键词,根据所述网络信息对应的关键词以及所述语料数据库中存储的原始语料数据之间的关联关系,确定各个网络信息之间的关联映射关系;第二确定单元,适于将所述各个网络信息之间的关联映射关系存储到预设的映射数据库中,根据所述显示信息对应的关键词以及所述映射数据库确定与显示信息相对应的关联信息。可选地,所述装置进一步包括:信息索引建立模块,适于根据关键词与网络信息之间的对应关系建立用于根据关键词查询网络信息的信息索引。可选地,所述装置进一步包括:筛选模块,适于当所述关联信息的数量为多个时,进一步根据相似度算法确定各个关联信息与所述显示信息之间的相似度,将相似度大于预设的第一阈值,和/或相似度小于预设的第二阈值的关联信息删除;其中,所述第一阈值大于所述第二阈值。可选地,所述原始语料数据通过分布式消息队列进行获取,且所述语料数据库能够根据所述分布式消息队列的更新结果进行更新。可选地,所述关联信息包括以下中的至少一个:新闻信息、导航信息、网页信息以及搜索信息。在本专利技术提供的关联信息的推送方法及装置中,能够根据机器学习算法对获取到的原始语料数据进行机器学习,从而确定原始语料数据之间的关联关系;然后,能够根据已确定的原始语料数据之间的关联关系来确定与显示信息相对应的关联信息。由此可见,由于本专利技术能够通过机器学习的方式来挖掘原始语料数据之间的关联关系,而该关联关系不仅能够体现近义词之间的关联,还能够通过语义分析而体现出事物间更深层次的关联,所以,本专利技术中的方案更能迎合用户需求,且大幅提升了推送的关联信息的质量。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂本文档来自技高网...
关联信息的推送方法及装置

【技术保护点】
一种关联信息的推送方法,包括:根据机器学习算法对获取到的原始语料数据进行机器学习,确定所述获取到的原始语料数据之间的关联关系;将所述原始语料数据以及所述原始语料数据之间的关联关系存储到预设的语料数据库中;根据所述语料数据库中存储的原始语料数据之间的关联关系,确定与显示信息相对应的关联信息,并对所述关联信息进行推送。

【技术特征摘要】
2017.02.14 CN 20171007941221.一种关联信息的推送方法,包括:根据机器学习算法对获取到的原始语料数据进行机器学习,确定所述获取到的原始语料数据之间的关联关系;将所述原始语料数据以及所述原始语料数据之间的关联关系存储到预设的语料数据库中;根据所述语料数据库中存储的原始语料数据之间的关联关系,确定与显示信息相对应的关联信息,并对所述关联信息进行推送。2.根据权利要求1所述的方法,其中,所述根据机器学习算法对获取到的原始语料数据进行机器学习,以确定所述获取到的原始语料数据之间的关联关系的步骤具体包括:将所述获取到的原始语料数据转换成对应的词向量,将所述词向量输入预设的神经网络模型中的输入层,并通过所述神经网络模型中的输出层获取所述词向量对应的关联输出结果。3.根据权利要求2所述的方法,其中,所述神经网络模型进一步包括:位于所述输入层和所述输出层之间的隐藏层;则所述通过所述神经网络模型中的输出层获取所述词向量对应的关联输出结果的步骤具体包括:通过所述隐藏层对所述输入层输入的词向量进行特征提取,由所述输出层根据特征提取的结果输出所述词向量对应的关联输出结果。4.根据权利要求2或3所述的方法,其中,所述根据机器学习算法对获取到的原始语料数据进行机器学习的步骤中进一步包括:判断所述词向量对应的关联输出结果是否满足预设的精度条件,当判断结果为否时,根据反向传播算法对所述神经网络模型进行修正。5.根据权利要求1所述的方法,其中,所述根据所述语料数据库中存储的原始语料数据之间的关联关系,确定与显示信息相对应的关联信息的步骤具体包括:获取各个网...

【专利技术属性】
技术研发人员:王立宁王志刚
申请(专利权)人:北京时间股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1