基于新闻事件搜索语句的新闻事件排序方法及系统技术方案

技术编号:18809931 阅读:47 留言:0更新日期:2018-09-01 09:25
本发明专利技术涉及计算机技术领域,具体提供了一种基于新闻事件搜索语句的新闻事件排序方法及系统,旨在解决在考虑用户主观信息的情况下,如何实现新闻事件排序的技术问题。为此目的,本发明专利技术中的新闻事件排序方法,能够通过预设的新闻事件排序模型对预先获取的新闻事件搜索语句进行识别,得到按照相关度大小排序的新闻事件排序结果。其中,新闻事件搜索语句包含能够表征用户情感倾向的用户主观信息。基于此,本发明专利技术能够结合用户对新闻事件的情感倾向,按照新闻事件与用户偏好相关程度进行排序,从而提高新闻事件排序结果的准确性。同时,本发明专利技术中的系统能够执行并实现上述方法。

News event sorting method and system based on news event search statement

The invention relates to the field of computer technology, in particular to a news event sequencing method and system based on news event search statements, aiming at solving the technical problem of how to realize news event sequencing under the consideration of subjective information of users. To this end, the news event sorting method in the invention can identify the pre-acquired news event search statements by the preset news event sorting model, and obtain the news event sorting results sorted according to the correlation degree. Among them, the news event search statement contains user subjective information that can represent the user's emotional tendencies. Based on this, the invention can sort news events according to the degree of correlation between news events and user preferences in combination with the emotional inclination of users to improve the accuracy of news event ranking results. At the same time, the system in the invention can execute and implement the above method.

【技术实现步骤摘要】
基于新闻事件搜索语句的新闻事件排序方法及系统
本专利技术涉及计算机
,具体涉及一种基于新闻事件搜索语句的新闻事件排序方法及系统。
技术介绍
新闻事件排序技术指的是在互联网新闻领域中,按照预设的排序规则对新闻事件排序,以便于用户快速浏览到相应新闻的技术。当前新闻事件排序方法主要包括按照新闻事件的重要程度排序和按照用户搜索信息与新闻事件的相关度排序两种方法。例如,《ModelingEventImportanceforRankingDailyNewsEvents》(Vinay,2017InProceedingsoftheTenthACMInternationalConferenceonWebSearchandDataMining(pp.231-240).ACM.)公开了一种基于新闻事件的当前流行度与历史信息,对新闻事件的重要程度建模的方法。《Algorithmforrankingnews》(Liu,InSemantics,KnowledgeandGrid,ThirdInternationalConferenceon,pp.314-317.IEEE,2007.)公开的新闻排序方法以关键本文档来自技高网...

【技术保护点】
1.一种基于新闻事件搜索语句的新闻事件排序方法,其特征在于,所述方法包括:通过预设的新闻事件排序模型对预先获取的新闻事件搜索语句进行识别,得到按照相关度大小排序的新闻事件排序结果;其中,所述新闻事件搜索语句包含事件客观信息和用户主观信息;所述相关度为所获取新闻事件搜索语句与新闻事件的相关程度;所述预设的新闻事件排序模型为基于神经网络构建的模型。

【技术特征摘要】
1.一种基于新闻事件搜索语句的新闻事件排序方法,其特征在于,所述方法包括:通过预设的新闻事件排序模型对预先获取的新闻事件搜索语句进行识别,得到按照相关度大小排序的新闻事件排序结果;其中,所述新闻事件搜索语句包含事件客观信息和用户主观信息;所述相关度为所获取新闻事件搜索语句与新闻事件的相关程度;所述预设的新闻事件排序模型为基于神经网络构建的模型。2.根据权利要求1所述的基于新闻事件搜索信息的新闻事件排序方法,其特征在于,所述预设的新闻事件排序模型的网络训练方法为:根据预设的新闻事件搜索语句样本获取新闻事件样本集;所述预设的新闻事件搜索语句样本包含事件客观信息和用户主观信息,所述新闻事件样本集包含按照特定顺序排序的新闻事件和对应的评论信息;获取所述预设的新闻事件搜索语句样本与新闻事件样本集的相关性特征;基于所获取的相关性特征,并根据所述新闻事件搜索语句样本和新闻事件样本集,对所述预设的新闻事件排序模型进行网络训练。3.根据权利要求2所述的基于新闻事件搜索信息的新闻事件排序方法,其特征在于,“根据预设的新闻事件搜索语句样本获取新闻事件样本集”的步骤具体包括:基于预设的新闻事件搜索引擎,并根据所述预设的新闻事件搜索语句样本,获取新闻事件的客观属性信息和评论信息;所述客观属性信息包括新闻事件的标题和文档内容;标注所述评论信息的情感极性;所述情感极性包括正向、负向和中性;获取每个新闻事件的情感极性比例,并根据所获取的情感极性比例对新闻事件排序,得到新闻事件样本集。4.根据权利要求3所述的基于新闻事件搜索信息的新闻事件排序方法,其特征在于,“获取所述预设的新闻事件搜索语句样本与新闻事件样本集的相关性特征”的步骤具体包括:根据所述预设的新闻事件搜索语句样本中的事件客观信息,以及所述新闻事件样本集中新闻事件的客观属性信息,获取第一相关性特征;根据所述预设的新闻事件搜索语句样本中的用户主观信息,以及所述新闻事件样本集中新闻事件的评论信息,获取第二相关性特征;其中,所述第一相关性特征包括所述预设的新闻事件搜索语句样本中的事件客观信息分别与所述新闻事件的标题和文档内容的相似度;所述第二相关性特征包括所述预设的新闻事件搜索语句样本中的用户主观信息与所述新闻事件的评论信息的相似度。5.根据权利要求4所述的基于新闻事件搜索信息的新闻事件排序方法,其特征在于,所述新闻事件的客观属性信息还包括新闻事件的网络链接;“获取所述预设的新闻事件搜索语句样本与新闻事件样本集的相关性特征”的步骤还包括:根据所述新闻事件样本集中新闻事件的客观属性信息,获取所述新闻事件的标题长度、文档内容长度和网络链接长度;根据所述新闻事件样本集中新闻事件的客观属性信息和评论信息,获取所述事件客观信息的关键词在所述新闻事件的标题、文档内容、评论信息和网络链接中的出现频率和逆文档频率;利用BM25算法,获取所述关键词与所述新闻事件的标题、文档内容、评论信息和网络链接的相似度值。6.根据权利要求5所述的基于新闻事件搜索信息的新闻事件排序方法,其特征在于,“获取所述预设的新闻事件搜索语句样本与新闻事件样本集的相关性特征”的步骤还包括:根据所述网络链接,获取所述新闻事件的发布网站特征信息;基于预设的新闻发布网站重要程度排名,并根据所获取的发布网站特征信息,确定所述新闻事件的网络链接重要程度特征。7.根据权利要求2-6任一项所述的基于新闻事件搜索信息的新闻事件排序方法,其特征在于,所述方法还包括对所述预设的新闻事件搜索语句样本或所述新闻事件搜索语句进行预处理的步骤,具体为:对所述预设的新闻事件搜索语句样本或所述新闻事件搜索语句中的词语进行扩充,得到新闻事件搜索词语集,以能够根据所述新闻事件搜索词语集获取所述新闻事件排序结果,或对所述预设的新闻事件排序模型进行网络训练。8.一种基于新闻事件搜索语句的新闻事件排序系统,其特征在于,所述系统包括新闻事件排序模型;所述新闻事件排序模型,配置为对预先获取的新闻事件搜索语句进行识别,得到按照相关度大小排序的新闻事件排序结果;其中,所述新闻事件搜索语句包含事件客观信息和用户主观信息;所述相关度为所获取新闻事件搜索语句与新闻事件的相关程度;所述预设的新闻事件排序模型为基于神经网络构建的模型。9.根据权利要求8所述的基于新...

【专利技术属性】
技术研发人员:孔庆超汪立东孔祥飞王慧王博刘春阳张旭王磊李雄
申请(专利权)人:中国科学院自动化研究所国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1