【技术实现步骤摘要】
事件脉络生成方法和装置
本专利技术涉及网络技术,特别涉及事件脉络生成方法和装置。
技术介绍
当前,用户在使用搜索引擎等进行搜索时,如对某一事件进行搜索时,只能将与该事件相关的各个资源如新闻资源,按照预定方式进行排序等处理后,展示给用户。而用户如果想要了解事件进展的主要过程,则需要分别查找对应的资源并进行查看,实现起来非常困难,从而降低了用户的信息获取效率。
技术实现思路
有鉴于此,本专利技术提供了事件脉络生成方法和装置,能够提高用户的信息获取效率。具体技术方案如下:一种事件脉络生成方法,包括:针对待处理的事件,分别获取各时间窗口内的资源;针对每个时间窗口,分别确定出所述时间窗口内的各资源的重要性评分,并从所述时间窗口内的各资源中选出重要性评分符合预定要求的资源,将选出的资源作为所述时间窗口内的代表性资源;将各时间窗口内的代表性资源按照时间顺序进行组合,得到事件脉络。一种事件脉络生成装置,包括:处理单元;所述处理单元,用于针对待处理的事件,分别获取各时间窗口内的资源;针对每个时间窗口,分别确定出所述时间窗口内的各资源的重要性评分,并从所述时间窗口内的各资源中 ...
【技术保护点】
一种事件脉络生成方法,其特征在于,包括:针对待处理的事件,分别获取各时间窗口内的资源;针对每个时间窗口,分别确定出所述时间窗口内的各资源的重要性评分,并从所述时间窗口内的各资源中选出重要性评分符合预定要求的资源,将选出的资源作为所述时间窗口内的代表性资源;将各时间窗口内的代表性资源按照时间顺序进行组合,得到事件脉络。
【技术特征摘要】
1.一种事件脉络生成方法,其特征在于,包括:针对待处理的事件,分别获取各时间窗口内的资源;针对每个时间窗口,分别确定出所述时间窗口内的各资源的重要性评分,并从所述时间窗口内的各资源中选出重要性评分符合预定要求的资源,将选出的资源作为所述时间窗口内的代表性资源;将各时间窗口内的代表性资源按照时间顺序进行组合,得到事件脉络。2.根据权利要求1所述的方法,其特征在于,该方法进一步包括:获取训练样本,根据所述训练样本训练得到评估模型;所述分别确定出所述时间窗口内的各资源的重要性评分包括:根据所述评估模型,分别确定出所述时间窗口内的各资源的重要性评分。3.根据权利要求2所述的方法,其特征在于,所述根据所述评估模型,分别确定出所述时间窗口内的各资源的重要性评分包括:针对所述时间窗口内的每个资源,分别进行以下处理:将所述资源作为待评估资源,将所述待评估资源与所述时间窗口内的其它每个资源分别组成一个资源对;根据所述评估模型分别获取到每个资源对中的两个资源孰优孰劣的判定结果;统计判定结果满足以下条件的资源对数:所述待评估资源优于所在资源对中的另一资源;将统计结果作为所述待评估资源的重要性评分。4.根据权利要求3所述的方法,其特征在于,每个训练样本中包括:分别从一个资源对中的两个资源中提取出的特征,以及,两个资源孰优孰劣的判定结果;所述根据所述评估模型分别获取到每个资源对中的两个资源孰优孰劣的判定结果包括:分别提取出每个资源对中的两个资源的特征;根据提取出的特征以及所述评估模型,分别获取到每个资源对中的两个资源孰优孰劣的判定结果。5.根据权利要求4所述的方法,其特征在于,所述获取训练样本包括:将任一事件对应的任一时间窗口内的资源进行展示;获取从所展示的资源中选定的优质资源;分别将每个优质资源与所展示的每个非优质资源组成一个资源对;分别生成每个资源对对应的训练样本。6.根据权利要求3所述的方法,其特征在于,所述评估模型的个数为一个或大于一个;所述根据所述训练样本训练得到评估模型包括:分别根据所述训练样本训练得到每个评估模型;所述根据所述评估模型分别获取到每个资源对中的两个资源孰优孰劣的判定结果包括:当所述评估模型数大于一时,针对每个资源对,分别根据每个评估模型获取到一个判定结果,将各判定结果进行汇总,根据汇总结果确定出最终的判定结果。7.根据权利要求6所述的方法,其特征在于,所述评估模型包括以下之一或任意组合:支持向量机模型、逻辑回归模型、随机森林模型。8.根据权利要求4所述的方法,其特征在于,从每个资源中提取出的特征包括以下之一或任意组合:纯文本特征、资源热度特征、搜索热度特征、相似资源数特征。9.根据权利要求1所述的方法,其特征在于,所述从所述时间窗口内的各资源中选出重要性评分符合预定要求的资源,将选出的资源作为所述时间窗口内的代表性资源包括:从所述时间窗口内的各资源中选出重要性评分最高的N个资源,N为正整数,将选出的资源作为所述时间窗口内的代表性资源;或者,从所述时间窗口内的各资源中选出重要性评分大于预定阈值的资源,将选出的资源作为所述时间窗口内的代表性资源。10.一种事件脉络生成装置,其特征在于,包括:处理单元;所述处理单元,用于针对待处理的事件,分别获取各时间窗口内的资源;针对每个时间窗口,分别确定出所述时间窗口内的各资源的重要性评分,并从所述时间窗口内的各资源中选...
【专利技术属性】
技术研发人员:莫洋,沈剑平,黄强,郑景耀,骆金昌,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。