热点知识生成方法及装置制造方法及图纸

技术编号:26418473 阅读:18 留言:0更新日期:2020-11-20 14:13
本发明专利技术提供了一种热点知识生成方法及装置,涉及数据处理技术领域,该方法包括:获取时间窗口内的商品知识数据;商品知识数据包括每种商品的热点参数;按照热点参数对商品知识数据进行分组,按照分组结果将商品知识数据写入多个目标文件;按照目标文件计算商品的热度值;根据商品的热度值生成时间窗口内的热点知识。本发明专利技术可以收集商品知识数据,根据热点参数对商品知识数据进行分组计算,得到商品的热度值,根据商品的热度值生成时间窗口内的热点知识,该方案耗时少,数据处理速度快,且得到热点知识结果准确。

【技术实现步骤摘要】
热点知识生成方法及装置
本专利技术涉及数据处理
,尤其是涉及一种热点知识生成方法及装置。
技术介绍
在银行的客服知识库中,大部分热点知识是通过手工标注来实现的,该方式费时费力,并且人工标标注热点知识的过程,存在一定主观性,标注结果不准确,不能反映坐席员真正的使用情况,是知识库系统中亟待改进的功能。
技术实现思路
本专利技术提供了一种热点知识生成方法及装置,可以提升热点知识的生成效率,节省人工成本,提升数据处理速度和结果准确度。第一方面,本专利技术实施例提供了一种热点知识生成方法,该方法包括:获取时间窗口内的商品知识数据;所述商品知识数据包括每种商品的热点参数;按照所述热点参数对所述商品知识数据进行分组,按照分组结果将所述商品知识数据写入多个目标文件;按照所述目标文件计算商品的热度值;根据所述商品的热度值生成所述时间窗口内的热点知识。第二方面,本专利技术实施例还提供一种热点知识生成装置,该装置包括:获取模块,用于获取时间窗口内的商品知识数据;所述商品知识数据包括每种商品的热点参数;分组模块,用于按照所述热点参数对所述商品知识数据进行分组,按照分组结果将所述商品知识数据写入多个目标文件;计算模块,用于按照所述目标文件计算商品的热度值;生成模块,用于根据所述商品的热度值生成所述时间窗口内的热点知识。第三方面,本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述热点知识生成方法。第四方面,本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述热点知识生成方法的计算机程序。本专利技术实施例带来了以下有益效果:本专利技术实施例提供了一种热点知识生成方案,该方案通过时间窗口获取商品知识数据,其中,商品知识数据包括每种商品的热点参数,之后,按照热点参数对商品知识数据进行分组,按照分组结果将商品知识数据写入多个目标文件,计算每个目标文件中商品的热度值,最后综合多个目标文件中的商品的热度值生成时间窗口内的热点知识。本专利技术实施例可以收集商品知识数据,根据热点参数对商品知识数据进行分组计算,得到商品的热度值,根据商品的热度值生成时间窗口内的热点知识,该方案耗时少,数据处理速度快,且得到热点知识结果准确。本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的热点知识生成方法流程图;图2为本专利技术实施例提供的一种热点知识生成装置结构框图;图3为本专利技术实施例提供的另一种热点知识生成装置结构框图;图4为本专利技术实施例提供的热点知识生成装置中分组模块结构框图;图5为本专利技术实施例提供的计算机设备结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的一种热点知识生成方法及装置,该方法能够按照固定的时间窗口大小,收集知识库后台的点击量、访问频率、评价分数等指标,通过滑动窗口聚合完成热点知识的计算,该方式耗时少、运行速度快、结果准确。为便于对本实施例进行理解,首先对本专利技术实施例所公开的一种热点知识生成方法进行详细介绍。本专利技术实施例提供了一种热点知识生成方法,参见图1所示的一种热点知识生成方法流程图,该方法包括以下步骤:步骤S102,获取时间窗口内的商品知识数据。在本专利技术实施例中,时间窗口是指一段固定的时间长度,例如,可以为一个小时。获取一个小时时间段内商品知识数据。其中,商品可以为金融产品,如理财产品。商品知识数据是该商品的用户关注以及用户使用情况的数据。商品知识数据包括每种商品的热点参数。热点参数是用于描述用户关注程度以及用户使用频率等信息的参数,可以包括一种或多种参数类型。需要说明的是,在获取时间窗口内的商品知识数据之前,需要预先查询坐席知识库,抽取出各知识点时间戳,划分窗口大小,过滤出点击行为、查询频率、评分、收藏数等数据,以便提升数据获取效率。步骤S104,按照热点参数对商品知识数据进行分组,按照分组结果将商品知识数据写入多个目标文件。在本专利技术实施例中,由于知识库中的知识是海量的,为了统计每个窗口下最热门的商品,提升数据处理效率,可以将时间窗口内的多条商品知识数据进行分组处理。可以按照热点参数的类别或各类别对应数值的大小对商品知识数据进行分组,将多个分组结果分别写入多个不同的目标文件中,以保证相同的知识被分到相同的文件中。步骤S106,按照目标文件计算商品的热度值。在本专利技术实施例中,每个目标文件中存储属于同一个分组的商品知识数据,对每个目标文件中的商品知识数据计算商品的热度值。热度值用于描述商品在多种热度参数综合考虑情况下的被关注程度。步骤S108,根据商品的热度值生成时间窗口内的热点知识。在本专利技术实施例中,按照热度值对商品排序,热度值越高说明商品被关注程度越高,根据排序结果确定时间窗口内的热点知识。本专利技术实施例提供了一种热点知识生成方案,该方案通过时间窗口获取商品知识数据,其中,商品知识数据包括每种商品的热点参数,之后,按照热点参数对商品知识数据进行分组,按照分组结果将商品知识数据写入多个目标文件,计算每个目标文件中商品的热度值,最后综合多个目标文件中的商品的热度值生成时间窗口内的热点知识。本专利技术实施例可以收集商品知识数据,根据热点参数对商品知识数据进行分组计算,得到商品的热度值,根据商品的热度值生成时间窗口内的热点知识,该方案耗时少,数据处理速度快,且得到热点知识结果准确。为了保证分组的效率,按照热点参数对商品知识数据进行分组,按照分组结果将商品知识数据写入多个目标文件,可以按照如下步骤执行:按照热点参数计算商品知识数据的哈希值;根据哈希值和商品知识数据对商品知识数据进行分组;将属于同一分组的商品知识数据写入同一个目标文件。在本专利技术实施例中,若一个时间窗口中有n条商品知识数据。对每条商品知识数据通过哈希操作得到哈希值h,根据哈希值h和n条商品知识数据进行分组,并将属于同一分组的商品知识数据写入同一个目标文件。根据哈希本文档来自技高网...

【技术保护点】
1.一种热点知识生成方法,其特征在于,包括:/n获取时间窗口内的商品知识数据;所述商品知识数据包括每种商品的热点参数;/n按照所述热点参数对所述商品知识数据进行分组,按照分组结果将所述商品知识数据写入多个目标文件;/n按照所述目标文件计算商品的热度值;/n根据所述商品的热度值生成所述时间窗口内的热点知识。/n

【技术特征摘要】
1.一种热点知识生成方法,其特征在于,包括:
获取时间窗口内的商品知识数据;所述商品知识数据包括每种商品的热点参数;
按照所述热点参数对所述商品知识数据进行分组,按照分组结果将所述商品知识数据写入多个目标文件;
按照所述目标文件计算商品的热度值;
根据所述商品的热度值生成所述时间窗口内的热点知识。


2.根据权利要求1所述的方法,其特征在于,按照所述热点参数对所述商品知识数据进行分组,按照分组结果将所述商品知识数据写入多个目标文件,包括:
按照所述热点参数计算所述商品知识数据的哈希值;
根据所述哈希值和所述商品知识数据对所述商品知识数据进行分组;
将属于同一分组的商品知识数据写入同一个目标文件。


3.根据权利要求2所述的方法,其特征在于,根据所述哈希值和所述商品知识数据对所述商品知识数据进行分组,包括:
计算所述哈希值与所述商品知识数据的数量相除的余数;
若第一商品知识数据与第二商品知识数据对应的余数相同,则确定所述第一商品知识数据和所述第二商品知识数据属于同一分组。


4.根据权利要求1所述的方法,其特征在于,所述热点参数至少包括点击次数参数、查询频率参数、评分参数和收藏次数参数中的一种或几种;
按照所述目标文件计算商品的热度值,包括:
获取各类热点参数的权重值;
计算每个目标文件中商品的热点参数值;
按照所述权重值对多个所述热点参数值进行加权计算,得到商品的热度值。


5.根据权利要求1-4任一项所述的方法,其特征在于,按照所述热点参数对所述商品知识数据进行分组之后,还包括:
判断分组结果所需内存量是否小于空闲内存量;
如果是,按照所述分组结果将所述商品知识数据写入多个目标文件;
如果否,按照所述热点参数对所述分组结果进行再分组,按照再分组结果将所述商品知识数据写入多个目标文件。


6.根据权利要求1-4任一项所述的方法,其特征在于,根据所述商品的热度值生成所述时间窗口内的热点知识之后,还包括:
根据多个所述时间窗口内的热点知识,生成聚合的热点知识。


7.一种热点知识生成装置,其特征在于,包括:
获取模块,用于获取时间窗口内的商品知识数据...

【专利技术属性】
技术研发人员:申亚坤
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1