【技术实现步骤摘要】
热点知识生成方法及装置
本专利技术涉及数据处理
,尤其是涉及一种热点知识生成方法及装置。
技术介绍
在银行的客服知识库中,大部分热点知识是通过手工标注来实现的,该方式费时费力,并且人工标标注热点知识的过程,存在一定主观性,标注结果不准确,不能反映坐席员真正的使用情况,是知识库系统中亟待改进的功能。
技术实现思路
本专利技术提供了一种热点知识生成方法及装置,可以提升热点知识的生成效率,节省人工成本,提升数据处理速度和结果准确度。第一方面,本专利技术实施例提供了一种热点知识生成方法,该方法包括:获取时间窗口内的商品知识数据;所述商品知识数据包括每种商品的热点参数;按照所述热点参数对所述商品知识数据进行分组,按照分组结果将所述商品知识数据写入多个目标文件;按照所述目标文件计算商品的热度值;根据所述商品的热度值生成所述时间窗口内的热点知识。第二方面,本专利技术实施例还提供一种热点知识生成装置,该装置包括:获取模块,用于获取时间窗口内的商品知识数据;所述商品知识数据包括每种商品的热点参数;分组 ...
【技术保护点】
1.一种热点知识生成方法,其特征在于,包括:/n获取时间窗口内的商品知识数据;所述商品知识数据包括每种商品的热点参数;/n按照所述热点参数对所述商品知识数据进行分组,按照分组结果将所述商品知识数据写入多个目标文件;/n按照所述目标文件计算商品的热度值;/n根据所述商品的热度值生成所述时间窗口内的热点知识。/n
【技术特征摘要】
1.一种热点知识生成方法,其特征在于,包括:
获取时间窗口内的商品知识数据;所述商品知识数据包括每种商品的热点参数;
按照所述热点参数对所述商品知识数据进行分组,按照分组结果将所述商品知识数据写入多个目标文件;
按照所述目标文件计算商品的热度值;
根据所述商品的热度值生成所述时间窗口内的热点知识。
2.根据权利要求1所述的方法,其特征在于,按照所述热点参数对所述商品知识数据进行分组,按照分组结果将所述商品知识数据写入多个目标文件,包括:
按照所述热点参数计算所述商品知识数据的哈希值;
根据所述哈希值和所述商品知识数据对所述商品知识数据进行分组;
将属于同一分组的商品知识数据写入同一个目标文件。
3.根据权利要求2所述的方法,其特征在于,根据所述哈希值和所述商品知识数据对所述商品知识数据进行分组,包括:
计算所述哈希值与所述商品知识数据的数量相除的余数;
若第一商品知识数据与第二商品知识数据对应的余数相同,则确定所述第一商品知识数据和所述第二商品知识数据属于同一分组。
4.根据权利要求1所述的方法,其特征在于,所述热点参数至少包括点击次数参数、查询频率参数、评分参数和收藏次数参数中的一种或几种;
按照所述目标文件计算商品的热度值,包括:
获取各类热点参数的权重值;
计算每个目标文件中商品的热点参数值;
按照所述权重值对多个所述热点参数值进行加权计算,得到商品的热度值。
5.根据权利要求1-4任一项所述的方法,其特征在于,按照所述热点参数对所述商品知识数据进行分组之后,还包括:
判断分组结果所需内存量是否小于空闲内存量;
如果是,按照所述分组结果将所述商品知识数据写入多个目标文件;
如果否,按照所述热点参数对所述分组结果进行再分组,按照再分组结果将所述商品知识数据写入多个目标文件。
6.根据权利要求1-4任一项所述的方法,其特征在于,根据所述商品的热度值生成所述时间窗口内的热点知识之后,还包括:
根据多个所述时间窗口内的热点知识,生成聚合的热点知识。
7.一种热点知识生成装置,其特征在于,包括:
获取模块,用于获取时间窗口内的商品知识数据...
【专利技术属性】
技术研发人员:申亚坤,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。