知识点处理方法、装置、服务器、介质及产品制造方法及图纸

技术编号:30232100 阅读:21 留言:0更新日期:2021-09-29 10:07
本申请提供了知识点处理方法、装置、服务器、介质及产品,该方法获取各用户分别对应的访问链路;从各用户分别对应的访问链路中,获得第一数目个用户分别对应的第一共现访问链路;将所述第一数目个用户分别对应的第一共现访问链路中最晚查询时间对应的历史查询记录包含的阅读的知识点中共有的知识点,确定为待拆分知识点;从所述第一数目个用户分别对应的所述第一共现访问链路包含的各历史查询记录包含的查询语句进行聚类,以得到目标数目个关键词集合;将所述待拆分知识点按照所述目标数目个关键词集合拆分成所述目标数目个知识点,每一知识点对应一个所述关键词集合。从而实现了确定知识点是否需要被拆分的目的。了确定知识点是否需要被拆分的目的。了确定知识点是否需要被拆分的目的。

【技术实现步骤摘要】
知识点处理方法、装置、服务器、介质及产品


[0001]本申请涉及数据维护
,更具体的说,是涉及知识点处理方法、装置、服务器、介质及产品。

技术介绍

[0002]可以基于用户输入的查询语句从数据库中搜索与查询语句相匹配的源文档;用户可以通过阅读源文档进一步判断该源文档是否是自己需要的源文档。
[0003]若源文档的内容较多,可能需要用户阅读较长时间,才能从源文档中找到自己所需内容,或,源文档中与查询语句最相关的内容位于源文档的末尾,可能出现用户在阅读了源文档中前面部分内容后,若未发现自己需要的内容,可能认为该源文档不是自己所需的源文档,导致用户错过该篇源文档,使得用户检索得到自己所需源文档的检索时间较长,或,检索不到自己所需的源文档。
[0004]为了降低用户的检索时间,提高检索效率,可以将源文档进行拆分,以得到多个知识点;可以基于用户查询语句从数据库中搜索与查询语句相匹配的知识点,由于知识点为源文档的部分内容,即知识点包含的内容减少,减少了用户阅读知识点的时长,所以能够快速发现知识点是否为自己所需内容。
[0005]在申请人实现本专利技术创造的过程中发现,若应该拆分成多个知识点的内容,作为一个知识点存在,可能会出现以下问题:若知识点中与查询语句最相关的内容位于知识点的末尾,可能出现用户在阅读了知识点中前面部分内容后,若未发现自己需要的内容,可能认为该知识点不是自己所需的知识点,导致用户错过该篇知识点。因此,如何确定知识点的拆分颗粒度是否合适,是本领域技术人员急需解决的难题。
专利
技术实现思路

[0006]有鉴于此,本申请提供了一种知识点处理方法、装置、服务器、介质及产品。
[0007]为实现上述目的,本申请提供如下技术方案:
[0008]根据本公开实施例的第一方面,提供一种知识点处理方法,包括:
[0009]获取各用户分别对应的访问链路,所述访问链路包括:按照查询时间由早到晚排序的多个历史查询记录;所述历史查询记录包括查询语句、响应所述查询语句的查询结果、阅读所述查询结果包含的知识点的阅读时长;
[0010]从各用户分别对应的访问链路中,获得第一数目个用户分别对应的第一共现访问链路;所述第一数目与所述各用户的总数目的比值大于或等于第一阈值;不同所述第一共现访问链路包含的历史查询记录的数目相同,且,对于任一所述用户对应的第一共现访问链路包含的任一历史查询记录中的查询语句而言,每一用户对应的第一共现访问链路中均存在与所述查询语句的相关度大于或等于第二阈值的查询语句,且,每一所述第一共现访问链路包含的各历史查询记录中查询语句的相关度大于或等于第三阈值,且,每一所述第一共现访问链路中最晚查询时间对应的历史查询记录包含的阅读时长大于或等于第一时
长,且,每一所述第一共现访问链路中除最晚查询时间对应的历史查询记录外的其他历史查询记录分别包含的阅读时长均小于或等于第二时长;
[0011]将所述第一数目个用户分别对应的第一共现访问链路中最晚查询时间对应的历史查询记录包含的阅读的知识点中共有的知识点,确定为待拆分知识点;
[0012]从所述第一数目个用户分别对应的所述第一共现访问链路包含的各历史查询记录包含的查询语句进行聚类,以得到目标数目个关键词集合;
[0013]将所述待拆分知识点按照所述目标数目个关键词集合拆分成所述目标数目个知识点,每一知识点对应一个所述关键词集合。
[0014]根据本公开实施例的第二方面,提供一种知识点处理装置,包括:
[0015]第一获取模块,用于获取各用户分别对应的访问链路,所述访问链路包括:按照查询时间由早到晚排序的多个历史查询记录;所述历史查询记录包括查询语句、响应所述查询语句的查询结果、阅读所述查询结果包含的知识点的阅读时长;
[0016]第二获取模块,用于从各用户分别对应的访问链路中,获得第一数目个用户分别对应的第一共现访问链路;所述第一数目与所述各用户的总数目的比值大于或等于第一阈值;不同所述第一共现访问链路包含的历史查询记录的数目相同,且,对于任一所述用户对应的第一共现访问链路包含的任一历史查询记录中的查询语句而言,每一用户对应的第一共现访问链路中均存在与所述查询语句的相关度大于或等于第二阈值的查询语句,且,每一所述第一共现访问链路包含的各历史查询记录中查询语句的相关度大于或等于第三阈值,且,每一所述第一共现访问链路中最晚查询时间对应的历史查询记录包含的阅读时长大于或等于第一时长,且,每一所述第一共现访问链路中除最晚查询时间对应的历史查询记录外的其他历史查询记录分别包含的阅读时长均小于或等于第二时长;
[0017]第一确定模块,用于将所述第一数目个用户分别对应的第一共现访问链路中最晚查询时间对应的历史查询记录包含的阅读的知识点中共有的知识点,确定为待拆分知识点;
[0018]聚类模块,用于从所述第一数目个用户分别对应的所述第一共现访问链路包含的各历史查询记录包含的查询语句进行聚类,以得到目标数目个关键词集合;
[0019]拆分模块,用于将所述待拆分知识点按照所述目标数目个关键词集合拆分成所述目标数目个知识点,每一知识点对应一个所述关键词集合。
[0020]根据本公开实施例的第三方面,提供一种服务器,包括:
[0021]处理器;
[0022]用于存储所述处理器可执行指令的存储器;
[0023]其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的知识点处理方法。
[0024]根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如第一方面所述的知识点处理方法。
[0025]根据本公开实施例的第五方面,提供一种计算机程序产品,可直接加载到计算机的内部存储器,例如第三方面所述服务器包含的存储器中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现如权第一方面所述的知识点处理方法。
[0026]经由上述的技术方案可知,本申请提供的知识点处理方法中,获取各用户分别对应的访问链路;从各用户分别对应的访问链路中,获得第一数目个用户分别对应的第一共现访问链路;所述第一数目与所述各用户的总数目的比值大于或等于第一阈值;不同所述第一共现访问链路包含的历史查询记录的数目相同,且,对于任一所述用户对应的第一共现访问链路包含的任一历史查询记录中的查询语句而言,每一用户对应的第一共现访问链路中均存在与所述查询语句的相关度大于或等于第二阈值的查询语句,且,每一所述第一共现访问链路包含的各历史查询记录中查询语句的相关度大于或等于第三阈值,且,每一所述第一共现访问链路中最晚查询时间对应的历史查询记录包含的阅读时长大于或等于第一时长,且,每一所述第一共现访问链路中除最晚查询时间对应的历史查询记录外的其他历史查询记录分别包含的阅读时长均小于或等于第二时长;将所述第一数目个用户分别对应的第一共现访问链路中最晚查询时间对应的历史查询记录包含的阅读的知识点中共有的知识点,确定为待拆分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识点处理方法,其特征在于,包括:获取各用户分别对应的访问链路,所述访问链路包括:按照查询时间由早到晚排序的多个历史查询记录;所述历史查询记录包括查询语句、响应所述查询语句的查询结果、阅读所述查询结果包含的知识点的阅读时长;从各用户分别对应的访问链路中,获得第一数目个用户分别对应的第一共现访问链路;所述第一数目与所述各用户的总数目的比值大于或等于第一阈值;不同所述第一共现访问链路包含的历史查询记录的数目相同,且,对于任一所述用户对应的第一共现访问链路包含的任一历史查询记录中的查询语句而言,每一用户对应的第一共现访问链路中均存在与所述查询语句的相关度大于或等于第二阈值的查询语句,且,每一所述第一共现访问链路包含的各历史查询记录中查询语句的相关度大于或等于第三阈值,且,每一所述第一共现访问链路中最晚查询时间对应的历史查询记录包含的阅读时长大于或等于第一时长,且,每一所述第一共现访问链路中除最晚查询时间对应的历史查询记录外的其他历史查询记录分别包含的阅读时长均小于或等于第二时长;将所述第一数目个用户分别对应的第一共现访问链路中最晚查询时间对应的历史查询记录包含的阅读的知识点中共有的知识点,确定为待拆分知识点;从所述第一数目个用户分别对应的所述第一共现访问链路包含的各历史查询记录包含的查询语句进行聚类,以得到目标数目个关键词集合;将所述待拆分知识点按照所述目标数目个关键词集合拆分成所述目标数目个知识点,每一知识点对应一个所述关键词集合。2.根据权利要求1所述知识点处理方法,其特征在于,还包括:从各用户分别对应的访问链路中,获得第二数目个用户分别对应的第二共现访问链路;所述第二数目与所述各用户的总数目的比值大于或等于第四阈值,所述第二数目个用户分别对应的第二共现访问链路包含所述第二数目个用户均阅读过的多个目标知识点,且每一所述目标知识点的阅读时长大于或等于所述第一时长;基于所述第二数目个用户分别对应的第二共现访问链路包含的各所述目标知识点的查询时间,确定表征用户查看各目标知识点的查看顺序;按照所述查看顺序合并多个所述目标知识点,以得到合并后的知识点。3.根据权利要求2所述知识点处理方法,其特征在于,所述按照所述查看顺序合并各目标知识点,以得到合并后的知识点步骤包括:若各目标知识点属于同一源文档,按照所述查看顺序,合并各目标知识点,以得到合并后的知识点;删除各目标知识点;若各目标知识点不属于同一源文档,对于任一目标知识点,将其他目标知识点作为关联知识按照所述查看顺序存储至所述目标知识点中。4.根据权利要求2或3所述知识点处理方法,其特征在于,所述从各用户分别对应的访问链路中,获得第二数目个用户分别对应的第二共现访问链路步骤包括:基于各用户分别对应的访问链路,获取各所述查询结果包含的各知识点分别对应的被点击次数以及阅读时长;从各知识点中筛选出被击次数大于预设数目以及阅读时长大于或等于所述第一时长
的候选知识点;获得包含各候选知识点的有向关系图,所述有向关系图中两个候选知识点之间的有向边的箭头表征两个候选知识点的被点击的顺序;两个候选知识点之间的有向边的权重为依次点击两个候选知识点的用户的数目;从所述有向关系图中获得目标访问链路,所述目标访问链路包含的任意两个目标知识点有向边的权重大于或等于所述第二数目;将所述目标访问链路包含的目标知识点确定为待合并的目标知识点。5.根据权利要求2至3任一所述知识点处理方法,其特征在于,还包括:对于数据库存储的任...

【专利技术属性】
技术研发人员:申亚坤丁锐谭莹坤陶威周慧婷刘烨敏
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1