一种基于警务知识库的智能检索系统及方法技术方案

技术编号:34818827 阅读:18 留言:0更新日期:2022-09-03 20:29
本发明专利技术公开了一种基于警务知识库的智能检索分析系统及方法,包括步骤S100:对用户基于相同信息需求产生的搜索轨迹进行捕捉和分析,对用户分别基于不同信息需求产生的搜索进程进行搜索轨迹的归纳;步骤S200:分别在用户基于不同信息需求产生的不同搜索进程中,对各搜索进程内包含的各搜索轨迹进行规律排查;分别对用户基于不同信息需求产生的不同搜索进程进行异常排查;步骤S300:当判断用户的搜索进程异常时,触发系统基于用户通过输入搜索式浏览产生的浏览点击记录对用户的目标需求信息进行抓取;步骤S400:基于抓取到的用户的目标需求信息,结合用户的账号标签,对搜索进程出现异常时对应的用户账号实现内容智能推送。出现异常时对应的用户账号实现内容智能推送。出现异常时对应的用户账号实现内容智能推送。

【技术实现步骤摘要】
一种基于警务知识库的智能检索系统及方法


[0001]本专利技术涉及警务知识库检索
,具体为一种基于警务知识库的智能检索系统及方法。

技术介绍

[0002]现阶段各警种各部门之间的职责、信息等存在壁垒,且可能同部门不同职位间的职责都存在不清楚的情况;同时想在大量的法律法规中查询合适的规章制度都需要通过繁琐的翻阅才能获取;且,实际警务业务处理的过程中,难免会触碰到与职务不是直接相关的知识领域,对于这种时候,由于职务上的知识壁垒,想在大量的法律法规中查询合适的规章制度,更是难上加难;该现象影响了工作进度,增加了沟通成本。
[0003]建立一个“移动的百科全书”,通过系统可以实现类似“百度”的关键字检索,存在在资料查询上的繁琐量多的难点,且因为知识壁垒的出现,用户往往在输入搜索式的时候,存在不精确表述,描述不规范的现象,降低了搜索效率。

技术实现思路

[0004]本专利技术的目的在于提供一种基于警务知识库的智能检索系统及方法,以解决上述
技术介绍
中提出的问题。
[0005]为了解决上述技术问题,本专利技术提供如下技术方案:一种基于警务知识库的智能检索分析方法,方法包括:
[0006]步骤S100:系统基于用户通过输入搜索式产生的浏览翻阅记录信息,对用户基于相同信息需求产生的搜索轨迹进行捕捉和分析,对用户分别基于不同信息需求产生的搜索进程进行搜索轨迹的归纳;
[0007]步骤S200:分别在用户基于不同信息需求产生的不同搜索进程中,对各搜索进程内包含的各搜索轨迹进行规律排查;基于各搜索进程内包含的各搜索轨迹的规律排查情况,分别对用户基于不同信息需求产生的不同搜索进程进行异常排查;
[0008]步骤S300:当判断用户的搜索进程异常时,触发系统基于用户通过输入搜索式浏览产生的浏览点击记录对用户的目标需求信息进行抓取;
[0009]步骤S400:基于抓取到的用户的目标需求信息,结合用户的账号标签,对搜索进程出现异常时对应的用户账号实现内容智能推送。
[0010]进一步的,步骤S100基于每个用户通过输入搜索式浏览产生的翻阅记录特征,对每个用户的搜索进程进行计算捕捉的过程包括:
[0011]步骤S101:将根据用户输入一次搜索式产生的所有用户浏览翻阅记录对应为用户基于一个输入搜索式产生的一条搜索轨迹;获取用户在时间周期S内生成的搜索轨迹集{L1,L2,

,L
n
};其中,L1、L2、

、L
n
分别表示用户在时间周期S内按时间顺序产生的第1、2、

、n条搜索轨迹;分别对用户搜索轨迹集{L1,L2,

,L
n
}内各搜索轨迹的输入搜索式提取搜索关键词,得到搜索轨迹集对应的关键词集其中,分别
表示从L1、L2、

、L
n
中输入搜索式提取到的搜索关键词;其中,每根据一次输入的搜索式提取到的搜索关键词个数大于或者等于1;
[0012]步骤S102:分别获取L
i
与L
i+1
之间的搜索关键词相似度W
i,i+1
;设置第一相似度阈值W1,若W
i,i+1
≥W1,判定L
i
与L
i+1
为用户基于相同信息需求产生的关联搜索轨迹,L
i
与L
i+1
隶属于同一搜索进程;若W
i,i+1
<W1,设置第二相似度阈值W2;获取用户在搜索轨迹L
i
中产生的浏览页面集其中,分别表示在搜索轨迹L
i
中按时间顺序生成的第1、2、

、m个浏览页面;浏览页面包括输入搜索式后出现的搜索结果页面、点击搜索结果页面内某条链接后出现的内容页面;
[0013]步骤S103:分别对浏览页面集内各浏览页面提取关键词,得到浏览页面集对应的关键词集将搜索轨迹L
i
对应的搜索关键词分别与关键词集内各关键词依次进行组合对应生成m个组合关键词;若在m个组合关键词中存在至少一个组合关键词与搜索轨迹L
i+1
对应的关键词之间的相似度大于第二相似度阈值W2,判定L
i
与L
i+1
为用户基于相同信息需求产生的关联搜索轨迹,L
i
与L
i+1
隶属于同一搜索进程,若在m个组合关键词中不存在一个组合关键词与搜索轨迹L
i+1
对应的关键词之间的相似度小于第二相似度阈值W2,判定L
i
与L
i+1
为用户基于不同信息需求产生的独立搜索轨迹,L
i
与L
i+1
分别隶属于不同搜索进程;
[0014]步骤S104:对用户在时间周期S内产生的所有搜索轨迹基于各自隶属的搜索进程进行归类,分别得到隶属于各搜索进程的搜索轨迹集;
[0015]因为在实际信息查询的过程中,用户想要查找与自己业务出现交叉的其他领域知识,但是由于缺乏该领域的专业知识素养,且各法律法规等规章制度的规范性较强,用户往往在输入搜索式的时候,会存在表述不精确,描述不规范的现象,所以用户的搜索进程是不断的从一次次搜索中慢慢摸索到自己真正想要查找的内容,也就意味着用户在查找相同需求信息的过程中,会出现多个检索式,且各个检索式之间因为处于一个相同的信息需求,是存在内容上关联的。
[0016]进一步的,步骤S200包括:
[0017]步骤S201:分别对用户在不同搜索进程中包含的搜索轨迹集进行提取;记用户基于信息需求A产生的搜索进程H
a
中包含的搜索轨迹集为{a1,a2,

,a
v
};其中,a1、a2、

、a
v
分别表示用户在基于查询信息需求A,对应于在搜索框中第1、2、

、v次输入的搜索式产生的第1、2、

、v条搜索轨迹;分别提取对应搜索轨迹集{a1,a2,

,a
v
}内各搜索轨迹的浏览页面集,获取用户在浏览页面集内各浏览页面的浏览时间,计算用户对应每一搜索轨迹的平均浏览时间,得到对应搜索轨迹集{a1,a2,

,a
v
}的平均浏览时间集同时捕捉在搜索轨迹集{a1,a2,

,a
v
}中利用组合关键词进行关键词相似度比较的次数C;
[0018]步骤S202:若平均浏览时间集内小于平均浏览时间阈值的平均浏览时间个数大于个数阈值,判定搜索进程H
a
异常;若平均浏览时间集内小于
平均浏览时间阈值的平均浏览时间个数小于或者等于个数阈值,计算每两条相邻搜索轨迹之间的时间变化指数:
[0019][0020]其中,且本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于警务知识库的智能检索分析方法,其特征在于,所述方法包括:步骤S100:系统基于用户通过输入搜索式产生的浏览翻阅记录信息,对用户基于相同信息需求产生的搜索轨迹进行捕捉和分析,对用户分别基于不同信息需求产生的搜索进程进行搜索轨迹的归纳;步骤S200:分别在用户基于不同信息需求产生的不同搜索进程中,对各搜索进程内包含的各搜索轨迹进行规律排查;基于各搜索进程内包含的各搜索轨迹的规律排查情况,分别对用户基于不同信息需求产生的不同搜索进程进行异常排查;步骤S300:当判断用户的搜索进程异常时,触发所述系统基于用户通过输入搜索式浏览产生的浏览点击记录对用户的目标需求信息进行抓取;步骤S400:基于抓取到的用户的目标需求信息,结合用户的账号标签,对搜索进程出现异常时对应的用户账号实现内容智能推送。2.根据权利要求1所述的一种基于警务知识库的智能检索分析方法,其特征在于,所述步骤S100基于每个用户通过输入搜索式浏览产生的翻阅记录特征,对每个用户的搜索进程进行计算捕捉的过程包括:步骤S101:将根据用户输入一次搜索式产生的所有用户浏览翻阅记录对应为用户基于一个输入搜索式产生的一条搜索轨迹;获取用户在时间周期S内生成的搜索轨迹集{L1,L2,

,L
n
};其中,L1、L2、

、L
n
分别表示用户在时间周期S内按时间顺序产生的第1、2、

、n条搜索轨迹;分别对用户搜索轨迹集{L1,L2,

,L
n
}内各搜索轨迹的输入搜索式提取搜索关键词,得到搜索轨迹集对应的关键词集其中,分别表示从L1、L2、

、L
n
中输入搜索式提取到的搜索关键词;其中,每根据一次输入的搜索式提取到的搜索关键词个数大于或者等于1;步骤S102:分别获取L
i
与L
i+1
之间的搜索关键词相似度W
i,i+1
;设置第一相似度阈值W1,若判定L
i
与L
i+1
为用户基于相同信息需求产生的关联搜索轨迹,L
i
与L
i+1
隶属于同一搜索进程;若W
i,i+1
<W1,设置第二相似度阈值W2;获取用户在搜索轨迹L
i
中产生的浏览页面集其中,分别表示在搜索轨迹L
i
中按时间顺序生成的第1、2、

、m个浏览页面;所述浏览页面包括输入搜索式后出现的搜索结果页面、点击搜索结果页面内某条链接后出现的内容页面;步骤S103:分别对浏览页面集内各浏览页面提取关键词,得到浏览页面集对应的关键词集将搜索轨迹L
i
对应的搜索关键词分别与关键词集内各关键词依次进行组合对应生成m个组合关键词;若在m个组合关键词中存在至少一个组合关键词与搜索轨迹L
i+1
对应的关键词之间的相似度大于第二相似度阈值W2,判定L
i
与L
i+1
为用户基于相同信息需求产生的关联搜索轨迹,L
i
与L
i+1
隶属于同一搜索进程,若在m个组合关键词中不存在一个组合关键词与搜索轨迹L
i+1
对应的关键词之间的相似度小于第二相似度阈值W2,判定L
i
与L
i+1
为用户基于不同信息需求产生的独立搜索轨迹,L
i
与L
i+1
分别隶属于不同搜索进程;
步骤S104:对用户在时间周期S内产生的所有搜索轨迹基于各自隶属的搜索进程进行归类,分别得到隶属于各搜索进程的搜索轨迹集。3.根据权利要求2所述的一种基于警务知识库的智能检索分析方法,其特征在于,步骤S200包括:步骤S201:分别对用户在不同搜索进程中包含的搜索轨迹集进行提取;记用户基于信息需求A产生的搜索进程中包含的搜索轨迹集为{a1,a2,

,a
v
};其中,a1、a2、

、a
v
分别表示用户在基于查询信息需求A,对应于在搜索框中第1、2、

、v次输入的搜索式产生的第1、2、

、v条搜索轨迹;分别提取对应搜索轨迹集{a1,a2,

,a
v
}内各搜索轨迹的浏览页面集,获取用户在所述浏览页面集内各浏览页面的浏览时间,计算用户对应每一搜索轨迹的平均浏览时间,得到对应搜索轨迹集{a1,a2,

,a
v
}的平均浏览时间集同时捕捉在搜索轨迹集{a1,a2,

,a
v
}中利用组合关键词进行关键词相似度比较的次数C;步骤S202:若平均浏览时间集内小于平均浏览时间阈值的平均浏览时间个数大于个数阈值,判定搜索进程异常;若平均浏览时间集内小于平均浏览时间阈值的平均浏览时间个数小于或者等于个数阈值,计算每两条相邻搜索轨迹之间的时间变化指数:其中,且满足得到对应搜索轨迹集{a1,a2,

【专利技术属性】
技术研发人员:费凌云王发明陈玉东岳昆王琨
申请(专利权)人:淮安市公安局洪泽分局
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1