【技术实现步骤摘要】
一种保密检查的事件审核方法和装置
本专利技术涉及保密检查领域,具体涉及一种保密检查的事件审核方法和装置。
技术介绍
保密检查是作为保密管理的一项重要工作内容,是加强保密工作的重要措施,然而当前的保密检查系统每次检查完之后都会有大量的保密检查事件产生,保密检查事件是指检查人员在保密检查中发现的可疑事件,这些事件可能是涉密事件,也可能是误报事件,这些事件的审核均需要依赖人工完成,费时费力,并且人工审核精力有限,存在漏掉涉密事件的现象。
技术实现思路
本专利技术的目的在于针对上述现有技术中保密检查的事件审核效率及准确率不高的问题,提供一种保密检查的事件审核方法和装置,通过事件排序模型对保密检查事件重排序,利用事件之间的相似性,对相似度达到阈值的冗余事件进行批量审核,提高审核效率和准确率。为了实现上述目的,本专利技术有如下的技术方案:一种保密检查的事件审核方法,包括以下步骤:-建立事件排序模型;构建训练数据集;提取训练数据集中每个查询词的属性及其对应事件的属性;利用 ...
【技术保护点】
1.一种保密检查的事件审核方法,其特征在于,包括以下步骤:/n-建立事件排序模型;/n构建训练数据集;/n提取训练数据集中每个查询词的属性及其对应事件的属性;/n利用每个查询词对应事件的属性,提取每个事件的相关性特征和相似性特征;/n构建并训练排序模型,得到最优排序函数;/n-事件去除冗余重排序;/n搜索某个查询词得到包含若干个事件的事件集合;/n提取每个事件的属性;/n提取事件集合中的每个事件与查询词之间的相关性特征向量,以及该事件与排在其前面的事件集合的相似性特征矩阵;/n将每个事件的相关性特征向量和相似性特征矩阵代入最优排序函数,得到排序值;/n将排序值按照从大到小的 ...
【技术特征摘要】
1.一种保密检查的事件审核方法,其特征在于,包括以下步骤:
-建立事件排序模型;
构建训练数据集;
提取训练数据集中每个查询词的属性及其对应事件的属性;
利用每个查询词对应事件的属性,提取每个事件的相关性特征和相似性特征;
构建并训练排序模型,得到最优排序函数;
-事件去除冗余重排序;
搜索某个查询词得到包含若干个事件的事件集合;
提取每个事件的属性;
提取事件集合中的每个事件与查询词之间的相关性特征向量,以及该事件与排在其前面的事件集合的相似性特征矩阵;
将每个事件的相关性特征向量和相似性特征矩阵代入最优排序函数,得到排序值;
将排序值按照从大到小的顺序进行排序,即得到事件的排序;
-对事件进行标记。
2.根据权利要求1所述保密检查的事件审核方法,其特征在于:训练数据集包括查询词集合Q={q1,…,qn},qi为第i个查询词,n为查询词的总数;每个查询词qi都有对应的一个事件集合Ei={eventi1,…,eventim},m为事件的个数;对每条事件按照是否与对应的查询词qi相关进行人工标注,通过这些标注信息生成事件集合Ei排序的标准答案ranki={ranki1,…,rankim}。
3.根据权利要求1所述保密检查的事件审核方法,其特征在于:
查询词的属性为查询词的向量表示;
事件的属性包括事件文本的向量表示、事件对应文档的创建时间、修改时间及文件类型。
4.根据权利要求1所述保密检查的事件审核方法,其特征在于:事件的相关性特征通过BERT模型得到,BERT模型使用预训练模型并在训练数据集中,利用人工标注的相关性排序结果进行调优训练,保留BERT模型最后的回归层之前的输出为相关性特征向量。
5.根据权利要求1所述保密检查的事件审核方法,其特征在于:
相似性特征包括文本相似特征、时间相似特征以及类型相似特征;
文本相似特征:通过BERT模型得到,BERT模型使用预训练模型;
时间相似特征:通过时间指标来评估事件相似的可能性,按下式进行计算:...
【专利技术属性】
技术研发人员:王世晞,张亮,刘涛,李娇娇,
申请(专利权)人:杭州世平信息科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。