一种事件辨重方法、事件辨重模型的训练方法及其装置制造方法及图纸

技术编号:38235708 阅读:21 留言:0更新日期:2023-07-25 18:01
本发明专利技术涉及计算机技术领域,公开了一种事件辨重方法、事件辨重模型的训练方法及其装置。该方法包括:获取待辨别事件的待辨别描述数据和待辨别标题数据;将所述待辨别描述数据和待辨别标题数据输入到预先训练完成的目标事件辨重模型中;通过所述目标事件辨重模型中的编码网络,基于所述待辨别描述数据和待辨别标题数据,确定待辨别融合表征;通过所述目标事件辨重模型中的分类器,基于历史事件集中各历史事件分别对应的历史融合表征以及所述编码网络输出的待辨别融合表征,输出所述待辨别事件对应的目标辨重结果。本发明专利技术实施例解决了人工辨重方法存在的效率低的问题,提高了辨重结果的可靠性。结果的可靠性。结果的可靠性。

【技术实现步骤摘要】
一种事件辨重方法、事件辨重模型的训练方法及其装置


[0001]本专利技术涉及计算机
,尤其涉及一种事件辨重方法、事件辨重模型的训练方法及其装置。

技术介绍

[0002]社会治理现代化是国家治理体系和治理能力现代化的重要组成部分,其中,高效处置城市中的各类上报事件是提升社会治理效能的必要途径,目前,上报事件的获取渠道包括走访、市民热线、投诉平台、物联网设备报警等等。
[0003]由于获取渠道的多元化以及市民希望解决问题的急迫性,经常会出现同一上报事件重复上报的情况,导致上报事件被重复派单,浪费社会资源。在上报事件的处置流程中,目前还是依赖派单人员进行重复事件的辨别。
[0004]在实现本专利技术的过程中,发现现有技术中至少存在以下技术问题:
[0005]由于上报事件的数据量巨大,人工辨重的方法不仅效率低,且在辨重的过程中经常会出现漏判或误判的情况,辨重结果的可靠性差。

技术实现思路

[0006]本专利技术实施例提供了一种事件辨重方法、事件辨重模型的训练方法及其装置,以解决人工辨重方法存在的效率低的问题,提高辨重结果的可靠性。
[0007]根据本专利技术一个实施例提供了一种事件辨重方法,该方法包括:
[0008]获取待辨别事件的待辨别描述数据和待辨别标题数据;
[0009]将所述待辨别描述数据和待辨别标题数据输入到预先训练完成的目标事件辨重模型中;
[0010]通过所述目标事件辨重模型中的编码网络,基于所述待辨别描述数据和待辨别标题数据,确定待辨别融合表征;
[0011]通过所述目标事件辨重模型中的分类器,基于历史事件集中各历史事件分别对应的历史融合表征以及所述编码网络输出的待辨别融合表征,输出所述待辨别事件对应的目标辨重结果。
[0012]根据本专利技术另一个实施例提供了一种事件辨重模型的训练方法,该方法包括:
[0013]获取训练事件的训练描述数据和训练标题数据,以及获取比较事件集中各比较事件分别对应的比较描述数据和比较标题数据;
[0014]将所述训练描述数据、所述训练标题数据、各所述比较描述数据和各所述比较标题数据输入到未训练完成的初始事件辨重模型中;
[0015]通过所述初始事件辨重模型中的编码网络,基于所述训练描述数据和训练标题数据,确定训练融合表征,以及基于各所述比较事件分别对应的比较描述数据和比较标题数据,确定至少一个比较融合表征;
[0016]通过所述初始事件辨重模型中的分类器,基于编码网络输出的训练融合表征和各
比较融合表征,输出所述训练事件对应的预测辨重结果;
[0017]基于所述预测辨重结果和标准辨重结果,对所述初始事件辨重模型的模型参数进行调整,直到得到训练完成的目标事件辨重模型。
[0018]根据本专利技术另一个实施例提供了一种事件辨重装置,该装置包括:
[0019]待辨别标题数据获取模块,用于获取待辨别事件的待辨别描述数据和待辨别标题数据;
[0020]待辨别标题数据输入模块,用于将所述待辨别描述数据和待辨别标题数据输入到预先训练完成的目标事件辨重模型中;
[0021]待辨别融合表征确定模块,用于通过所述目标事件辨重模型中的编码网络,基于所述待辨别描述数据和待辨别标题数据,确定待辨别融合表征;
[0022]目标辨重结果输出模块,用于通过所述目标事件辨重模型中的分类器,基于历史事件集中各历史事件分别对应的历史融合表征以及所述编码网络输出的待辨别融合表征,输出所述待辨别事件对应的目标辨重结果。
[0023]根据本专利技术另一个实施例提供了一种事件辨重模型的训练装置,该装置包括:
[0024]训练标题数据获取模块,用于获取训练事件的训练描述数据和训练标题数据,以及获取比较事件集中各比较事件分别对应的比较描述数据和比较标题数据;
[0025]训练标题数据输入模块,用于将所述训练描述数据、所述训练标题数据、各所述比较描述数据和各所述比较标题数据输入到未训练完成的初始事件辨重模型中;
[0026]训练融合表征确定模块,用于通过所述初始事件辨重模型中的编码网络,基于所述训练描述数据和训练标题数据,确定训练融合表征,以及基于各所述比较事件分别对应的比较描述数据和比较标题数据,确定至少一个比较融合表征;
[0027]预测辨重结果输出模块,用于通过所述初始事件辨重模型中的分类器,基于编码网络输出的训练融合表征和各比较融合表征,输出所述训练事件对应的预测辨重结果;
[0028]目标事件辨重模型确定模块,用于基于所述预测辨重结果和标准辨重结果,对所述初始事件辨重模型的模型参数进行调整,直到得到训练完成的目标事件辨重模型。
[0029]根据本专利技术另一个实施例提供了一种电子设备,该电子设备包括:
[0030]至少一个处理器;以及
[0031]与所述至少一个处理器通信连接的存储器;其中,
[0032]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的事件辨重方法和/或事件辨重模型的训练方法。
[0033]根据本专利技术另一个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的事件辨重方法和/或事件辨重模型的训练方法。
[0034]本专利技术实施例的技术方案,通过引入上报事件的标题数据,将待辨别事件的待辨别描述数据和待辨别标题数据输入到预先训练完成的目标事件辨重模型中,通过目标事件辨重模型中的编码网络,基于待辨别描述数据和待辨别标题数据,确定待辨别融合表征,通过目标事件辨重模型中的分类器,基于历史事件集中各历史事件分别对应的历史融合表征以及编码网络输出的待辨别融合表征输出待辨别事件对应的目标辨重结果,增强了目标事
件辨重模型识别待辨别描述数据中核心语义特征的能力,解决了人工辨重方法存在的效率低的问题,提高了重复事件的辨别结果的准确度,进而降低了同一上报事件被重复派件的概率,保障了上报事件的整体处理效率。
[0035]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0036]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037]图1为本专利技术一个实施例所提供的一种事件辨重方法的流程图;
[0038]图2为本专利技术一个实施例所提供的一种目标事件辨重模型的网络架构图;
[0039]图3为本专利技术一个实施例所提供的另一种目标事件辨重模型的网络架构图;
[0040]图4为本专利技术一个实施例所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种事件辨重方法,其表征在于,包括:获取待辨别事件的待辨别描述数据和待辨别标题数据;将所述待辨别描述数据和待辨别标题数据输入到预先训练完成的目标事件辨重模型中;通过所述目标事件辨重模型中的编码网络,基于所述待辨别描述数据和待辨别标题数据,确定待辨别融合表征;通过所述目标事件辨重模型中的分类器,基于历史事件集中各历史事件分别对应的历史融合表征以及所述编码网络输出的待辨别融合表征,输出所述待辨别事件对应的目标辨重结果。2.根据权利要求1所述的方法,其表征在于,所述编码网络包括编码器和融合单元,所述编码器,用于基于所述待辨别描述数据和待辨别标题数据,确定待辨别描述表征和待辨别标题表征,所述融合单元,用于对所述编码器输出的待辨别描述表征和待辨别标题表征执行融合操作,得到待辨别融合表征。3.根据权利要求2所述的方法,其特征在于,所述编码器包括描述编码单元和标题编码单元;其中,所述描述编码单元,用于对所述待辨别描述数据执行描述编码操作,得到待辨别描述表征;所述标题编码单元,用于对所述待辨别标题数据执行标题编码操作,得到待辨别标题表征。4.根据权利要求3所述的方法,其表征在于,所述目标事件辨重模型的模型架构为孪生网络架构,相应的,所述目标事件辨重模型还包含与所述编码网络的网络架构及网络参数相同的孪生网络,所述孪生网络,用于基于历史事件集中至少一个历史事件分别对应的历史描述数据和历史标题数据,确定至少一个历史融合表征。5.根据权利要求1所述的方法,其表征在于,所述分类器,具体用于:针对历史事件集中的每个历史事件,基于所述历史事件对应的历史融合表征和所述编码网络输出的待辨别融合表征,确定融合差值表征;基于所述待辨别融合表征、各所述历史融合表征和各所述融合差值表征,输出所述待辨别事件对应的目标辨重结果。6.根据权利要求1

5任一项所述的方法,其表征在于,在获取待辨别事件的待辨别描述数据和待辨别标题数据之前,所述方法还包括:获取待辨别事件对应的待辨别特征数据,以及获取历史事件集中各历史事件分别对应的历史特征数据;在所述待辨别特征数据和各所述历史特征数据满足预设辨重条件的情况下,将所述待辨别事件对应的目标辨重结果设置为重复事件;在所述待辨别特征数据和各所述历史特征数据不满足预设辨重条件的情况下,执行获取待辨别事件的待辨别描述数据和待辨别标题数据的步骤;其中,所述预设辨重条件包括预设召回条件和/或预设相似度条件。7.根据权利要求6所述的方法,其特征在于,当所述预设辨重条件包括预设召回条件时,所述待辨别特征数据包括待辨别地址和待辨别时间,所述历史特征数据包括历史地址和历史时间,所述预设召回条件表征所述历史事件集中存在与所述待辨别事件重复的目标历史事件,所述目标历史事件的历史地址与所述待辨别地址相同,且所述目标历史事件的
历史时间与所述待辨别时间对应的时间差满足预设时间差范围。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:获取历史事件集中历史地址相同,且历史时间对应的时间差满足预设时间差范围的历史事件对;将所述历史事件对中的一个历史事件从所述历史事件集中删除,得到召回处理后的历史事件集。9.根据权利要求6所述的方法,其特征在于,当所述预设辨重条件包括预设相似度条件的情况下,所述待辨别特征数据包括采用特征提取算法获取到的待辨别事件特征,所述历史特征数据包括采用所述特征提取算法获取到的历史事件特征,所述预设相似度条件表征所述历史事件集中存在与所述待辨别事件重复的目标历史事件,所述目标历史事件的历史事件特征与所述待辨别事件特征对应的特征相似度满足预设相似度范围。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:采用特征提取算法,获取历史事件集中各历史事件分别对应的历史事件特征;基于各所述历史事件特征,确定所述历史事件集中各历史事件对分别对应的历史相似度;将历史相似度满足预设相似度范围的历史事件对中的一个历史事件从所述历史事件集中删除,得到过滤处理后的历史事件集。11.一种事件辨重模型的训练方法,其表征在于,包括:获取训练事件的训练描述数据和训练标题数据,以及获取比较事件集中各比较事件分别对应的比较描述数据和比较标题数据;将所述训练描述数据、所述训练标题数据、各所述比较描述数据和各所述比较标题数据输入到未训练完成的初始事件辨重模型中;通过所述初始事件辨重模型...

【专利技术属性】
技术研发人员:易修文李子琛郑宇
申请(专利权)人:北京京东尚科信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1