【技术实现步骤摘要】
一种事件辨重方法、事件辨重模型的训练方法及其装置
[0001]本专利技术涉及计算机
,尤其涉及一种事件辨重方法、事件辨重模型的训练方法及其装置。
技术介绍
[0002]社会治理现代化是国家治理体系和治理能力现代化的重要组成部分,其中,高效处置城市中的各类上报事件是提升社会治理效能的必要途径,目前,上报事件的获取渠道包括走访、市民热线、投诉平台、物联网设备报警等等。
[0003]由于获取渠道的多元化以及市民希望解决问题的急迫性,经常会出现同一上报事件重复上报的情况,导致上报事件被重复派单,浪费社会资源。在上报事件的处置流程中,目前还是依赖派单人员进行重复事件的辨别。
[0004]在实现本专利技术的过程中,发现现有技术中至少存在以下技术问题:
[0005]由于上报事件的数据量巨大,人工辨重的方法不仅效率低,且在辨重的过程中经常会出现漏判或误判的情况,辨重结果的可靠性差。
技术实现思路
[0006]本专利技术实施例提供了一种事件辨重方法、事件辨重模型的训练方法及其装置,以解决人工辨重方法存在的效率低的问题,提高辨重结果的可靠性。
[0007]根据本专利技术一个实施例提供了一种事件辨重方法,该方法包括:
[0008]获取待辨别事件的待辨别描述数据和待辨别标题数据;
[0009]将所述待辨别描述数据和待辨别标题数据输入到预先训练完成的目标事件辨重模型中;
[0010]通过所述目标事件辨重模型中的编码网络,基于所述待辨别描述数据和待辨别标题数据,确定待 ...
【技术保护点】
【技术特征摘要】
1.一种事件辨重方法,其表征在于,包括:获取待辨别事件的待辨别描述数据和待辨别标题数据;将所述待辨别描述数据和待辨别标题数据输入到预先训练完成的目标事件辨重模型中;通过所述目标事件辨重模型中的编码网络,基于所述待辨别描述数据和待辨别标题数据,确定待辨别融合表征;通过所述目标事件辨重模型中的分类器,基于历史事件集中各历史事件分别对应的历史融合表征以及所述编码网络输出的待辨别融合表征,输出所述待辨别事件对应的目标辨重结果。2.根据权利要求1所述的方法,其表征在于,所述编码网络包括编码器和融合单元,所述编码器,用于基于所述待辨别描述数据和待辨别标题数据,确定待辨别描述表征和待辨别标题表征,所述融合单元,用于对所述编码器输出的待辨别描述表征和待辨别标题表征执行融合操作,得到待辨别融合表征。3.根据权利要求2所述的方法,其特征在于,所述编码器包括描述编码单元和标题编码单元;其中,所述描述编码单元,用于对所述待辨别描述数据执行描述编码操作,得到待辨别描述表征;所述标题编码单元,用于对所述待辨别标题数据执行标题编码操作,得到待辨别标题表征。4.根据权利要求3所述的方法,其表征在于,所述目标事件辨重模型的模型架构为孪生网络架构,相应的,所述目标事件辨重模型还包含与所述编码网络的网络架构及网络参数相同的孪生网络,所述孪生网络,用于基于历史事件集中至少一个历史事件分别对应的历史描述数据和历史标题数据,确定至少一个历史融合表征。5.根据权利要求1所述的方法,其表征在于,所述分类器,具体用于:针对历史事件集中的每个历史事件,基于所述历史事件对应的历史融合表征和所述编码网络输出的待辨别融合表征,确定融合差值表征;基于所述待辨别融合表征、各所述历史融合表征和各所述融合差值表征,输出所述待辨别事件对应的目标辨重结果。6.根据权利要求1
‑
5任一项所述的方法,其表征在于,在获取待辨别事件的待辨别描述数据和待辨别标题数据之前,所述方法还包括:获取待辨别事件对应的待辨别特征数据,以及获取历史事件集中各历史事件分别对应的历史特征数据;在所述待辨别特征数据和各所述历史特征数据满足预设辨重条件的情况下,将所述待辨别事件对应的目标辨重结果设置为重复事件;在所述待辨别特征数据和各所述历史特征数据不满足预设辨重条件的情况下,执行获取待辨别事件的待辨别描述数据和待辨别标题数据的步骤;其中,所述预设辨重条件包括预设召回条件和/或预设相似度条件。7.根据权利要求6所述的方法,其特征在于,当所述预设辨重条件包括预设召回条件时,所述待辨别特征数据包括待辨别地址和待辨别时间,所述历史特征数据包括历史地址和历史时间,所述预设召回条件表征所述历史事件集中存在与所述待辨别事件重复的目标历史事件,所述目标历史事件的历史地址与所述待辨别地址相同,且所述目标历史事件的
历史时间与所述待辨别时间对应的时间差满足预设时间差范围。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:获取历史事件集中历史地址相同,且历史时间对应的时间差满足预设时间差范围的历史事件对;将所述历史事件对中的一个历史事件从所述历史事件集中删除,得到召回处理后的历史事件集。9.根据权利要求6所述的方法,其特征在于,当所述预设辨重条件包括预设相似度条件的情况下,所述待辨别特征数据包括采用特征提取算法获取到的待辨别事件特征,所述历史特征数据包括采用所述特征提取算法获取到的历史事件特征,所述预设相似度条件表征所述历史事件集中存在与所述待辨别事件重复的目标历史事件,所述目标历史事件的历史事件特征与所述待辨别事件特征对应的特征相似度满足预设相似度范围。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:采用特征提取算法,获取历史事件集中各历史事件分别对应的历史事件特征;基于各所述历史事件特征,确定所述历史事件集中各历史事件对分别对应的历史相似度;将历史相似度满足预设相似度范围的历史事件对中的一个历史事件从所述历史事件集中删除,得到过滤处理后的历史事件集。11.一种事件辨重模型的训练方法,其表征在于,包括:获取训练事件的训练描述数据和训练标题数据,以及获取比较事件集中各比较事件分别对应的比较描述数据和比较标题数据;将所述训练描述数据、所述训练标题数据、各所述比较描述数据和各所述比较标题数据输入到未训练完成的初始事件辨重模型中;通过所述初始事件辨重模型...
【专利技术属性】
技术研发人员:易修文,李子琛,郑宇,
申请(专利权)人:北京京东尚科信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。