【技术实现步骤摘要】
案件相似度确定方法及装置、存储介质、终端
本专利技术涉及数据处理
,具体地涉及一种案件相似度确定方法及装置、存储介质、终端。
技术介绍
在案件分析场景中,随着发生案件越来越多,很多案件很有可能是相同的或者有关联的人所为。因此,需要判断一个案件和已经发生的其他的案件是否有相似性,是否可能为串并案。现有技术对串并案的判别存在诸多难点:其一,提取案件线索以及与历史案件的线索进行比较的工作量太大。其二,提取出来的数据需要按照规则处理,并且需要一定的业务逻辑处理等多个条件的制约,这些逻辑需要人力维护。例如,一个案件发生在上午十点十一分,另一个案件发生在十点十六分,而在串并案判别时对时间的精准度并没有这么高,因而需要将两个案件的发生时间统一处理为十点。其三,随着案件量增加,抽取线索的手段越来越多,线索的数据量也相应的急剧增大。而不同类型案件能够抽取到的线索往往存在较大差异,通过案件中抽取的线索判断是否有相关的串并案这种业务场景问题就越来越复杂,需要投入大量人力物力。综上,现有技术无法提供一种 ...
【技术保护点】
1.一种案件相似度确定方法,其特征在于,包括:/n根据标准指标库从待处理案件的案件信息中抽取线索数据和轨迹数据,其中,所述标准指标库包括多种类型的案件的标准指标,所述标准指标是针对线索数据和轨迹数据分别设置的;/n将抽取得到的线索数据和轨迹数据输入相似判断模型,以得到所述待处理案件与案件数据库中各个历史案件的案件相似度,其中,所述相似判断模型是基于多种类型的历史案件训练得到的,用于计算输入的待处理案件与各个历史案件的案件相似度。/n
【技术特征摘要】
1.一种案件相似度确定方法,其特征在于,包括:
根据标准指标库从待处理案件的案件信息中抽取线索数据和轨迹数据,其中,所述标准指标库包括多种类型的案件的标准指标,所述标准指标是针对线索数据和轨迹数据分别设置的;
将抽取得到的线索数据和轨迹数据输入相似判断模型,以得到所述待处理案件与案件数据库中各个历史案件的案件相似度,其中,所述相似判断模型是基于多种类型的历史案件训练得到的,用于计算输入的待处理案件与各个历史案件的案件相似度。
2.根据权利要求1所述的案件相似度确定方法,其特征在于,所述多种类型的历史案件包括正样本和负样本,其中,所述正样本中历史案件的线索数据和轨迹数据与所述历史案件的案件信息相匹配,所述负样本中历史案件的线索数据和/或轨迹数据与所述历史案件的案件信息不匹配。
3.根据权利要求1或2所述的案件相似度确定方法,其特征在于,所述相似判断模型为DeepFM网络模型,所述DeepFM网络模型包括:
输入层,用于接收多个特征向量,其中,所述多个特征向量与所述标准指标库包括的标准指标相对应,且所述多个特征向量中除所述线索数据和轨迹数据对应的特征向量外,剩余的特征向量的数值为0;
稠密层,与所述输入层耦接,所述稠密层用于对所述多个特征向量进行降维处理以得到多个特征字段;
低阶特征提取层,与所述稠密层耦接,所述低阶特征提取层用于提取所述多个特征字段的低阶特征;
高阶特征提取层,与所述稠密层耦接,所述高阶特征提取层用于提取所述多个特征字段的高阶特征;
输出层,分别与所述低阶特征提取层和高阶特征提取层耦接,所述输出层用于根据所述多个特征字段的低阶特征和高阶特征计算所述待处理案件与所述各个历史案件的案件相似度。
4.根据权利要求3所述的案件相似度确定方法,其特征在于,所述低阶特征提取层为因子分解机。
5.根据权利要求3所述的案件相似度确定方法,其特征在于,所述高阶特征提取层为神经网络。
6.根据权利要求1所述的案件相似度确定方法,其特征...
【专利技术属性】
技术研发人员:郭晓丹,王夷,吴翔,俞楠,王龙厚,戚桂洪,
申请(专利权)人:上海芯翌智能科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。