一种工单查重方法、系统、设备及存储介质技术方案

技术编号:42601537 阅读:91 留言:0更新日期:2024-09-03 18:12
本发明专利技术一种工单查重方法、系统、设备及存储介质。工单查重方法包括:获取查询工单数据和历史工单数据并进行预处理,获得查询工单词表和历史工单词表;通过预先训练好的Word2vector模型分别对查询工单词表和历史工单词表进行词向量转化并求和,获得查询工单向量和历史工单向量并计算第一相似度;基于查询工单词表和历史工单词表通过Jaccard计算第二相似度;通过BERT‑based提取查询工单数据和历史工单数据的感情特征向量并计算第三相似度;基于第一相似度、第二相似度和第三相似度,确定查询工单数据是否重复。本发明专利技术通过从语义、词共现次数和感情三个方面对查询工单数据和历史工单数据计算相似度,并通过相似度对工单进行查重,提高了对工单查重的准确度。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种工单查重方法、系统、设备及存储介质


技术介绍

1、在热线业务流转中,从话务员接收市民诉求形成工单到将工单派发给对应的部门进行处理的过程,为派单环节。在派单环节中,话务员可以在形成工单后进行工单查重,部门可以在处理工单前进行工单查重,找出重复工单后可进行合并处理的行为,称为并单。工单查重为并单的前置技术,其本质是一种根据工单文本相似度来找出重复工单的方法。目前市面上对相似度的计算可以概括为两类方法,一种为基于表层文本的相似度计算,先对工单进行分词,对比不同工单的分词结果,通过余弦似度计算当前工单与历史工单的相似度并设定相似度阈值来确认重复工单,通过此方法判断工单重复时,当文中词语一致时相似度也会随之升高,但同一个词语用到不同的位置,则会表达不同的含义,就会误认为重复工单;一种基于语义的相似度计算,先构建要素挖掘模型来挖掘出待查重工单与目标工单中的要素,再通过语义分析技术lsa计算待查重工单的要素与目标工单要素的语义相似度来形成重复工单,通过此方法判断工单重复时,当语义一致时相似度也会随之升高,但相同的语义会出现多种表达情感,本文档来自技高网...

【技术保护点】

1.一种工单查重方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取查询工单数据和历史工单数据并进行预处理,获得查询工单词表和历史工单词表,包括:

3.根据权利要求1所述的方法,其特征在于,所述Word2vector模型的训练,包括:

4.根据权利要求3所述的方法,其特征在于,所述通过预先训练好的Word2vector模型分别对所述查询工单词表和所述历史工单词表进行词向量转化并求和,获得查询工单向量和历史工单向量并计算第一相似度,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述查询工单词表和所述历史工单...

【技术特征摘要】

1.一种工单查重方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取查询工单数据和历史工单数据并进行预处理,获得查询工单词表和历史工单词表,包括:

3.根据权利要求1所述的方法,其特征在于,所述word2vector模型的训练,包括:

4.根据权利要求3所述的方法,其特征在于,所述通过预先训练好的word2vector模型分别对所述查询工单词表和所述历史工单词表进行词向量转化并求和,获得查询工单向量和历史工单向量并计算第一相似度,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述查询工单词表和所述历史工单词表通过jaccard计算第二相似度,包括:

6.根据权利要求1所述的方法,其特征在于,所述通过bert-ba...

【专利技术属性】
技术研发人员:罗兰袁勋陈虎兵姜智明许晓波
申请(专利权)人:国泰新点软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1