地区工单乱点分析方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:32466167 阅读:11 留言:0更新日期:2022-02-26 09:29
本申请涉及人工智能技术领域,尤其是涉及地区工单乱点分析方法、装置、电子设备及可读存储介质,该方法包括,获取待分析区域的工单数据;基于命名实体识别模型对工单数据进行处理,获得工单数据中的实体与实体类型;对工单数据中的实体进行共指消歧;基于实体类型以及预设标准对共指消歧后的实体进行归类,确定乱点实体;对乱点实体进行多维分析,并根据系统中待分析区域的地图配置将乱点进行地理可视化展示,本申请可以对工单中的乱点进行针对性、精准性的分析和定位。精准性的分析和定位。精准性的分析和定位。

【技术实现步骤摘要】
地区工单乱点分析方法、装置、电子设备及可读存储介质


[0001]本申请涉及人工智能
,尤其是涉及地区工单乱点分析方法、装置、电子设备及可读存储介质。

技术介绍

[0002]对于人流量且人员属性较为复杂的地点及周边的工单,目前大都是靠人工筛查或者关键词匹配的形式来进行工单的筛查与定位,但是人工提取耗时高、效率低且易出错,而关键词匹配的形式不够智能,形式单一,故亟需一个科学的方法来对工单进行针对性的定位与分析。

技术实现思路

[0003]为了对工单中的乱点进行针对性、精准性的分析和定位,本申请提出了一种地区工单乱点分析方法、装置、电子设备及可读存储介质。
[0004]在本申请的第一方面,提出了一种地区工单乱点分析方法,包括:获取待分析区域的工单数据;基于命名实体识别模型对所述工单数据进行处理,获得所述工单数据中的实体与实体类型;对所述工单数据中的实体进行共指消歧;基于所述实体类型以及预设标准对共指消歧后的所述实体进行归类,确定乱点实体;对所述乱点实体进行多维分析,并根据系统中待分析区域的地图配置将所述乱点进行地理可视化展示。
[0005]通过采用上述技术方案,基于命名实体识别模型对获取到的工单数据进行处理,可以获取到以预设的实体类型特征为基准的工单中的实体以及实体类型,再对获取到的工单中的实体进行对其归一,即将同一实体的不同描述合并到一起,然后将对其归一后的实体进行归类,确定出来工单中的乱点实体类型及实体,将这些乱点实体与其他变量做分析,比如与地区间做交叉分析,然后可以根据系统中的地图配置将乱点实体在地图中进行展示,通过这种方式可以更加精准的、批量的对工单进行处理,得出可视化的结果,使得对工单的处理更加的准确智能。
[0006]进一步地,所述命名实体识别模型通过以下步骤进行训练:获取工单样本数据;对所述工单样本数据进行预处理,基于BERT模型将所述工单样本数据中的文本数据转换为语义编码向量;以所述语义编码向量作为输入,以所有实体和实体类型作为输出,以transformer模型作为特征向量提取表示,以CRF作为损失函数,以维特比算法作为实体与实体类型的推理算法,完成对所述命名实体识别模型的训练。
[0007]再进一步地,所述对所述工单样本数据进行预处理,基于BERT模型将所述工单样本数据中的文本信息转换为语义编码向量包括,根据预设实体类型特征对样本数据进行标注,获得第一标签样本数据;将所述第一标签样本数据转换为BIO字符标注体系的数据,得到第二标签样本数据;对所述第二标签样本数据进行分词,在每条文本数据的开头连接CLS标记;对分词后的文本数据进行embedding向量化表示,得到CLS语义编码向量。
[0008]进一步地,设置全连接层,将CLS语义编码向量作为所述全连接层的输入,输出维
度长度为两倍的实体类型个数加上1。
[0009]进一步地,采用如下损失函数作为优化目标:其中,所述k为所述全连接层输出的维度长度;所述为真实标签;所述为真实输出序列;所述为真实序列得分;所述为状态转移矩阵;所述X为所述工单样本数据的输入序列[];所述Y为对应预测的标签序列值[];所述为真实序列中所有可能的位置序列的状态转移特征权重值,包括和非。
[0010]再进一步地,将最后一层的cls标记字符向量表示,作为下一层的输入向量:其中,所述n为单个单词向量长度。
[0011]进一步地,所述对所述工单数据中的实体进行共指消歧包括,利用ner模型提取所述工单数据的特征向量;基于皮尔逊相关系数对提取的所述实体对应的特征向量值进行余弦相似度计算;根据所述余弦相似度以及皮尔逊相似度系数计算任两个实体的联合相似度指标;将所述联合相似度指标大于预设阈值的两个实体定义为同一实体。
[0012]在本申请的第二方面,还提出了一种地区工单乱点分析装置,该装置包括:获取模块,用于获取待分析区域的工单数据;模型处理模块,用于基于命名实体识别模型对所述工单数据进行处理,获得所述工单数据中的实体与实体类型;归一模块,用于对所述工单数据中的实体进行共指消歧;归类模块,用于基于所述实体类型以及预设标准对共指消歧后的所述实体进行归类,确定乱点实体;分析模块,用于对所述乱点实体进行多维分析,并根据系统中待分析区域的地图配置将所述乱点进行地理可视化展示。
[0013]在本公开的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,
所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如第一方面所述的方法。
[0014]在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本公开的第一方面的方法。
附图说明
[0015]结合附图并参考以下详细说明,本申请各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了本申请实施例的一种电子设备的结构图。
[0016]图2示出了本申请实施例中地区工单乱点分析方法的流程图。
[0017]图3示出了本申请实施例中命名实体识别模型的训练方法的流程图。
[0018]图4示出了本申请实施例中地区工单乱点分析装置的原理框图。
具体实施方式
[0019]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020]在本申请的描述中,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0021]为了便于对本申请实施例的理解,首先对本申请实施例涉及的部分术语进行解释。
[0022]工单,根据字面意思可以把它理解为工作单据,工单定义由一个和多个作业组成的简单维修或制造计划,上级部门下达任务,下级部门领受任务的依据。
[0023]对于人流量且人员属性较为复杂的地点及周边的工单,目前业务部门对其进行分析和治理大都是靠人工筛查或者关键词匹配的形式来进行的,但是人工提取耗时高、效率低且易出错,而关键词匹配的形式不够智能,形式单一,故亟需一个科学的方法来对工单进行针对性的定位与分析。
[0024]人工智能行业近些年在快速发展,但是目前还没有一种有效的基于实体抽取的手段对某个局部地理区域附近的工单事项高发情况进行实体抽取,再分析的方案,因此针对上述问题,本申请提出了一种地区工单乱点分析方法、装置、电子设备及可读存储介质。
[0025]接下来对本申请实施例所涉及的系统架构进行介绍。需要说明的是,本申请实施例描述的系统架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新业务场景的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地区工单乱点分析方法,其特征在于,包括,获取待分析区域的工单数据;基于命名实体识别模型对所述工单数据进行处理,获得所述工单数据中的实体与实体类型;对所述工单数据中的实体进行共指消歧;基于所述实体类型以及预设标准对共指消歧后的所述实体进行归类,确定乱点实体;对所述乱点实体进行多维分析,并根据系统中待分析区域的地图配置将所述乱点进行地理可视化展示。2.根据权利要求1所述的地区工单乱点分析方法,其特征在于,所述命名实体识别模型通过以下步骤进行训练:获取工单样本数据;对所述工单样本数据进行预处理,基于BERT模型将所述工单样本数据中的文本数据转换为语义编码向量;以所述语义编码向量作为输入,以所有实体和实体类型作为输出,以transformer模型作为特征向量提取表示,以CRF作为损失函数,以维特比算法作为实体与实体类型的推理算法,完成对所述命名实体识别模型的训练。3.根据权利要求2所述的地区工单乱点分析方法,其特征在于,所述对所述工单样本数据进行预处理,基于BERT模型将所述工单样本数据中的文本信息转换为语义编码向量包括,根据预设实体类型特征对样本数据进行标注,获得第一标签样本数据;将所述第一标签样本数据转换为BIO字符标注体系的数据,得到第二标签样本数据;对所述第二标签样本数据进行分词,在每条文本数据的开头连接CLS标记;对分词后的文本数据进行embedding向量化表示,得到CLS语义编码向量。4.根据权利要求3所述的地区工单乱点分析方法,其特征在于,还包括,设置全连接层,将CLS语义编码向量作为所述全连接层的输入,输出维度长度为两倍的实体类型个数加上1。5.根据权利要求4所述的地区工单乱点分析方法,其特征在于,采用如下损失函数作为优化目标:其...

【专利技术属性】
技术研发人员:包利安汤灏郑文博
申请(专利权)人:北京零点有数数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1