地区工单乱点分析方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：32466167 阅读：11 留言：0更新日期：2022-02-26 09:29

本申请涉及人工智能技术领域，尤其是涉及地区工单乱点分析方法、装置、电子设备及可读存储介质，该方法包括，获取待分析区域的工单数据；基于命名实体识别模型对工单数据进行处理，获得工单数据中的实体与实体类型；对工单数据中的实体进行共指消歧；基于实体类型以及预设标准对共指消歧后的实体进行归类，确定乱点实体；对乱点实体进行多维分析，并根据系统中待分析区域的地图配置将乱点进行地理可视化展示，本申请可以对工单中的乱点进行针对性、精准性的分析和定位。精准性的分析和定位。精准性的分析和定位。

全部详细技术资料下载

【技术实现步骤摘要】
地区工单乱点分析方法、装置、电子设备及可读存储介质

[0001]本申请涉及人工智能
，尤其是涉及地区工单乱点分析方法、装置、电子设备及可读存储介质。

技术介绍

[0002]对于人流量且人员属性较为复杂的地点及周边的工单，目前大都是靠人工筛查或者关键词匹配的形式来进行工单的筛查与定位，但是人工提取耗时高、效率低且易出错，而关键词匹配的形式不够智能，形式单一，故亟需一个科学的方法来对工单进行针对性的定位与分析。

技术实现思路

[0003]为了对工单中的乱点进行针对性、精准性的分析和定位，本申请提出了一种地区工单乱点分析方法、装置、电子设备及可读存储介质。
[0004]在本申请的第一方面，提出了一种地区工单乱点分析方法，包括：获取待分析区域的工单数据；基于命名实体识别模型对所述工单数据进行处理，获得所述工单数据中的实体与实体类型；对所述工单数据中的实体进行共指消歧；基于所述实体类型以及预设标准对共指消歧后的所述实体进行归类，确定乱点实体；对所述乱点实体进行多维分析，并根据系统中待分析区域的地图配置将所述乱点进行地理可视化展示。
[0005]通过采用上述技术方案，基于命名实体识别模型对获取到的工单数据进行处理，可以获取到以预设的实体类型特征为基准的工单中的实体以及实体类型，再对获取到的工单中的实体进行对其归一，即将同一实体的不同描述合并到一起，然后将对其归一后的实体进行归类，确定出来工单中的乱点实体类型及实体，将这些乱点实体与其他变量做分析，比如与地区间做交叉分析，然后可以根据系统中的地...

【技术保护点】

【技术特征摘要】
1.一种地区工单乱点分析方法，其特征在于，包括，获取待分析区域的工单数据；基于命名实体识别模型对所述工单数据进行处理，获得所述工单数据中的实体与实体类型；对所述工单数据中的实体进行共指消歧；基于所述实体类型以及预设标准对共指消歧后的所述实体进行归类，确定乱点实体；对所述乱点实体进行多维分析，并根据系统中待分析区域的地图配置将所述乱点进行地理可视化展示。2.根据权利要求1所述的地区工单乱点分析方法，其特征在于，所述命名实体识别模型通过以下步骤进行训练：获取工单样本数据；对所述工单样本数据进行预处理，基于BERT模型将所述工单样本数据中的文本数据转换为语义编码向量；以所述语义编码向量作为输入，以所有实体和实体类型作为输出，以transformer模型作为特征向量提取表示，以CRF作为损失函数，以维特比算法作为实体与实体类型的推理算法，完成对所述命名实体识别模型的训练。3.根据权利要求2所述的地区工单乱点分析方法，其特征在于，所述对所述工单样本数据进行预处理，基于BERT模型将所述工单样本数据中的文本信息转换为语义编码向量包括，根据预设实体类型特征对样本数据进行标注，获得第一标签样本数据；将所述第一标签样本数据转换为BIO字符标注体系的数据，得到第二标签样本数据；对所述第二标签样本数据进行分词，在每条文本数据的开头连接CLS标记；对分词后的文本数据进行embedding向量化表示，得到CLS语义编码向量。4.根据权利要求3所述的地区工单乱点分析方法，其特征在于，还包括，设置全连接层，将CLS语义编码向量作为所述全连接层的输入，输出维度长度为两倍的实体类型个数加上1。5.根据权利要求4所述的地区工单乱点分析方法，其特征在于，采用如下损失函数作为优化目标：其...

【专利技术属性】
技术研发人员：包利安，汤灏，郑文博，
申请(专利权)人：北京零点有数数据科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人