一种处理异常工单的方法及系统技术方案

技术编号：24252077 阅读：39 留言：0更新日期：2020-05-22 23:51

本发明专利技术的实施方式提供了一种处理异常工单的方法，其中，所述异常工单为除质检结论为合格的工单以外的其他工单。所述处理异常工单的方法包括：通过深度神经网络模型从所述异常工单中提取特征属性，其中，该特征属性具有m个维度，m>200；将所述特征属性转换成状态矩阵；将所述状态矩阵输入到异常工单决策模型中，其中，所述异常工单决策模型是以经过人工处理的异常工单的信息记录为样本数据通过深度强化学习算法训练得到的，所述异常工单决策模型的输入量为所述状态矩阵，所述异常工单决策模型的输出量为表征处理方案的权重向量；及通过所述异常工单决策模型计算出针对所述异常工单的处理方案。

A method and system for handling abnormal work orders

全部详细技术资料下载

【技术实现步骤摘要】
一种处理异常工单的方法及系统
本专利技术实施例涉及计算机
，特别涉及一种处理异常工单的方法及系统。
技术介绍
传统的工单质检结果分析方式是人工审核不合格、无法识别的工单图片，并将同一类的问题工单汇总反馈给装维人员，并指导他们进行改进，或者反馈给质检系统开发人员，让其优化系统。然而，人工审核的需求成本高，要求必须熟悉项目和了解算法模型，并且人工审核后还需要大量的工作去汇总并反馈，因而技术人员就想到利用机器来完成工单的审核过程。一种现有技术是利用计算机来提取工单图片中的信息，并用标签来表征图片的信息，然后设定与该标签匹配的处理方案，使标签和处理方案一一匹配，并将匹配规则存储到系统中。这样计算机能够根据所提取出来的标签来自动对应处理方案；然而，这种人为设定好的一一对应的匹配规则泛化能力很差，而且对于新的特征标签不具备学习能力。另外，由于工单图片中的特征信息是高维的，现有的强化学习模型会对高维特征属性进行降维处理，或者对于同一属性的特征标签，人为的设定低维特征去表征其特征属性，这种方法虽然降低了计算的复杂度，但是低维的特征很难表征工单图片真实的特征属性，因而会影响处理方案的准确性。
技术实现思路
本专利技术实施方式的目的在于提供一种处理异常工单的方法，可以通过计算机自动的完成异常工单的处理过程，且提高处理方案的准确性。为解决上述技术问题，本专利技术的实施方式提供了一种处理异常工单的方法，其中，所述异常工单为除质检结论为合格的工单以外的其他工单。所述处理异常工单的方法包括：通过...

【技术保护点】
1.一种处理异常工单的方法，所述异常工单为除质检结论为合格的工单以外的其他工单，其特征在于，包括：/n通过深度神经网络模型从所述异常工单中提取特征属性，其中，该特征属性具有m个维度，m>200；/n将所述特征属性转换成状态矩阵；/n将所述状态矩阵输入到异常工单决策模型中，其中，所述异常工单决策模型是以经过人工处理的异常工单的信息记录为样本数据通过深度强化学习算法训练得到的，所述异常工单决策模型的输入量为所述状态矩阵，所述异常工单决策模型的输出量为表征处理方案的权重向量；及/n通过所述异常工单决策模型计算出针对所述异常工单的处理方案。/n

【技术特征摘要】
1.一种处理异常工单的方法，所述异常工单为除质检结论为合格的工单以外的其他工单，其特征在于，包括：
通过深度神经网络模型从所述异常工单中提取特征属性，其中，该特征属性具有m个维度，m>200；
将所述特征属性转换成状态矩阵；
将所述状态矩阵输入到异常工单决策模型中，其中，所述异常工单决策模型是以经过人工处理的异常工单的信息记录为样本数据通过深度强化学习算法训练得到的，所述异常工单决策模型的输入量为所述状态矩阵，所述异常工单决策模型的输出量为表征处理方案的权重向量；及
通过所述异常工单决策模型计算出针对所述异常工单的处理方案。

2.根据权利要求1所述的处理异常工单的方法，其特征在于，所述训练异常工单决策模型的步骤具体为：
步骤a)：基于经过人工处理的异常工单的信息记录来建立样本池，所述样本池包括H条样本，每条样本包括工单图片、质检结果、处理方案及客户反馈数据，其中H>4000；
步骤b)：通过所述深度神经网络模型从所述每条样本的工单图片中提取特征属性，并转换成状态矩阵，其中，所述特征属性具有m个维度，m>200；
步骤c)：基于马尔科夫决策过程和策略逼近算法建立初始模型，所述初始模型的各个参数被设置成初始值；
步骤d)：将所述每条样本的状态矩阵输入到所述初始模型中，以得到多个中间动作及相应的多个中间回报值，并累加所述多个中间回报值以得到在所述初始模型下该条样本可获得的总回报值，且在所述样本池中新增一条训练数据；
步骤e)：将每条样本的总回报值进行累加，以得到在所述初始模型下所有样本能够获得的累积回报值；
步骤f)：更新目前的模型中的各个参数，以得到迭代模型；
步骤g)：将每条样本的所述状态矩阵输入到所述迭代模型中，以得到多个中间动作及相应的多个中间回报值，并累加所述多个中间回报值，以得到在所述迭代模型下该条样本可获得的总回报值，且在所述样本池中新增一条训练数据；
步骤h：将每条样本的总回报值进行累加，以得到在所述迭代模型下所有样本能够获得的累积回报值；
步骤i)：重复步骤f)至步骤h)，直到所述各个参数收敛，或所述样本池中存放W个训练...

【专利技术属性】
技术研发人员：李程坤，沙源，丁隆乾，罗红，阮泽凯，章婷婷，郑文彬，
申请(专利权)人：中移杭州信息技术有限公司，中国移动通信集团有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人