System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及数据处理及计算机,更具体地,涉及一种工单数据的处理方法、装置、电子设备及可读存储介质。
技术介绍
1、目前针对大量的工单数据智能化处理通常是对工单数据进行时间或地理区域的聚类,从而发现工单数据在该时间上发生的热点区域位置。但是,除了工单数据的时间和空间的特性外,工单数据的文本内容能够较好的反映各个问题。
2、因此,在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题,现有技术中没有考虑工单数据的种类和文本内容,仅仅是从时间和空间上对工单数据进行粗粒度聚类来挖掘热点区域,挖掘出的热点区域仅能表明某个范围内包含的问题种类和工单次数,却未能进一步判断各类问题产生的精确区域位置和产生的原因。
技术实现思路
1、有鉴于此,本公开提供了一种工单数据的处理方法、装置、电子设备、可读存储介质及程序产品。
2、本公开的一个方面提供了一种工单数据的处理方法,包括:对工单原始数据进行预处理,得到待处理工单数据;
3、对待处理工单数据进行时空聚类,得到多个区域集合,其中,每个区域集合包含待处理工单数据的发生时间段信息、发生地址信息和文本描述信息;
4、对每个区域集合中包含的待处理工单数据的发生地址信息进行处理,得到待处理工单数据的问题热点中心位置信息,其中,问题热点中心位置信息表征待处理工单数据在发生时间段信息下的位置;
5、基于主题模型,对每个区域集合中包含的待处理工单数据的文本描述信息进行处理,确定与待处理工单数据对应
6、根据待处理工单数据的发生时间段信息、问题热点中心位置信息和主题信息,确定待处理工单数据对应的处理结果信息。
7、根据本公开的实施例,其中,待处理工单数据包括发生时间信息。
8、根据本公开的实施例,其中,对待处理工单数据进行时空聚类,得到多个区域集合,包括:根据待处理工单数据包含的发生时间信息,对待处理工单数据进行时间聚类,得到多个时间集合,其中,每个时间集合包括多个待处理工单数据;针对每个时间集合,对待处理工单数据进行空间聚类,获得待处理工单数据的区域集合;根据每个时间集合包括的待处理工单数据的区域集合,得到多个时间集合对应的多个区域集合。
9、根据本公开的实施例,其中,根据待处理工单数据的发生地址信息,对待处理工单数据进行空间聚类,形成关于待处理工单数据的多个区域,包括:对待处理工单数据的发生地址信息进行地址解析,获取待处理工单数据的地址经纬度信息;根据待处理工单数据的地址经纬度信息,对待处理工单数据进行空间聚类,形成关于待处理工单数据的多个区域。
10、根据本公开的实施例,其中,根据待处理工单数据包含的发生时间信息,对待处理工单数据进行时间聚类,得到多个时间集合,包括:
11、根据待处理工单数据包含的发生时间信息,将待处理工单数据划分为多个时间段;
12、根据每个时间段,对待处理工单数据进行时间聚类,得到多个时间集合。
13、根据本公开的实施例,其中,对待处理工单数据进行空间聚类,获得待处理工单数据的区域集合,包括:
14、根据待处理工单数据的发生地址信息,对待处理工单数据进行空间聚类,形成关于待处理工单数据的多个区域;
15、根据多个区域,获得待处理工单数据的区域集合。
16、根据本公开的实施例,其中,对每个区域集合中包含的待处理工单数据的发生地址信息进行处理,得到待处理工单数据的问题热点中心位置信息,包括:
17、对发生地址信息进行标准化处理,获得发生地址信息的地址结构化表达信息;
18、根据地址结构化表达信息,确定每个区域集合中包含的待处理工单数据的问题热点中心位置信息。
19、根据本公开的实施例,其中,基于主题模型,对每个区域集合中包含的待处理工单数据的文本描述信息进行处理,确定与待处理工单数据对应的主题信息,包括:
20、针对每个区域集合中,
21、对文本描述信息进行预处理,得到预处理后的文本描述信息;
22、对预处理后的文本描述信息进行特征处理,获得待处理工单数据的文本向量;
23、将待处理工单数据的文本向量进行合并处理,获得待处理工单数据的矩阵信息;
24、将矩阵信息输入主题模型,确定与待处理工单数据对应的主题信息。
25、根据本公开的实施例,其中,工单原始数据包含发生地址信息,
26、对工单原始数据进行预处理,得到待处理工单数据,包括:根据预设标识信息,从工单原始数据中确定待处理工单原始数据;对待处理工单原始数据中包含的发生地址信息进行清洗处理,得到待处理工单数据。
27、本公开的另一个方面提供了一种工单数据的处理装置,包括:第一处理模块,用于对工单原始数据进行预处理,得到待处理工单数据;聚类模块,用于对待处理工单数据进行时空聚类,得到多个区域集合,其中,每个区域集合包含待处理工单数据的发生时间段信息、发生地址信息和文本描述信息;第二处理模块,用于对每个区域集合中包含的待处理工单数据的发生地址信息进行处理,得到待处理工单数据的问题热点中心位置信息,其中,问题热点中心位置信息表征待处理工单数据在发生时间段信息下的位置;第三处理模块,用于基于主题模型,对每个区域集合中包含的待处理工单数据的文本描述信息进行处理,确定与待处理工单数据对应的主题信息;确定模块,用于根据待处理工单数据的发生时间段信息、问题热点中心位置信息和主题信息,确定待处理工单数据对应的处理结果信息。
28、本公开的另一方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现如上的方法。
29、本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,指令在被执行时用于实现如上的方法。
30、本公开的另一方面提供了一种计算机程序产品,计算机程序产品包括计算机可执行指令,指令在被执行时用于实现如上的方法。
31、根据本公开的实施例,因为采用了对待处理工单数据进行时空聚类,得到多个区域集合,对该区域进行的发生地址信息进行处理,得到该待处理工单数据的在时间和空间上的问题热点中心位置信息,并基于主题模型,对该待处理工单数据的文本描述信息进行主题建模,确定与该待处理工单数据对应的主题信息的技术手段。至少部分地克服了现有技术中仅能表明某个范围内包含的问题种类和工单次数,却未能进一步判断各类问题产生的精确区域位置和产生的原因的技术问题。从而达到对该工单数据发生的位置实现精准定位,从而对该待处理工单数据发生的原因实现进一步挖掘的技术效果。
本文档来自技高网...【技术保护点】
1.一种工单数据的处理方法,包括:
2.根据权利要求1所述方法,其中,所述待处理工单数据包括发生时间信息,
3.根据权利要求2所述的方法,其中,所述根据所述待处理工单数据包含的所述发生时间信息,对所述待处理工单数据进行时间聚类,得到多个时间集合,包括:
4.根据权利要求3所述的方法,其中,对所述待处理工单数据进行空间聚类,获得所述待处理工单数据的区域集合,包括:
5.根据权利要求4所述的方法,其中,所述根据所述待处理工单数据的所述发生地址信息,对所述待处理工单数据进行空间聚类,形成关于所述待处理工单数据的多个区域,包括:
6.根据权利要求1所述的方法,其中,所述对每个所述区域集合中包含的所述待处理工单数据的所述发生地址信息进行处理,得到所述待处理工单数据的问题热点中心位置信息,包括:
7.根据权利要求1所述的方法,其中,所述基于主题模型,对每个所述区域集合中包含的所述待处理工单数据的所述文本描述信息进行处理,确定与所述待处理工单数据对应的主题信息,包括:
8.根据权利要求1所述的方法,其中,所述工
9.一种工单数据的处理装置,包括:
10.一种电子设备,包括:
11.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1-8中任一项所述的方法。
12.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。
...【技术特征摘要】
1.一种工单数据的处理方法,包括:
2.根据权利要求1所述方法,其中,所述待处理工单数据包括发生时间信息,
3.根据权利要求2所述的方法,其中,所述根据所述待处理工单数据包含的所述发生时间信息,对所述待处理工单数据进行时间聚类,得到多个时间集合,包括:
4.根据权利要求3所述的方法,其中,对所述待处理工单数据进行空间聚类,获得所述待处理工单数据的区域集合,包括:
5.根据权利要求4所述的方法,其中,所述根据所述待处理工单数据的所述发生地址信息,对所述待处理工单数据进行空间聚类,形成关于所述待处理工单数据的多个区域,包括:
6.根据权利要求1所述的方法,其中,所述对每个所述区域集合中包含的所述待处理工单数据的所述发生地址...
【专利技术属性】
技术研发人员:李晟洁,陈南辛,陈旭旭,
申请(专利权)人:京东城市北京数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。