一种住建领域政务热线工单数据分析方法及系统技术方案

技术编号:27658160 阅读:10 留言:0更新日期:2021-03-12 14:23
本发明专利技术提供了一种住建领域政务热线工单数据分析方法及系统,获取热线电话,记录语音信息,将语音数据转化为文本信息,形成工单;对工单数据进行预处理,根据工单的受理时间,描绘各工单的时间趋势变化;提取工单中工单涉及区域数据,确定工单涉及问题所在位置;构建住建领域专业词库,对工单内容进行分词,基于分词结果,构建文档词条矩阵;获取各个工单的文档词条矩阵,进行文本主题的识别,将不同主题下频率大于设定值的关键词作为主题关键词;基于时间趋势变化、涉及问题所在位置和主题关键词,生成工单数据分析报告。本发明专利技术能够实现对诉求工单的时间趋势分析、空间分布分析和主题挖掘,解决住建领域的数据分析问题,特别是大数据的分析。

【技术实现步骤摘要】
一种住建领域政务热线工单数据分析方法及系统
本专利技术属于工单数据处理
,具体涉及一种住建领域政务热线工单数据分析方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。随着人们生活水平的提高,人们对自己的生活质量、生活舒适感要求也越来越高,对于住建部门的投诉、咨询等电话也越来越多。但是,与日益增加的工单量相比,目前的工单数据的分析十分滞后,难以提取出有价值的信息以供部门决策,数据分析仅停留在简单的统计分析。
技术实现思路
本专利技术为了解决上述问题,提出了一种住建领域政务热线工单数据分析方法及系统,本专利技术能够实现对诉求工单的时间趋势分析、空间分布分析和主题挖掘,解决住建领域的数据分析问题,特别是大数据的分析。根据一些实施例,本专利技术采用如下技术方案:一种住建领域政务热线工单数据分析方法,包括以下步骤:获取热线电话,记录语音信息,将语音数据转化为文本信息,形成工单;对工单数据进行预处理,根据工单的受理时间,描绘各工单的时间趋势变化;提取工单中工单涉及区域数据,确定工单涉及问题所在位置;构建住建领域专业词库,对工单内容进行分词,基于分词结果,构建文档词条矩阵;获取各个工单的文档词条矩阵,进行文本主题的识别,将不同主题下频率大于设定值的关键词作为主题关键词;基于时间趋势变化、涉及问题所在位置和主题关键词,生成工单数据分析报告。作为可选择的实施方式,对工单数据进行预处理的具体过程包括:构建噪音数据库,剔除工单中属于噪音数据库中的数据。作为可选择的实施方式,提取工单内受理时间,确定年份、月份、星期以及具体时刻,进行时间趋势的分析。作为可选择的实施方式,构建住建领域专业词库,对工单内容进行分词的具体过程包括:构建住建领域的专业词库,包括自定义专业词库与停用词词库;自定义专业词库是指作为整体出现的词语,停用词库是指无意义的语气助词。作为可选择的实施方式,所述住建领域专业词库内的词语分行存储,每一个词语占一行。作为可选择的实施方式,基于分词结果,构建文档词条矩阵的具体过程包括:以每一个分词作为单独的一列,每一行表示的是工单内容,以词语出现次数进行排列。作为可选择的实施方式,进行文本主题的识别的具体过程包括:使用LDA算法获取工单的主题,利用无监督机器学习方法将主题进行分类,根据每个主题下频率超过设定值的若干关键词,概括出该主题的主旨。一种住建领域政务热线工单数据分析系统,包括:工单转化模块,被配置为获取热线电话,记录语音信息,将语音数据转化为文本信息,形成工单;时间趋势分析模块,被配置为根据工单的受理时间,描绘各工单的时间趋势变化;空间分析模块,被配置为提取工单中工单涉及区域数据,确定工单涉及问题所在位置;主题分析模块,被配置为构建住建领域专业词库,对工单内容进行分词,基于分词结果,构建文档词条矩阵,获取各个工单的文档词条矩阵,进行文本主题的识别,将不同主题下频率大于设定值的关键词作为主题关键词;分析报告生成模块,被配置为基于时间趋势变化、涉及问题所在位置和主题关键词,生成工单数据分析报告。一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种住建领域政务热线工单数据分析方法中的步骤。一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种住建领域政务热线工单数据分析方法中的步骤。与现有技术相比,本专利技术的有益效果为:本专利技术能够实现诉求工单的时间趋势分析。其中包括年度、月度与星期的工单数量变化趋势;同时,时间变化趋势详细到各个时刻,描绘不同时刻的工单数量变化趋势;本专利技术能够描绘出具体城区的处理的工单数量,有助于后期的区域管理和区域分析;本专利技术能够进行诉求工单的主题挖掘,实现工单内容的自动聚类,有助于进行同样工单的聚类,发现共同问题,或去除重复工单。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。图1(a)-(c)为本实施例中几种时间趋势分析示意图;图2为本实施例中城区分布示意图;图3为本实施例工单主题挖掘过程示意图;图4位本实施例的过程示意图。具体实施方式:下面结合附图与实施例对本专利技术作进一步说明。应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。一种住建领域政务热线工单数据分析方法,应用于住建领域政务热线,首先对热线处理流程进行简要说明,即:基于本实施例的应用场景(即住建领域政务热线),公民办拨打12345表达诉求,市长热线将公民诉求转化为工单文本信息,并转至住建部门热线平台,基本热线处理流程如下所述:工作人员提供人工服务,接听电话并记录用户需求信息。现有的语音识别技术已经较为普及,可以通过智能客服与用户进行交流,记录用户的语音,并通过某种语音识别框架将语音数据转化为文本信息。12345市民热线的工作人员会将记录好的公民诉求形成工单,并派发至相关的单位,其中包括住房与城乡建设数字化中心,负责处理住建领域的工单。如图4所示,本实施例的一种住建领域政务热线工单数据分析方法,具体包括以下步骤:(1)数据收集:基于热线处理流程,工单数据来自是12345转办工单。(2)数据处理:(i)时间变量的处理:在工单数据中,有工单的受理时间变量,格式为年—月—日时:分:秒(如:2019—12—3100:00:00),可以提取出工单受理时间的年份、月份、星期以及具体时刻,从而可以进行时间趋势的分析。(ii)空间变量的处理:工单数据中,有一列变量是所在城区,即公民反映问题所在的城区(iii)工单内容的处理:包括构建住建领域专业词库、分词、构建文档词条矩阵。在本实施例中,以山东省济南市住建工单为例进行说明。12345转办的工单具有特定的格式,分为以下几种情况:格式一:“12345韩青转办:来电人反映:槐荫区保利华府2区业主,整个小区近期陆续交房,陆续安装天然气报警器,但工作人员收取报警器费用270元(本文档来自技高网
...

【技术保护点】
1.一种住建领域政务热线工单数据分析方法,其特征是:包括以下步骤:/n获取热线电话,记录语音信息,将语音数据转化为文本信息,形成工单;/n对工单数据进行预处理,根据工单的受理时间,描绘各工单的时间趋势变化;/n提取工单中工单涉及区域数据,确定工单涉及问题所在位置;/n构建住建领域专业词库,对工单内容进行分词,基于分词结果,构建文档词条矩阵;/n获取各个工单的文档词条矩阵,进行文本主题的识别,将不同主题下频率大于设定值的关键词作为主题关键词;/n基于时间趋势变化、涉及问题所在位置和主题关键词,生成工单数据分析报告。/n

【技术特征摘要】
1.一种住建领域政务热线工单数据分析方法,其特征是:包括以下步骤:
获取热线电话,记录语音信息,将语音数据转化为文本信息,形成工单;
对工单数据进行预处理,根据工单的受理时间,描绘各工单的时间趋势变化;
提取工单中工单涉及区域数据,确定工单涉及问题所在位置;
构建住建领域专业词库,对工单内容进行分词,基于分词结果,构建文档词条矩阵;
获取各个工单的文档词条矩阵,进行文本主题的识别,将不同主题下频率大于设定值的关键词作为主题关键词;
基于时间趋势变化、涉及问题所在位置和主题关键词,生成工单数据分析报告。


2.如权利要求1所述的一种住建领域政务热线工单数据分析方法,其特征是:对工单数据进行预处理的具体过程包括:构建噪音数据库,剔除工单中属于噪音数据库中的数据。


3.如权利要求1所述的一种住建领域政务热线工单数据分析方法,其特征是:提取工单内受理时间,确定年份、月份、星期以及具体时刻,进行时间趋势的分析。


4.如权利要求1所述的一种住建领域政务热线工单数据分析方法,其特征是:构建住建领域专业词库,对工单内容进行分词的具体过程包括:构建住建领域的专业词库,包括自定义专业词库与停用词词库;自定义专业词库是指作为整体出现的词语,停用词库是指无意义的语气助词。


5.如权利要求4所述的一种住建领域政务热线工单数据分析方法,其特征是:所述住建领域专业词库内的词语分行存储,每一个词语占一行。


6.如权利要求1所述的一种住建领域政务热线工单数据分析方法,其特征是:基于分词结果,构建文档词条矩阵...

【专利技术属性】
技术研发人员:史勇明孙宗锋王立峰赵兴华管一鸣柳冬魏新滕璇李如坤陈庆峰
申请(专利权)人:济南市城乡建设数字化中心山东大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1