一种海量环保人工上报事件数据的处理方法及存储介质技术

技术编号:20916540 阅读:25 留言:0更新日期:2019-04-20 09:41
本发明专利技术涉及一种海量环保人工上报事件数据的处理方法及存储介质,所述方法包括以下步骤:提取历史上报事件数据的特征值及对历史上报事件数据设置标签,根据提取的特征值及设置的标签进行训练得到事件分类模型;当获取到新的上报事件数据时,对新的上报事件数据分配事件关键词,并提取新的上报事件数据的特征值;根据分配的事件关键词及提取的特征值,通过事件分类模型对新的上报事件数据进行归类及合并后形成合并数据;将合并数据根据归类发送至受理端。通过自动识别人工上报的环保事件中的数据,如事件内容、地址、时间等信息,智能归类整合相似事件减少系统受理事件的冗余度。

A Processing Method and Storage Medium for Massive Environmental Protection Manual Reporting Event Data

The invention relates to a processing method and storage medium for mass environmental protection manual event data reporting, which comprises the following steps: extracting the eigenvalues of historical event data and setting labels for historical event data reporting, training the extracted eigenvalues and the labels to obtain event classification model; and when new event data reporting is obtained, new event reporting is carried out. Event data distributes event keywords and extracts the eigenvalues of new reported event data. According to the assigned event keywords and extracted eigenvalues, event classification model is used to classify and merge the new reported event data to form merged data. The merged data is sent to the receiving end according to the classification. By automatically identifying the data of environmental protection events reported by human, such as event content, address, time and other information, intelligent classification and integration of similar events reduces the redundancy of system acceptance events.

【技术实现步骤摘要】
一种海量环保人工上报事件数据的处理方法及存储介质
本专利技术设计环保数据上报
,特别设计一种海量环保人工上报事件数据的处理方法及存储介质。
技术介绍
随着当前国家环保网格监管制度的推进实施、环保公众的积极参与以及移动终端的普及应用,人工上报的环保事件信息愈加趋多,环保事件受理员工作任务愈加繁重。其中人工上报的环保事件信息包括12369环保投诉热线信息、市长热线环保相关投诉、群众微信上报及环保网格员上报环保事件等。目前现有的上报环保事件受理的信息化管理方法及系统主要通过按上报时间、上报渠道、上报事件类型进行分类管理。但此种管理方法及系统存在同一环保事件多渠道上报或同渠道多人上报重复情况,比如同一环保污染事件来源于网格员、群众微信上报、12369投诉等多个上报渠道,还存在同一人多个时间段上报情况,同时因人工上报事件内容描述方式不一等原因,导致在管理系统上产生了较大冗余环保上报事件信息。当海量人工上报环保数量受理在该方式的信息化管理系统上,将极大降低该系统的环保事件受理员的事件受理效率。同时上报事件的交办需要协同多个部门去办理,这要求环保事件受理员对处理流程和各部门职能非常熟悉,否则容易造成事件受理的积压。
技术实现思路
为此,需要提供一种海量环保人工上报事件数据的处理方法及存储介质,解决现有环保事件受理信息化管理方法及系统无法有效区别事实上重复的人工上报环保事件,产生了较大量的冗余环保上报事件信息的问题。为实现上述目的,专利技术人提供了一种海量环保人工上报事件数据的处理方法,包括以下步骤:提取历史上报事件数据的特征值及对历史上报事件数据设置标签,根据提取的特征值及设置的标签进行训练得到事件分类模型;当获取到新的上报事件数据时,对新的上报事件数据分配事件关键词,并提取新的上报事件数据的特征值;根据分配的事件关键词及提取的特征值,通过事件分类模型对新的上报事件数据进行归类及合并后形成合并数据;将合并数据根据归类发送至受理端。进一步优化,所述“提取历史上报事件数据的特征值及对历史上报事件数据设置标签,根据提取的特征值及设置的标签进行训练得到事件分类模型”具体包括以下步骤:根据事件关键词建立上报事件专属词库;以历史上报事件数据为样本,利用全文检索引擎对历史上报事件数据的文本内容进行自动分词匹配相应的上报事件专属词库,建立历史上报事件数据与事件关键词的映射;提取历史上报事件的特征值,将历史上报事件数据的事件关键词与特征值转换为带初始化权重值的数学向量空间,使用k-最邻近算法进行自动分类,形成事件分类模型。进一步优化,所述“使用k-最邻近算法进行自动分类”之后还包括以下步骤:以历史上报事件数据分类的去重结果为评分依据,自动对带初始化权重值进行调优,基于调优后的权重值生成分类模型。进一步优化,所述特征值包括上报事件的GPS经纬度、上报渠道、上报人、上报时间;所述事件关键词包括事件类型、事件要素、事件对象。进一步优化,所述“将合并数据根据归类发送至受理端”具体包括以下步骤:将合并数据通过事件关键词关联相似的历史上报事件数据及预设规则;获取关联对应的受理信息,所述受理信息包括受理措施、受理流程及协作部门;将合并数据及受理信息发送至受理端。专利技术人还提供了另一个技术方案:一种存储介质,所述存储介质内存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行以下步骤:提取历史上报事件数据的特征值及对历史上报事件数据设置标签,根据提取的特征值及设置的标签进行训练得到事件分类模型;当获取到新的上报事件数据时,对新的上报事件数据分配事件关键词,并提取新的上报事件数据的特征值;根据分配的事件关键词及提取的特征值,通过事件分类模型对新的上报事件数据进行归类及合并后形成合并数据;将合并数据根据归类发送至受理端。进一步优化,所述处理器执行所述步骤“提取历史上报事件数据的特征值及对历史上报事件数据设置标签;根据提取的特征值及设置的标签进行训练得到事件分类模型”时,具体执行以下步骤:根据事件关键词建立上报事件专属词库;以历史上报事件数据为样本,利用全文检索引擎对历史上报事件数据的文本内容进行自动分词匹配相应的上报事件专属词库,建立历史上报事件数据与事件关键词的映射;提取历史上报事件的特征值,将历史上报事件数据的事件关键词与特征值转换为带初始化权重值的数学向量空间,使用k-最邻近算法进行自动分类,形成事件分类模型。进一步优化,所述处理器执行所述步骤“使用k-最邻近算法进行自动分类”之后还执行以下步骤:以历史上报事件数据分类的去重结果为评分依据,自动对带初始化权重值进行调优,基于调优后的权重值生成分类模型。进一步优化,所述特征值包括上报事件的GPS经纬度、上报渠道、上报人、上报时间;所述事件关键词包括事件类型、事件要素、事件对象。进一步优化,所述处理器执行所述步骤“将合并数据根据归类发送至受理端”时,具体执行以下步骤:将合并数据通过事件关键词关联相似的历史上报事件数据及预设规则;获取关联对应的受理信息,所述受理信息包括受理措施、受理流程及协作部门;将合并数据及受理信息发送至受理端。区别于现有技术,上述技术方案,通过根据历史上报事件数据作为样本训练得到事件分类模型,然后提取环保人士上报事件数据中的事件关键词及特征值等,根据事件分类模型自动归类合并形成合并数据,然后发送给受理端,通过自动识别人工上报的环保事件中的数据,如事件内容、地址、时间等信息,智能归类整合相似事件减少系统受理事件的冗余度。附图说明图1为具体实施方式所述海量环保人工上报事件数据的处理方法的一种流程示意图;图2为具体实施方式所述存储介质的一种结构示意图。具体实施方式为详细说明技术方案的
技术实现思路
、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。请参阅图1,本实施例所述海量环保人工上报事件数据的处理方法,包括以下步骤:步骤S110:提取历史上报事件数据的特征值及对历史上报事件数据设置标签,根据提取的特征值及设置的标签进行训练得到事件分类模型;通过将历史上报事件作为样本,进行建立事件分类模型,进行用于对环保人士通过人工方式上报的事件进行识别,其中,具体建立事件分类模型的具体步骤如下:根据事件关键词建立上报事件专属词库;以历史上报事件数据为样本,利用全文检索引擎对历史上报事件数据的文本内容进行自动分词匹配相应的上报事件专属词库,建立历史上报事件数据与事件关键词的映射;提取历史上报事件的特征值,将历史上报事件数据的事件关键词与特征值转换为带初始化权重值的数学向量空间,使用k-最邻近算法进行自动分类,形成事件分类模型。其中,事件关键词包括事件类型、事件要素、事件对象。通过建立历史上报事件数据与事件关键词之间的映射,对历史上报事件进行设置相应的标签,如根据事件关键词a建立上报事件专属词库A,然后获取历史上报事件数据,以历史上报事件数据为样本,利用全文检索引擎对作为样本的历史上报事件数据的文本内容进行自动匹配相应的上报事件专属词库,即对样本的文本内容进行检索是否包含有上报事件专属词库所对应的关键词,如检索到包含有关键词a时,则匹配到词库A中,建立历史上报事件数据与事件关键词之间的映射。而为了建立最优分类模型,所述“使用k-最邻近算法进行自动分类”之后还包括以下步骤:以历史上本文档来自技高网
...

【技术保护点】
1.一种海量环保人工上报事件数据的处理方法,其特征在于,包括以下步骤:提取历史上报事件数据的特征值及对历史上报事件数据设置标签,根据提取的特征值及设置的标签进行训练得到事件分类模型;当获取到新的上报事件数据时,对新的上报事件数据分配事件关键词,并提取新的上报事件数据的特征值;根据分配的事件关键词及提取的特征值,通过事件分类模型对新的上报事件数据进行归类及合并后形成合并数据;将合并数据根据归类发送至受理端。

【技术特征摘要】
1.一种海量环保人工上报事件数据的处理方法,其特征在于,包括以下步骤:提取历史上报事件数据的特征值及对历史上报事件数据设置标签,根据提取的特征值及设置的标签进行训练得到事件分类模型;当获取到新的上报事件数据时,对新的上报事件数据分配事件关键词,并提取新的上报事件数据的特征值;根据分配的事件关键词及提取的特征值,通过事件分类模型对新的上报事件数据进行归类及合并后形成合并数据;将合并数据根据归类发送至受理端。2.根据权利要求1所述海量环保人工上报事件数据的处理方法,其特征在于,所述“提取历史上报事件数据的特征值及对历史上报事件数据设置标签,根据提取的特征值及设置的标签进行训练得到事件分类模型”具体包括以下步骤:根据事件关键词建立上报事件专属词库;以历史上报事件数据为样本,利用全文检索引擎对历史上报事件数据的文本内容进行自动分词匹配相应的上报事件专属词库,建立历史上报事件数据与事件关键词的映射;提取历史上报事件的特征值,将历史上报事件数据的事件关键词与特征值转换为带初始化权重值的数学向量空间,使用k-最邻近算法进行自动分类,形成事件分类模型。3.根据权利要求2所述海量环保人工上报事件数据的处理方法,其特征在于,所述“使用k-最邻近算法进行自动分类”之后还包括以下步骤:以历史上报事件数据分类的去重结果为评分依据,自动对带初始化权重值进行调优,基于调优后的权重值生成分类模型。4.根据权利要求1所述海量环保人工上报事件数据的处理方法,其特征在于,所述特征值包括上报事件的GPS经纬度、上报渠道、上报人、上报时间;所述事件关键词包括事件类型、事件要素、事件对象。5.根据权利要求1所述海量环保人工上报事件数据的处理方法,其特征在于,所述“将合并数据根据归类发送至受理端”具体包括以下步骤:将合并数据通过事件关键词关联相似的历史上报事件数据及预设规则;获取关联对应的受理信息,所述受理信息包括受理措施、受理流程及协作部门;将合并数据及受理信息发送至受理...

【专利技术属性】
技术研发人员:张美跃程少锋范章华俞传情周业
申请(专利权)人:恒瑞通福建信息技术有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1