一种基于聚类融合的事件分拨处置系统技术方案

技术编号:35178879 阅读:54 留言:0更新日期:2022-10-12 17:46
本发明专利技术公开了一种基于聚类融合的事件分拨处置系统,包括:事件预处理模块,将获取的当前事件信息转化为机器可计算信息,并将机器可计算信息生成事件指纹,存入预设的事件计算表;事件分拨模块,基于机器可计算信息,通过K

【技术实现步骤摘要】
一种基于聚类融合的事件分拨处置系统


[0001]本专利技术涉及智慧城市数据处理
,更具体地说,本专利技术涉及一种基于聚类融合的事件分拨处置系统。

技术介绍

[0002]在全国各地都在推行“一网统管”的背景下,城市运行中事件上报是重要地工作方式之一;传统的城市事件从上报、分拨、处置、决策分析等,多以人工模式为主,存在事件重复上报、事件人工分拨效率低下,事件处置缺乏依据、网格力量配置不科学等系列问题,对于事件处置力量资源的调度分配也存在缺乏参考依据;现有的按照“三定”职责关联来执行分拨的方式,对于职责明确的简单事项,可以满足应用场景的使用,但对于跨部门跨领域的多跨事件,则明显不能满足。
[0003]因此,有必要提出一种基于聚类融合的事件分拨处置系统,以至少部分地解决现有技术中存在的问题。

技术实现思路

[0004]为至少部分地解决上述问题,本专利技术提供了一种基于聚类融合的事件分拨处置系统,融合机器学习、空间地理信息系统等多种技术,旨在至少一定程度上解决上述技术中的技术问题之一,相对于传统人工的方式,本专利技术引入机器学习上的聚类技术,通过自动化的手段,在事件的去重、分拨、处置、分析等阶段,辅助系统进行事件流转,可以提高事件经办效率,为事件处置力量资源的调度分配提供参考依据,可以有效提升政府治理体系和治理能力现代化水平。
[0005]一种基于聚类融合的事件分拨处置系统,包括:事件预处理模块,用于将获取的当前事件信息转化为机器可计算信息,并将机器可计算信息生成事件指纹,存入预设的事件计算表;
[0006]事件分拨模块,用于基于机器可计算信息,通过K

近邻算法分析事件计算表中的历史事件,结合当前事件发生的网格或行政区划,获取当前事件所对应的预分拨部门类型列表;
[0007]事件处置模块,用于基于机器可计算信息,通过K

近邻算法分析预设的预案库中的预案和事件计算表中的历史事件,获取当前事件的处置备选预案;
[0008]事件分析模块,用于区分事件高发区块、事件高发时段和事件高发类型对当前事件进行聚类分析,识别获得当前事件的高发点位和高频类别。
[0009]优选地,所述事件预处理模块包括事件信息转化单元,用于通过哈希算法将事件信息转化为机器可计算信息;所述事件信息转化单元包括内容描述转化子单元、发生地址转化子单元和时间描述转化子单元;
[0010]所述内容描述转化子单元,用于基于预设的词库将事件描述文本生成词向量;
[0011]所述发生地址转化子单元,用于利用地理编码服务将事件发生地址转成可计算可
定位的经纬度;
[0012]所述时间描述转化子单元,用于提取事件描述中的事发时间文案,将所述事发时间文案转成对应的时间戳。
[0013]优选地,所述内容描述转化子单元还包括词库构建分子单元和词向量生成分子单元;
[0014]所述词库构建分子单元,用于设定词库的语料来源、词汇去除规则和词库数量规模;所述语料来源包括历史事件描述、预案文本、事项描述、三定职责描述;所述词汇去除规则包括去除停用词、数字字母、地域词汇、地理信息系统词汇和人名;所述词库数量规模为将词汇数量设定在15000字至20000字范围内;
[0015]所述词向量生成分子单元,用于采用压缩算法,将词库初始向量的维度压缩至100维,而后统计事件描述文本中是否包含相应的典型词汇,如包含相应的典型词汇,则将词汇向量在词汇对应的序号的位置上标记为1,其它的位置上全部标记为0。
[0016]优选地,所述事件预处理模块还包括事件指纹判定单元和疑似重复事件判定单元,所述事件指纹判定单元用于判断当前事件的事件指纹在历史事件库中是否存在;所述疑似重复事件判定单元,用于判定是否存在疑似重复事件;
[0017]所述事件指纹判定单元包括,若当前事件的事件指纹在历史事件库中存在,则标识当前事件为重复事件,经人工确认后删除该当前事件;
[0018]若当前事件的事件指纹在历史事件库中不存在,则通过基于密度且性能优越的时空聚类算法,以当前事件的机器可计算信息为核心,设置相应的距离阈值参数,按照预设的选择规则选择事件计算表中的事件进行聚类分析;所述选择规则包括选择事件发生时间处于事件发生时刻所对应的时间戳前一日和后一日范围内的事件、选择事件发生地点所处经纬度所在网格及周边网格的事件;
[0019]所述疑似重复事件判定单元,用于判断在当前事件发生时刻前后及空间附近是否存在疑似重复的事件;若分析发现存在疑似重复事件,则将当前事件标识为疑似重复,通过人工确认后,将当前事件与历史重复事件进行融合,视作同一个事件进行处置;若分析发现不存在疑似重复事件,则转入事件分拨模块进行处理。
[0020]优选地,所述事件分拨模块,包括:
[0021]获取当前事件发生的网格和行政区划;
[0022]在事件计算表中的历史事件中,建立历史事件的词向量的训练样本集,通过K

近邻算法,计算得到与当前事件的词向量最邻近的五个历史事件,并获取该五个事件对应的处置部门类型;
[0023]基于所述处置部门类型、网格和行政区划,形成预分拨的具体处置部门类型列表。
[0024]优选地,所述事件处置模块,用于提取预案库的预案描述信息,将所述预案描述信息,基于word2Vec模型生成预案词向量,存入预案可计算表;
[0025]在预案可计算表中,建立预案词向量的训练样本集,通过K

近邻算法,计算得到与当前事件的词向量最邻近的五个预案数据集;
[0026]在事件计算表中的历史事件中,建立历史事件的词向量的训练样本集,通过K

近邻算法,计算得到与当前事件的词向量最邻近的五个历史事件对应的处置预案数据集;
[0027]合并五个预案数据集和处置预案数据集,形成备选预案数据集;
[0028]按邻近度从小到大排序,将备选预案数据集以列表形式呈现给事件处置人员。
[0029]优选地,所述事件分析模块包括事件高发区块分析单元、事件高发时段分析单元和事件高发类型分析单元;
[0030]所述事件高发区块分析单元,用于基于事件发生地点所处的经纬度,通过具有噪声的基于密度的聚类方法,采用预设的距离算法,将沿着某一道路发生的事件进行聚类,获得事件高发区块分析结果;
[0031]所述事件高发时段分析单元,用于利用时间周期计算方式统计事件发生频度,获得事件高发时段统计结果;根据预设的距离阈值,基于密度且性能优越的时空聚类算法,对事件高发区块分析结果和事件高发时段统计结果进行聚类,获得某个时间节点、某个区块发生的事件汇聚结果;
[0032]所述事件高发类型分析单元,用于针对事件类型的频度,通过事件类型的词向量进行聚类,形成按照事件词向量进行聚类的聚簇。
[0033]优选地,所述时间周期计算方式包括下列计算方式的一种或多种:
[0034]按天计算方式,将一天的时间按1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于聚类融合的事件分拨处置系统,其特征在于,包括:事件预处理模块,用于将获取的当前事件信息转化为机器可计算信息,并将机器可计算信息生成事件指纹,存入预设的事件计算表;事件分拨模块,用于基于机器可计算信息,通过K

近邻算法分析事件计算表中的历史事件,结合当前事件发生的网格或行政区划,获取当前事件所对应的预分拨部门类型列表;事件处置模块,用于基于机器可计算信息,通过K

近邻算法分析预设的预案库中的预案和事件计算表中的历史事件,获取当前事件的处置备选预案;事件分析模块,用于区分事件高发区块、事件高发时段和事件高发类型对当前事件进行聚类分析,识别获得当前事件的高发点位和高频类别。2.根据权利要求1所述的一种基于聚类融合的事件分拨处置系统,其特征在于,所述事件预处理模块包括事件信息转化单元,用于通过哈希算法将事件信息转化为机器可计算信息;所述事件信息转化单元包括内容描述转化子单元、发生地址转化子单元和时间描述转化子单元;所述内容描述转化子单元,用于基于预设的词库将事件描述文本生成词向量;所述发生地址转化子单元,用于利用地理编码服务将事件发生地址转成可计算可定位的经纬度;所述时间描述转化子单元,用于提取事件描述中的事发时间文案,将所述事发时间文案转成对应的时间戳。3.根据权利要求2所述的一种基于聚类融合的事件分拨处置系统,其特征在于,所述内容描述转化子单元还包括词库构建分子单元和词向量生成分子单元;所述词库构建分子单元,用于设定词库的语料来源、词汇去除规则和词库数量规模;所述语料来源包括历史事件描述、预案文本、事项描述、三定职责描述;所述词汇去除规则包括去除停用词、数字字母、地域词汇、地理信息系统词汇和人名;所述词库数量规模为将词汇数量设定在15000字至20000字范围内;所述词向量生成分子单元,用于采用压缩算法,将词库初始向量的维度压缩至100维,而后统计事件描述文本中是否包含相应的典型词汇,如包含相应的典型词汇,则将词汇向量在词汇对应的序号的位置上标记为1,其它的位置上全部标记为0。4.根据权利要求1所述的一种基于聚类融合的事件分拨处置系统,其特征在于,所述事件预处理模块还包括事件指纹判定单元和疑似重复事件判定单元,所述事件指纹判定单元用于判断当前事件的事件指纹在历史事件库中是否存在;所述疑似重复事件判定单元,用于判定是否存在疑似重复事件;所述事件指纹判定单元包括,若当前事件的事件指纹在历史事件库中存在,则标识当前事件为重复事件,经人工确认后删除该当前事件;若当前事件的事件指纹在历史事件库中不存在,则通过基于密度且性能优越的时空聚类算法,以当前事件的机器可计算信息为核心,设置相应的距离阈值参数,按照预设的选择规则选择事件计算表中的事件进行聚类分析;所述选择规则包括选择事件发生时间处于事件发生时刻所对应的时间戳前一日和后一日范围内的事件、选择事件发生地点所处经纬度所在网格及周边网格的事件;所述疑似重复事件判定单元,用于判断在当前事件发生时刻前后及空间附近是否存在
疑似重复的事件;若分析发现存在疑似重复事件,则将当前事件标识为疑似重复,通过人工确认后,将当前事件与历史...

【专利技术属性】
技术研发人员:叶智慧张亦萍陈成斌苏胜林马军亮
申请(专利权)人:中睿信数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1