社会治理文本的处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:43883430 阅读:18 留言:0更新日期:2024-12-31 19:08
本公开提供了一种社会治理文本的处理方法,包括:基于自定义词典,对各个社会治理文本分别进行预处理,获取社会治理文本对应的民生特征数据;调用文档主题生成模型对民生特征数据进行分析,生成关于社会治理文本的民生分析信息,其中民生分析信息至少包括各个社会治理文本所关联的民生主题、民生分词在民生主题上的分布概率以及各个社会治理文本在民生主题上的分布概率;以及根据民生分析信息,构建便于读取的展示页面。本公开还提供了一种社会治理文本的处理装置、电子设备及存储介质。

【技术实现步骤摘要】

本公开涉及数据处理,特别涉及一种社会治理文本的处理方法、装置、电子设备及存储介质


技术介绍

1、当前,相关部门为了提升社会治理能力、化解社会矛盾,开设了多种获取民意和民情信息的渠道,其中民生服务热线是广大市民表达诉求的重要渠道。各省市县自民生服务热线平台开通以来积累了大量的民生热线数据,这些信息主要包括上报事件发生的时间、地点和内容,蕴含了丰富的当地社会热点信息,为面向社会治理的文本数据分析与挖掘提供了丰富的数据挖掘资源。

2、但是,投诉文本数据通常为短文本,数据稀疏性问题比较严重;投诉内容一般是由政务人员手动录入,存在表达不规范、不统一等问题,还会存在错别字等噪音;另外,随着民生服务水平的提高,数据量随之增多。基于上述,人工分析投诉文本数据的难度增大,大量的非结构化数据的隐藏问题也难以手动挖掘。相关技术中没有能够将非结构化数据转化为结构化数据,并将这些文本数据转化为合理的知识表示的技术手段。


技术实现思路

1、为了解决上述技术问题中的至少一个,本公开提供了一种社会治理文本的处理方法、装置、电子本文档来自技高网...

【技术保护点】

1.一种社会治理文本的处理方法,其特征在于,包括:

2.根据权利要求1所述的社会治理文本的处理方法,其特征在于,所述基于自定义词典,对各个社会治理文本分别进行预处理,获取所述社会治理文本对应的民生特征数据,包括:

3.根据权利要求2所述的社会治理文本的处理方法,其特征在于,所述基于所述自定义词典,对所述干净文本进行分词处理,构建由多个所述民生关键词形成的语料库,包括:

4.根据权利要求1所述的社会治理文本的处理方法,其特征在于,所述根据所述民生分析信息,构建便于读取的展示页面,包括:

5.根据权利要求4所述的社会治理文本的处理方法,其特征在...

【技术特征摘要】

1.一种社会治理文本的处理方法,其特征在于,包括:

2.根据权利要求1所述的社会治理文本的处理方法,其特征在于,所述基于自定义词典,对各个社会治理文本分别进行预处理,获取所述社会治理文本对应的民生特征数据,包括:

3.根据权利要求2所述的社会治理文本的处理方法,其特征在于,所述基于所述自定义词典,对所述干净文本进行分词处理,构建由多个所述民生关键词形成的语料库,包括:

4.根据权利要求1所述的社会治理文本的处理方法,其特征在于,所述根据所述民生分析信息,构建便于读取的展示页面,包括:

5.根据权利要求4所述的社会治理文本的处理方法,其特征在于,在所述根据所述民生分析信息,构建便于读取的展示页面之前,还包括:

6....

【专利技术属性】
技术研发人员:边彬彬赵娟曲寒冰
申请(专利权)人:北京市新技术应用研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1