【技术实现步骤摘要】
本公开涉及数据处理,特别涉及一种社会治理文本的处理方法、装置、电子设备及存储介质。
技术介绍
1、当前,相关部门为了提升社会治理能力、化解社会矛盾,开设了多种获取民意和民情信息的渠道,其中民生服务热线是广大市民表达诉求的重要渠道。各省市县自民生服务热线平台开通以来积累了大量的民生热线数据,这些信息主要包括上报事件发生的时间、地点和内容,蕴含了丰富的当地社会热点信息,为面向社会治理的文本数据分析与挖掘提供了丰富的数据挖掘资源。
2、但是,投诉文本数据通常为短文本,数据稀疏性问题比较严重;投诉内容一般是由政务人员手动录入,存在表达不规范、不统一等问题,还会存在错别字等噪音;另外,随着民生服务水平的提高,数据量随之增多。基于上述,人工分析投诉文本数据的难度增大,大量的非结构化数据的隐藏问题也难以手动挖掘。相关技术中没有能够将非结构化数据转化为结构化数据,并将这些文本数据转化为合理的知识表示的技术手段。
技术实现思路
1、为了解决上述技术问题中的至少一个,本公开提供了一种社会治理文本的
...【技术保护点】
1.一种社会治理文本的处理方法,其特征在于,包括:
2.根据权利要求1所述的社会治理文本的处理方法,其特征在于,所述基于自定义词典,对各个社会治理文本分别进行预处理,获取所述社会治理文本对应的民生特征数据,包括:
3.根据权利要求2所述的社会治理文本的处理方法,其特征在于,所述基于所述自定义词典,对所述干净文本进行分词处理,构建由多个所述民生关键词形成的语料库,包括:
4.根据权利要求1所述的社会治理文本的处理方法,其特征在于,所述根据所述民生分析信息,构建便于读取的展示页面,包括:
5.根据权利要求4所述的社会治理文本
...【技术特征摘要】
1.一种社会治理文本的处理方法,其特征在于,包括:
2.根据权利要求1所述的社会治理文本的处理方法,其特征在于,所述基于自定义词典,对各个社会治理文本分别进行预处理,获取所述社会治理文本对应的民生特征数据,包括:
3.根据权利要求2所述的社会治理文本的处理方法,其特征在于,所述基于所述自定义词典,对所述干净文本进行分词处理,构建由多个所述民生关键词形成的语料库,包括:
4.根据权利要求1所述的社会治理文本的处理方法,其特征在于,所述根据所述民生分析信息,构建便于读取的展示页面,包括:
5.根据权利要求4所述的社会治理文本的处理方法,其特征在于,在所述根据所述民生分析信息,构建便于读取的展示页面之前,还包括:
6....
【专利技术属性】
技术研发人员:边彬彬,赵娟,曲寒冰,
申请(专利权)人:北京市新技术应用研究所有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。