基于自然语言解析及机器学习的政策颗粒化分析系统技术方案

技术编号：37054111 阅读：16 留言：0更新日期：2023-03-29 19:31

本发明专利技术涉及一种基于自然语言解析及机器学习的政策颗粒化分析系统，解决的是准确率低的技术问题，通过采用政策文件采集输入模块、自然语言处理模块、机器学习优化模块、政策颗粒化分析输出模块；所述政策颗粒化分析输出模块根据预定的政策维度特征，以及自然语言处理模块的结果，分析输出政策的颗粒化参数；自然语言处理模块包括文件预处理单元、核心处理组件单元、单词归一化单元、词性标注单元、初级解析单元、词典查询单元、深度解析单元、自然语言处理输出单元；机器学习优化模块包括词性量化单元、机器学习算法库、优化融合单元的技术方案，较好的解决了该问题，可用于政策颗粒化分析中。析中。析中。

全部详细技术资料下载

【技术实现步骤摘要】
基于自然语言解析及机器学习的政策颗粒化分析系统

[0001]本专利技术涉及政策分析系统领域，具体涉及一种基于自然语言解析及机器学习的政策颗粒化分析系统。

技术介绍

[0002]政策分析是个人、团体、研究机构对现行或计划实行的组织政策、决策程序和活动中的情况、问题，以及公众对它们的反映信息进行系统的调研、观察，并作出定量和定性分析的过程，其目的在于协助政策制定者继续坚持或改进政策目标。这一概念最早由美国政治学家林德布洛姆提出，他认为政策分析在政策制定过程中具有普遍性。政策分析理论模型主要有：政治系统模型、团体模型、精英模型、功能过程模型、制度模型、理性模型、渐进模型和博弈模型等。
[0003]现有的政策分析系统存在效率低、准确率低的问题，本专利技术提供一种基于自然语言解析及机器学习的政策颗粒化分析系统用以解决前述计算问题。

技术实现思路

[0004]本专利技术所要解决的技术问题是现有技术中存在的基于自然语言解析及机器学习的政策颗粒化分析系统技术问题。提供一种新的基于自然语言解析及机器学习的政策颗粒化分析系统，该基于自然语言解析及机器学习的政策颗粒化分析系统具有准确度高的特点。
[0005]为解决上述技术问题，采用的技术方案如下：基于自然语言解析及机器学习的政策颗粒化分析系统，所述基于自然语言解析及机器学习的政策颗粒化分析系统包括：政策文件采集输入模块、自然语言处理模块、与自然语言处理模块连接的机器学习优化模块和与自然语言处理模块连接政策颗粒化分析输出模块；所述政策颗粒化分析输出模块根据预...

【技术保护点】

【技术特征摘要】
1.基于自然语言解析及机器学习的政策颗粒化分析系统，其特征在于：所述基于自然语言解析及机器学习的政策颗粒化分析系统包括：政策文件采集输入模块、自然语言处理模块、与自然语言处理模块连接的机器学习优化模块和与自然语言处理模块连接政策颗粒化分析输出模块；所述政策颗粒化分析输出模块根据预定的政策维度特征，以及自然语言处理模块的结果，分析输出政策的颗粒化参数；自然语言处理模块包括文件预处理单元、核心处理组件单元、单词归一化单元、词性标注单元、初级解析单元、词典查询单元、深度解析单元、自然语言处理输出单元，其中，词典查询单元用于进行词典查询；机器学习优化模块包括词性量化单元、机器学习算法库、优化融合单元；所述词性量化单元用于将自然语言处理为机器量化语言，机器学习算法库用于装载多种机器学习算法，所述优化融合单元在所述词性量化单元将自然语言处理为机器量化语言的基础上依据机器学习算法库对政策文本进行优化融合处理，机器学习优化模块执行如下步骤：步骤s1，词性量化单元将自然语言处理为机器语言；步骤s2，将原始文本分为组，对应自机器学习算法库中调取种机器学习算法模型；步骤s3，选择第个子集数据定义为验证集，其余的k
‑
1组子集数据作为训练集，输入第种机器算法模型，得到
×
个模型计算值，预定义参数，k为大于1的整数；步骤s4，定义中间参数，，为中间参数；其中，是第个子集数据定义为验证集时，独立不相关的ki个算法模型的计算值；，和为预定义的参数，为实数集合，w
ki
为第ki个w值；步骤s5，通过中间参数，预定义系数，计算出特征指数和权值分散系数；其中，，为预定义的均值为0的属同一分布但独立的误差项系数，中间参数；步骤s6，通过中间参数，计算出参数，其中，)，为预定义的均值为0的属同一分布但独立的误差项系数；步骤s7，将步骤s5、s6得到的特征指数、权值分散系数和位置参数带入中间函数，并对做傅里叶变换计算得到权值分布函数，将模型计算值与权值分布函数f（x）相乘得到一个拟合值，即完成k种算法模型计算值的拟合。2.根据权利要求1所述的基于自然语言解析及机器学习的政策颗粒化分析系统，其特征在于：核心处理组件单元包括分词器、句子边界注释器、替代语句探测器、标记生成...

【专利技术属性】
技术研发人员：杨显华，杨弋，丁春利，王铮，牛颢，高屹嵩，龙树全，姚晗，王舒，魏兵兵，李浩，廖建雄，周文安，唐山，聂珊，
申请(专利权)人：四川省标准化研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人