一种营商政策系统的构建方案及系统技术方案

技术编号：37293247 阅读：16 留言：0更新日期：2023-04-21 03:25

本发明专利技术涉及一种营商政策系统的构建方案及系统。本发明专利技术基于大数据平台能力，获取国内政府网站全部公开政策资讯，多重组合算法区分政策和资讯信息，包括站点算法、板块算法、链接算法、索引算法，融合线下汇编政策，保障数据广度，同时，构建营商环境知识图谱，扩展营商环境政策库识别范围；另一方面，基于营商环境文本分析模型及知识图谱，识别分类实体隐性关系及关系的动态变化，精准识别、分类、分析政策，建立特有的政策影响力分析模型，从影响广度和影响深度2个方向进行深度分析。响深度2个方向进行深度分析。响深度2个方向进行深度分析。

全部详细技术资料下载

【技术实现步骤摘要】
一种营商政策系统的构建方案及系统

[0001]本专利技术涉及信息处理分析
，具体为一种营商政策系统的构建方案及系统。

技术介绍

[0002]工作流，是对工作流程及其各操作步骤之间业务规则的抽象、概括描述。工作流建模，即将工作流程中的工作如何前后组织在一起的逻辑和规则，在计算机中以恰当的模型表达并对其实施计算。工作流要解决的主要问题是：为实现某个业务目标，利用计算机在多个参与者之间按某种预定规则自动传递文档、信息或者任务。
[0003]大数据分析技术主要由五大步骤组成：选择平台操作系统、构建Hadoop集群、数据整合和预处理、数据存储、数据挖掘和分析。其中Hadoop是一个用于存储和处理大数据的开源框架，存储空间与处理效率高，适用于批处理操作。同时Spark属于Hadoop的改进型，适用于流式与交互式数据处理与查询，实时性强且交互性好。还有较为重要的一个环节便是数据挖掘，它的主要任务包括预测建模、关联分析、聚类分析、异常检测等。在这些步骤中，有三个关键技术贯通始终：虚拟化(提升存储空间与资源利用效率)，Mapreduce(为大数据平台提供并行处理的计算模型，更适用于集群平台高性能计算)和人工智能(辅助分析挖掘)。
[0004]数据仓库技术，数据仓库可分为：操作型数据库和分析型数据库。主要由四部分组成：各个数据源单独的数据库、数据仓库技术(ETL)、数据仓库和前端应用。各类数据在数据仓库中整理归纳后方可更加快速精准地进行分析预测。
[0005]工作流能解决政策数据的业务流转和审批，但是对于新...

【技术保护点】

【技术特征摘要】
1.一种营商政策系统的构建方案及系统，其特征在于，具体包括：一、算法建模，具体包括：(1)数据抽取：对数据进行数据预处理，包括对文本的分段、分句和词向量预训练；首先对政策资讯的原始文本数据进行分段分句操作，知识抽取模型训练的基础都以句子为单位处理，并剔除部分脏数据、短句；(2)通用模型抽取：使用现有的通用实体抽取模型抽取政务舆情数据中的实体，包括发文单位、发文时间、政策类型；(3)数据标注：确定标注规范，对通过通用实体抽取模型抽取的政策资讯数据进行标注，把标注的数据放入模型进行训练；(4)政策资讯分类模型训练：在数据标注的基础上，对词进行词向量预训练，将词以向量化形式标识；(5)政策影响力算法模型训练：在营商环境中，通过算法标注识别，可以得到政策一级营商指标，二级营商指标，三级营商指标；不同的营商环境指标，通过设置不同的权限比重来标识影响深度，通过全面的政策关键词标识政策影响广度，通过影响深度和影响广度的配置，加入到影响力模型训练中，提升政策影响力的准确性；计算模型算法，这里BM25相关度算法的基础上，结合影响深度和广度指标，对正文的数据进行影响力计算，计算公式：其中D是指政策资讯文本，Q是指不同营商指标的关键词数据；k通过调整对应的权重比分，使得影响...

【专利技术属性】
技术研发人员：陈学言，田平，刘源，
申请(专利权)人：广东数源智汇科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人