System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于交互可视分析的风险企业规则模型构建与查询方法技术_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

基于交互可视分析的风险企业规则模型构建与查询方法技术

技术编号:40949642 阅读:4 留言:0更新日期:2024-04-18 20:24
本发明专利技术提供一种基于交互可视分析的风险企业规则模型构建与查询方法,包括如下步骤:收集企业相关数据,对每家企业的数据进行预处理,得到标准化数据与准则维度;基于准则维度,通过层次分析法,构建预设层次模型;构建层次规则权重自适应调整模块和SQL语句生成模块;搭建集成准则权重自适应调整模块与SQL语句生成模块的可视分析平台,并提供交互接口;将标准化数据导入可视分析平台,并输入样例风险企业,对预设层次模型进行调整,获得调整后的风险企业层次模型与待查询目标企业集合的SQL语句。本发明专利技术可以通过与可视化系统的交互,可以基于少量的已知风险的企业名单,筛选出一批数量合适的潜在风险企业,同时获得表达该筛选过程的SQL语句。

【技术实现步骤摘要】

本专利技术涉及风险企业查询管理领域,尤其涉及一种基于交互可视分析的风险企业规则模型构建与查询方法


技术介绍

1、地区企业风险评估是对某一特定地区内企业所面临各类风险进行系统分析和评估的过程。金融投资机构、政府机构、公司或独立的风险评估机构需要通过企业风险评估,以深入了解企业的活动是否符合当地、国家和国际法规,是否存在面临罚款、诉讼或业务停止风险的可能性。通过这一评估,这些机构可以更为明智地制定新的投资计划或治理政策,以降低潜在的投资损失,并有助于维护社会稳定。

2、数据分析作为评估地区企业法律风险的工具备受关注。基于规则的风险评估方法受到分析师的青睐。这种方法由于整合了领域专业知识,使其在样本数据稀缺的情况下表现出色,同时其模型易于理解,有助于机构进行后续决策。然而,考虑到数据量大、数据维度高、信息不对称、数据可靠性等问题,基于规则的法律风险评估模型在实践中面临一系列挑战。

3、首先,由于评估模型与分析任务密切相关,分析师需要努力从这些样本的众多数据维度中挖掘共同特征,以分析可能导致风险的关键因素。在数据量庞大且数据维度高的情况下,分析样例的共同特征以及样本与整体数据的差异是一项耗时且复杂的任务,要求分析师投入大量时间和精力。此外,数据的可靠性和透明度也可能存在问题,这使得关键因素的筛选和规则模型的构建变得更加困难,这一过程依赖于分析师的领域知识和分析经验,自动化的数据建模方法往往难以完全代替。

4、其次,鉴于分析师最终的目标是促使决策者进行有根据的决策制定,进一步的需求体现在分析师期望将规则模型的定量评估结果转化为更为标准化和便于后续业务人员进行查询、统计、传递以及保存的sql查询语句。这一过程通常需要根据规则模型中所使用的条件和规则,将其有效映射至sql查询语句的条件、过滤和计算中。依赖机器的sql自动生成方法主要专注于根据用户的输入(如自然语言)辅助用户构建合理的sql语句,然而它们往往缺乏针对特定分析任务的数据建模支持,也未允许用户对数据的规律与形式进行深度的探索。


技术实现思路

1、基于上述背景,本专利技术的目的在于提供一种基于交互可视分析的风险企业规则模型构建与查询方法,使得分析师可以通过与可视化系统的交互,基于少量的已知风险的企业名单,调整规则模型,筛选出一批数量合适的潜在风险企业,同时获得表达该筛选过程的sql语句。

2、本专利技术基于如下技术方案实现上述技术目的:

3、一种基于交互可视分析的风险企业规则模型构建与查询方法,包括如下步骤:

4、收集企业相关数据,对每家企业的数据进行预处理,得到标准化数据与准则维度;

5、基于所述准则维度,通过层次分析法,构建预设层次模型;

6、构建层次规则权重自适应调整模块和sql语句生成模块;

7、搭建集成所述准则权重自适应调整模块与sql语句生成模块的可视分析平台,并提供交互接口;

8、将标准化数据导入所述可视分析平台,并输入样例风险企业,对所述预设层次模型进行调整,获得调整后的风险企业层次模型与待查询目标企业集合的sql语句。

9、进一步的,所述的收集企业相关数据,对每家企业的数据进行预处理,得到标准化数据与准则维度包括:

10、通过网络爬虫收集批量感兴趣企业的相关数据;

11、对连续型数据的缺失值进行插值补充,对离散型数据的的缺失值进行补0;

12、涉及文本的数据,对文本进行标记、清理和转换为数值形式;

13、对数据进行标准化,得到标准化数据;

14、挑选需要作为规则模型准则的n个数据维度,获得准则维度。

15、进一步的,所述的构建预设层次模型包括:

16、基于准则维度,构建包含目标层、类别层和准则层的三层预设层次模型结构;

17、确定初始判断矩阵,并进行一致性检验,获取所述三层预设层次模型结构中准则层到目标层的初始化权重,得到预设层次模型;

18、根据初始化权重,对所述标准化数据中的n个数据维度进行加权,计算得到每个企业的初始化企业风险评分。

19、进一步的,所述的构建层次规则权重自适应调整模块包括:

20、将所述准则层的所有准则视为一个序列,按照其初始权重进行排序形成初始准则序列;

21、构建初始层次分析法规则模型,对所述初始准则序列进行重排序得到新的准则序列;

22、根据新的准则序列中准则的顺序,进行两两比较,计算准则之间的相对重要性比:

23、

24、根据准则两两之间的重要性比,得到一个比较矩阵;

25、使用一致性比率对所述比较矩阵进行一致性检验,如果比较矩阵通过一致性检验,则将比较矩阵的每一列归一化,将归一化后的每一列的平均值作为初始层次分析法规则模型新的权重,构成层次规则权重自适应调整模块。

26、进一步的,所述的sql语句生成模块用于:

27、对标准化数据每个维度的分布进行离散化;

28、接收待查询的目标企业集合,设定目标函数;

29、求解目标函数,输出与待查询的目标企业集合相匹配的sql语句。

30、进一步的,所述的对标准化数据每个维度的分布进行离散化包括:

31、设定划分份数为m,判断数据分布是否为离散分布并且取值个数是否小于m,如果分布是离散分布并且取值个数小于m则不进行离散化,否则进行离散化;

32、判断0值的概率是否超过50%,如果超过,0值单独作为一个区间,然后剩下的数据根据取值的大小分为相等数量的m份,每一份的数值区间为数据分布离散化的结果;

33、离散化后的数据每个维度获得m个基本查询筛选条件,所述基本查询条件经过布尔运算,形成复合查询筛选条件。

34、进一步的,所述的接收待查询的目标企业集合,设定目标函数包括:

35、接收待查询的目标企业集合,记为no;

36、基于杰卡德系数,设定目标函数l为:

37、

38、其中,o表示与待查询的目标企业集合的sql语句的查询条件,表示o的近似,通过最小化得到;表示表示通过构成的sql语句所查询到的企业集合。

39、进一步的,所述的求解目标函数,输出与待查询的目标企业集合相匹配的sql语句包括:

40、将所述基本查询筛选条件存入查询条件列表,初始化最小目标函数值为正无穷;

41、对查询条件列表中的查询筛选条件通过与、或、差逻辑运算进行两两组合,得到新的复合查询筛选条件;

42、根据新的复合查询筛选条件,在数据库中查找到对应的企业集合,结合目标企业集合,计算目标函数值,并更新目标函数值;

43、将本次迭代中目标函数值最小的前三个复合查询筛选条件添加到查询条件列表中;

44、重复上述步骤,直到最小目标函数值达到预设阈值,得到最优的目标企业集合的筛选条件,基于本文档来自技高网...

【技术保护点】

1.一种基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的收集企业相关数据,对每家企业的数据进行预处理,得到标准化数据与准则维度包括:

3.根据权利要求2所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的构建预设层次模型包括:

4.根据权利要求3所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的构建层次规则权重自适应调整模块包括:

5.根据权利要求4所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的SQL语句生成模块用于:

6.根据权利要求5所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的对标准化数据每个维度的分布进行离散化包括:

7.根据权利要求6所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的接收待查询的目标企业集合,设定目标函数包括:

8.根据权利要求7所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的求解目标函数,输出与待查询的目标企业集合相匹配的SQL语句包括:

9.根据权利要求1-8任一项所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的搭建集成所述准则权重自适应调整模块与SQL语句生成模块的可视分析平台,并提供交互接口包括:

10.根据权利要求9所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的绘制企业全局可视化视图包括:

11.根据权利要求10所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的绘制层次分析法规则视图包括:

12.根据权利要求11所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的绘制SQL查询条件视图包括:

13.根据权利要求12所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的将标准化数据导入所述可视分析平台,输入样例风险企业,获得调整后的风险企业层次模型与待查询目标企业集合的SQL语句包括:

...

【技术特征摘要】

1.一种基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的收集企业相关数据,对每家企业的数据进行预处理,得到标准化数据与准则维度包括:

3.根据权利要求2所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的构建预设层次模型包括:

4.根据权利要求3所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的构建层次规则权重自适应调整模块包括:

5.根据权利要求4所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的sql语句生成模块用于:

6.根据权利要求5所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的对标准化数据每个维度的分布进行离散化包括:

7.根据权利要求6所述的基于交互可视分析的风险企业规则模型构建与查询方法,其特征在于,所述的接收待查询的目标企业集合,设定目标函数包括:

8.根据权利...

【专利技术属性】
技术研发人员:吴泓嘉张宏鑫
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1