An overall operation method of enterprise risk rule engine based on semi-structured text data includes the following steps: S1, defining the calculation method between data types; S2, defining the operation system of the underlying quantization module; S3, formulating the field of index dependence according to the index demand, and concatenating the field through the operation system defined by S2 to get the index that meets the user's business needs; S4, number. According to the index set by the index configuration module, the access module reads the data of the database and transmits it to the data filtering layer; S5, the data access module reads the data of the external database and filters it through the M condition filters; S6, the filtered data gets the uniform data format through the data standardization module and transmits it to the index operation module; S7, the index operation. The module calculates the data according to the rules of index configuration module configuration. The invention can enable the rule engine to obtain quantitative indicators in semi-structured text data.
【技术实现步骤摘要】
一种基于半结构化文本数据的企业风险规则引擎运算方法
本专利技术涉及计算机科学软件信息
,特别是涉及一种基于半结构化文本数据的企业风险规则引擎运算方法。
技术介绍
规则引擎近年来被广泛应用于金融及反欺诈领域,帮助监控和发现目标客户群体中的异常、风险、商机等。大多规则引擎在整体设计上大致可划分为两个大块,其一为规则体系的构建,其二为数据流的运算体系构建。目前,业内对于被规则引擎使用的数据而言,主要包含了用户行为(如登录、注册、浏览、收藏、消费等)数据、企业财务数据等;这类数据大多有着结构化、可度量的特性。例如用户行为数据就离不开次数、频率、价格、时间等概念。然而在面对处理互联网上爬取的大量非结构化、半结构化数据时,传统的规则引擎面临难以量化文本信息的挑战。传统的规则引擎,其底层存储通常是结构化的数值型数据表。认知上,某条规则的触发,是由计算的指标数值与阈值比较的结果决定的。我们把这一类运算划分为4个角色:左变量、运算符、右变量、结果值。通常这类数值与数值之间的运算体系,可能涉及到的变量类型包括整形、浮点型、布尔值等。字段之间的运算方式则包括四则运算、函数运算、逻 ...
【技术保护点】
1.一种基于半结构化文本数据的企业风险规则引擎运算方法,其特征在于,所述企业风险规则引擎包括数据融合层、数据筛选层、数据标准化层以及指标运算层,所述指标运算层包括指标配置模块和指标运算模块,所述数据融合层包括数据接入模块,所述数据筛选层包括M个条件筛选器,M为不小于1的正整数,所述数据标准化层包括数据标准化模块;所述企业风险规则引擎运算方法包括以下步骤:S1、构建底层量化模块:枚举企业基础信息与文本抽取信息的数据类型组合,定义各数据类型之间的计算方式,所述企业基础信息与文本抽取信息的数据类型为底层量化模块;S2、根据底层量化模块的类型,定义底层量化模块的运算体系;S3、根据 ...
【技术特征摘要】
1.一种基于半结构化文本数据的企业风险规则引擎运算方法,其特征在于,所述企业风险规则引擎包括数据融合层、数据筛选层、数据标准化层以及指标运算层,所述指标运算层包括指标配置模块和指标运算模块,所述数据融合层包括数据接入模块,所述数据筛选层包括M个条件筛选器,M为不小于1的正整数,所述数据标准化层包括数据标准化模块;所述企业风险规则引擎运算方法包括以下步骤:S1、构建底层量化模块:枚举企业基础信息与文本抽取信息的数据类型组合,定义各数据类型之间的计算方式,所述企业基础信息与文本抽取信息的数据类型为底层量化模块;S2、根据底层量化模块的类型,定义底层量化模块的运算体系;S3、根据指标需求制定指标依赖的字段,并通过S2定义的运算体系将字段串接得到符合用户业务需求的指标,所述用户业务需求的指标通过逻辑运算得到指标组,所述指标组通过逻辑运算得到规则;S4、数据接入模块根据指标配置模块设置的指标读取外部数据库的数据并传输至数据筛选层;S5、所述数据接入模块读取外部数据库的数据通过所述M个条件筛选器进行筛选;S6、筛选后的数据通过数据标准化模块得到格式统一的数据并传输至指标运算模块;S7、指标运算模块根据指标配置模块配置的规则对所述格式统一后的数据进行运算,得到数据量化指标。2.根据权利要求1所述的一种基于半结构化文本数据的企业风险规则引擎运算方法,其特征在于,所述步骤S4的具体步骤如下:S4.1、在所述指标配置模块中定义指标依赖的字段及字段类...
【专利技术属性】
技术研发人员:刘德彬,陈玮,孙世通,严开,
申请(专利权)人:重庆誉存大数据科技有限公司,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。