一种半结构化文本数据的规则引擎系统及前置接入方法技术方案

技术编号：21034295 阅读：27 留言：0更新日期：2019-05-04 05:26

一种半结构化文本数据的规则引擎系统及前置接入方法，包括数据融合层、数据筛选层、数据标准化层以及指标运算层；所述数据融合层从数据库读取的数据通过所述数据筛选层和数据标准化层流入所述指标运算层进行执行。本系统及前置接入方法可以根据不同的场景设置不同的指标，并根据指标设置相关字段集合，读取不同数据库的信息，兼容精度、类型不同的字段。

A Semi-structured Text Data Rule Engine System and Pre-access Method

全部详细技术资料下载

【技术实现步骤摘要】
一种半结构化文本数据的规则引擎系统及前置接入方法
本专利技术涉及计算机科学软件信息
，特别是涉及一种半结构化文本数据的规则引擎系统及前置接入方法。
技术介绍
规则引擎近年来被广泛应用于泛金融及反欺诈领域，帮助监控和发现目标客户群体中的异常、风险、商机等。在数据层面，支撑传统规则引擎的，大多为用户行为(如登录、注册、浏览、收藏、消费等)数据、企业财务数据等，这类数据大多有着结构化、可度量的特性。例如用户行为数据就离不开次数、频率、价格、时间等概念。然而在面对处理互联网上爬取的大量非结构化、半结构化数据时，传统的规则引擎面临难以量化文本信息的挑战。因为传统的规则引擎，其底层存储通常是结构化的数据表，指标或规则的配置则依赖于这些字段。然而，在非结构化或者半结构化数据领域中，数据存在多源、多类型、异构特质，由此给传统规则引擎带来的问题有以下2点：1.不同来源的字段存在精度不同、字段类型不兼容的情况：比如企业注册资本字段，A数据源采用万元做单位、取小数点后4位；B数据源用元做单位，取小数点后2位；2.基于JSON格式的数据有着较复杂的数据结构，使得与关系型数据库数据的字段联合使用时，存在格式一致性转换的难点。
技术实现思路
针对上述现有技术的不足，本专利技术提供了一种半结构化文本数据的规则引擎系统及前置接入方法，对多来源数据接入后，进行多元易购。为了解决上述技术问题，本专利技术采用了如下的技术方案：一种半结构化文本数据的规则引擎系统，包括数据融合层、数据筛选层、数据标准化层以及指标运算层；所述指标运算层包括指标配置模块和指标运算模块，所述数据融合层包括数据接入模块...

【技术保护点】
1.一种半结构化文本数据的规则引擎系统，其特征在于，包括数据融合层、数据筛选层、数据标准化层以及指标运算层；所述指标运算层包括指标配置模块和指标运算模块，所述数据融合层包括数据接入模块；所述指标配置模块用于定义指标所需要引用的相关字段对象，包括指标的条件及规则的设定；所述数据接入模块与外部数据库地址连接，用以认证外部数据库的host,port,database信息，所述数据接入模块根据指标配置模块设置的相关字段对象读取外部数据库的数据；所述数据筛选层包括M个基于自选条件的数据筛选器，用于对数据融合层读取的数据进行筛选，通过设置N个条件的“与/或”逻辑来配置数据筛选器；其中，M、N均为不小于1的正整数；所述数据标准化层包括数据标准化模块，用于将筛选后的数据的数据类型标准化为指标运算层所需要的类型；所述指标运算层的指标运算模块用于规则引擎执行规则，将标准化后的数据根据指标配置模块设定的规则进行运算。

【技术特征摘要】
1.一种半结构化文本数据的规则引擎系统，其特征在于，包括数据融合层、数据筛选层、数据标准化层以及指标运算层；所述指标运算层包括指标配置模块和指标运算模块，所述数据融合层包括数据接入模块；所述指标配置模块用于定义指标所需要引用的相关字段对象，包括指标的条件及规则的设定；所述数据接入模块与外部数据库地址连接，用以认证外部数据库的host,port,database信息，所述数据接入模块根据指标配置模块设置的相关字段对象读取外部数据库的数据；所述数据筛选层包括M个基于自选条件的数据筛选器，用于对数据融合层读取的数据进行筛选，通过设置N个条件的“与/或”逻辑来配置数据筛选器；其中，M、N均为不小于1的正整数；所述数据标准化层包括数据标准化模块，用于将筛选后的数据的数据类型标准化为指标运算层所需要的类型；所述指标运算层的指标运算模块用于规则引擎执行规则，将标准化后的数据根据指标配置模块设定的规则进行运算。2.根据权利要求1所述的一种半结构化文本数据的规则引擎系统，其特征在于，所述数据接入模块采用与数据库直连的方式与外部数据库地址连接。3.根据权利要求1或2所述的一种半结构化文本数据的规则引擎系统，其特征在于，所述外部数据库的类型包括关系型数据库、非关系型数据库、Elasticsearch、数据仓库、文本文件。4.根据权利要求1所述的一种半结构化文本数据的规则引擎...

【专利技术属性】
技术研发人员：刘德彬，陈玮，孙世通，严开，
申请(专利权)人：重庆誉存大数据科技有限公司，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人