【技术实现步骤摘要】
基于参数配置的估值表自动化解析校验的数据转换方法及系统
[0001]本专利技术涉及数据处理
,具体地,涉及基于参数配置的估值表自动化解析校验的数据转换方法及系统
。
技术介绍
[0002]现有技术已公开了一种基于
NLP
的资管产品估值表智能统一化方法,通过对原始估值表数据进行预处理,提取底层会计科目代码的全文本信息作为
NLP
模型的输入,训练出一个
bert
分类模型,从而建立了原始估值表会计科目体系与标准会计科目体系的对应关系,用于完成估值表的清洗
。
该技术方案虽然能够支持估值表的数据解析,但存在以下三个缺陷:缺陷一:需要大量的训练数据来构建模型
。
在数据样本小的情况下,构建的
NLP
模型是存在瑕疵的
。
缺陷二:存在原始估值表业务数据处理遗漏项
。
方法仅公布了管理人
、
会计科目代码
、
会计科目名称的解析和分类方法,未对估值表中的成本原币
、
成本本币
、
市值原币
、
市值本币等其他原始业务数据解析进行完整说明
。
缺陷三:清洗后未对数据进行业务校验
。
未校验的数据可能存在数据冗余或数据丢失,数据的完整性和准确性没有保障
。
[0003]专利文献
CN107274291B(
申请号:
20171047334 ...
【技术保护点】
【技术特征摘要】
1.
一种基于参数配置的估值表自动化解析校验的数据转换方法,其特征在于,包括:步骤
S1
:设置资产负债参数表和合计参数表;步骤
S2
:对估值表进行验证,包括:文件名称验证
、
通用解析模式验证以及兼容解析模式验证;步骤
S3
:对估值表进行解析得到资产负债参数和合计参数,并分别对资产负债参数和合计参数进行预处理;步骤
S4
:基于预处理后的资产负债参数和合计参数对估值表中的资产负债数据和合计数据分别进行解析;步骤
S5
:对估值表解析数据进行校验,实现了资产管理行业的估值表数据的标准化数据转换
。2.
根据权利要求1所述的基于参数配置的估值表自动化解析校验的数据转换方法,其特征在于,所述步骤
S1
采用:步骤
S1.1
:对全市场的管理人的估值表业务进行提取,合并相似或相近的业务,抽象出估值表资产负债业务表;步骤
S1.2
:定义面向资产负债的参数名称
、
参数类型
、
参数业务以及参数值;步骤
S1.3
:基于估值表资产负债业务表以及定义的面向资产负债的参数名称
、
参数类型
、
参数业务以及参数值设置资产负债参数表和合计参数表
。3.
根据权利要求1所述的基于参数配置的估值表自动化解析校验的数据转换方法,其特征在于,所述步骤
S2
采用:步骤
S2.1
:解析估值表文件名字符串,提取估值表名称以及估值日期;步骤
S2.2
:使用
POI
工具集,判断估值表文件是否为通用模式;如果返回值为
true
,则通过通用模式解析;如果返回值为
false
,则通用模式解析异常,则进入兼容模式判断;使用
JXL
工具集,判断估值表文件是否为兼容模式;如果返回值为
true
,则通过兼容模式解析;如果返回值为
false
,则兼容模式解析异常
。4.
根据权利要求1所述的基于参数配置的估值表自动化解析校验的数据转换方法,其特征在于,所述步骤
S3
采用:步骤
S3.1
:读取资产负债数据基础参数配置,获取资产负债基础业务参数;步骤
S3.2
:读取合计数据基础参数配置,获取合计数据基础业务参数;步骤
S3.3
:判断估值表表头所在行和所在跨列,解析表头数据并保存;步骤
S3.4
:判断估值日期所在行和所在跨列,解析估值日期并保存
。5.
根据权利要求1所述的基于参数配置的估值表自动化解析校验的数据转换方法,其特征在于,所述步骤
S4
采用:步骤
S4.1
:判断估值表资产负债数据解析初始行,对资产负债数据进行解析;步骤
S4.2
:判断估值表合计数据解析初始行,对合计数据进行解析
。6.
根据权利要求1所述的基于参数配置的估值表自动化解析校验的数据转换方法,其特征在于,所述步骤
S5
采用:估值表解析数据校验包括:新增估值增值数据过滤参数
、
新增公允价值变动损益过滤参数
、
新增特殊标签参数
、
判断每条解析记录的数据字典包含关系
、
资产逻辑判断
、
负债逻辑判断
、...
【专利技术属性】
技术研发人员:于磊,赵凤婷,胡凌霄,袁利专,张震,
申请(专利权)人:上海秉玉软件技术服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。