基于机器学习的样本券检测方法及装置制造方法及图纸

技术编号：38381390 阅读：14 留言：0更新日期：2023-08-05 17:39

本发明专利技术提供一种基于机器学习的样本券检测方法及装置，所述方法包括：获取海量的待检测样本券数据；基于预设筛选条件对所述待检测样本券数据进行筛选，以获取目标样本券数据；基于预设标准化规则将所述目标样本券数据转换为标准样本券数据；将所述标准样本券数据输入预存的机器学习模型，以输出目标检测结果；本发明专利技术所述方法能够实现样本券数据的自动化清洗过程，提升了债券数据的筛选效率和准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
基于机器学习的样本券检测方法及装置

[0001]本专利技术属于数据分析
，尤其涉及一种基于机器学习的样本券检测方法及装置。

技术介绍

[0002]为了大力开展智能投研业务，为投研技术人员提供技术支持，需要对债券收益率进行曲线拟合和预测。
[0003]债券可分为利率债和信用债，由于信用债的发行主体不一，个券的成交量以及收益率天差地别，且每日都有上万条信用债估值和交易数据产生，而这些数据是无法直接作为样本券数据进行收益率曲线拟合预测，这就需要对海量的样本券数据进行筛选。但是在现有技术中，对于样本券数据的筛选主要依赖投研人员的市场经验，需要人为设定阈值来梳理出干净的样本券数据，工作量较大，导致异常数据清洗的效率较低，且筛选准确性较差。
[0004]因此，如何实现信用债券数据的自动化清洗，以提升债券数据的筛选效率和准确性是业界亟需解决的重要课题。

技术实现思路

[0005]本专利技术提供的一种基于机器学习的样本券检测方法及装置，用以解决现有技术在进行异常债券数据清洗时因高度依赖投研人员的市场经验而需要多次设置阈值，导致债券数据清洗过程较为繁杂的缺陷，提升了异常债券数据的清洗效率。
[0006]本专利技术提供一种基于机器学习的样本券检测方法，所述方法包括：
[0007]获取海量的待检测样本券数据；基于预设筛选条件对所述待检测样本券数据进行筛选，以获取目标样本券数据；基于预设标准化规则将所述目标样本券数据转换为标准样本券数据；将所述标准样本券数据输入预存的机器学习模型，以输出...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的样本券检测方法，其特征在于，包括：获取海量的待检测样本券数据；基于预设筛选条件对所述待检测样本券数据进行筛选，以获取目标样本券数据；基于预设标准化规则将所述目标样本券数据转换为标准样本券数据；将所述标准样本券数据输入预存的机器学习模型，以输出目标检测结果。2.根据权利要求1所述的基于机器学习的样本券检测方法，其特征在于，基于预设筛选条件对所述待检测样本券数据进行筛选，以获取目标样本券数据，具体包括：判定所述样本券数据的余额值大于零，则将所述样本券数据作为目标样本券数据进行保留；和/或，判定所述样本券数据不属于浮动利率债，则将所述样本券数据作为目标样本券数据进行保留；和/或，判定所述样本券数据的待偿期小于或等于五年，则将所述样本券数据作为目标样本券数据进行保留。3.根据权利要求1所述的基于机器学习的样本券检测方法，其特征在于，基于预设标准化规则将所述目标样本券数据转换为标准样本券数据，具体包括：判定所述目标样本券数据为非标准样本券数据，则将所述非标准样本券数据进行虚拟量化处理，以获取虚拟变量；基于所述虚拟变量和未量化处理的目标样本券数据得到所述标准样本券数据。4.根据权利要求1所述的基于机器学习的样本券检测方法，其特征在于，将所述标准样本券数据输入预存的机器学习模型，以输出目标检测结果，具体包括：将所述标准样本券数据输入所述机器学习模型进行分类以获取分类结果；剔除所述分类结果中的异常样本券数据，并保留所述分类结果中剩余样本券数据。5.根据权利要求2所述的基于机器学习的样本券检测方法，其特征在于，基于预设筛...

【专利技术属性】
技术研发人员：方晴，
申请(专利权)人：中银金融科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人