数据分类模型的训练方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39420978 阅读:25 留言:0更新日期:2023-11-19 16:09
本申请实施例属于金融科技领域,涉及一种数据分类模型的训练方法、装置、计算机设备及存储介质,所述方法包括下述步骤:根据预设的数据分类规则对样本数据进行识别分类,得到分类样本数据;对分类样本数据进行预处理及特征提取,将提取到的特征向量输入至预设的学习算法模型中进行模型训练,得到数据分类模型;将测试数据输入至数据分类模型中进行分类,得到分类预测结果;根据分类预测结果获取数据分类模型对应的准确性和鲁棒性,将准确性和鲁棒性与判断标准进行对比;及根据对比结果对数据分类模型进行迭代优化,得到优化分类模型。本申请能够有效对多类型数据进行准确分类,同时使得数据分类的结果不容易受到干扰,提高系统分类的可靠性。类的可靠性。类的可靠性。

【技术实现步骤摘要】
数据分类模型的训练方法、装置、计算机设备及存储介质


[0001]本申请涉及金融科技领域,尤其涉及一种数据分类模型的训练方法、装置、计算机设备及存储介质。

技术介绍

[0002]在大数据时代,软件系统每天都要接收并处理各种各样的数据,为了方便对这些数据进行处理,需要对应进行分类,智能分类系统就是针对这些数据进行分类处理的一种人工智能技术。
[0003]智能分类系统可以实现对大量数据进行自动分类,通过采用预设的分类规则和模型,能够对数据进行筛选、分类,以最终对数据进行有效整理,方便后续进行处理。
[0004]但是,上述的智能分类系统在面对多种类的不同类型数据时,难以进行准确的分类,尤其是当系统中出现多种类型的数据时,不仅需要针对该部分数据重新制定分类规则,而且还容易对其进行错误分类,难以准确将其进行有效区分,导致分类结果不准确。同时,当数据中存在噪声或数据进行了微小的改动时,容易使得分类结果产生偏差,导致分类结果缺乏解释性,降低系统的可靠性,不利于对数据进行有效分类。

技术实现思路

[0005]本申请实施例的目的在于本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据分类模型的训练方法,其特征在于,包括下述步骤:获取样本数据,根据预设的数据分类规则对所述样本数据进行识别分类,得到分类样本数据,其中,所述分类样本数据包括:文本数据、图像数据以及音频数据;对所述文本数据、所述图像数据以及所述音频数据进行预处理,得到标准文本数据、标准图像数据、标准音频数据;对所述标准文本数据、所述标准图像数据、所述标准音频数据进行特征提取,并将提取到的文本特征向量、图像特征向量、音频特征向量输入至预设的学习算法模型中进行模型训练,得到数据分类模型;获取测试数据,将所述测试数据输入至所述数据分类模型中进行分类,得到分类预测结果;根据所述分类预测结果获取所述数据分类模型对应的准确性和鲁棒性,将所述准确性和所述鲁棒性与预设的判断标准进行对比,得到对比结果;及根据所述对比结果对所述数据分类模型进行迭代优化,重新获取所述数据分类模型对应的优化准确性和优化鲁棒性,直至所述优化准确性和所述优化鲁棒性达到预设的判断标准,得到优化分类模型。2.根据权利要求1所述的数据分类模型的训练方法,其特征在于,所述根据预设的数据分类规则对所述样本数据进行识别分类,得到分类样本数据,其中,所述分类样本数据包括:文本数据、图像数据以及音频数据的步骤,具体包括:获取数据分类规则,其中,所述数据分类规则包括:文本识别规则、图像识别规则、音频识别规则;根据所述文本识别规则对所述样本数据进行数据识别,并将识别到的数据标注为所述文本数据;根据所述图像识别规则对所述样本数据进行数据识别,并将识别到的数据标注为所述图像数据;及根据所述音频识别规则对所述样本数据进行数据识别,并将识别到的数据标注为所述音频数据。3.根据权利要求1所述的数据分类模型的训练方法,其特征在于,所述对所述文本数据、所述图像数据以及所述音频数据进行预处理,得到标准文本数据、标准图像数据、标准音频数据的步骤,具体包括:检测所述文本数据、所述图像数据、所述音频数据是否有数据信息缺失;若所述文本数据、所述图像数据、所述音频数据均没有数据信息缺失,则对所述文本数据、所述图像数据、所述音频数据进行数据清洗、噪声去除以及归一化处理,得到所述标准文本数据、所述标准图像数据、所述标准音频数据;及若所述文本数据、所述图像数据、所述音频数据中至少一个有数据信息缺失,则对应删除所述文本数据、所述图像数据、所述音频数据,并检测剩余的文本数据的数量、图像数据的数量、音频数据的数量是否满足预设阈值,若不满足,则对文本数据的数量、图像数据的数量、音频数据的数量进行对应补足,并再次进行检测,直至所述文本数据的数量、所述图像数据的数量、所述音频数据的数量满足所述阈值。4.根据权利要求1所述的数据分类模型的训练方法,其特征在于,所述对所述标准文本
数据、所述标准图像数据、所述标准音频数据进行特征提取,得到对应的文本特征向量、图像特征向量、音频特征向量的步骤,具体包括:获取标准文本数据,根据循环神经网络算法对所述标准文本数据进行特征提取,得到所述文本特征向量;获取标准图像数据,根据卷积神经网络算法对所述标准图像数据进行特征提取,得到所述图像特征向量;及获取标准音频数据,根据卷积循环神经网络算法对所述标准音频数据进行特征提取,得到所述音频特征向量。5.根据权利要求1所述的数据分类模型的训练方法,其特征在于,在...

【专利技术属性】
技术研发人员:刘剑
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1