【技术实现步骤摘要】
本专利技术涉及信息,更具体地说,它涉及一种基于深度学习的用户信息概率抽检系统和方法。
技术介绍
1、在当今数字化时代,用户信息呈爆炸式增长且来源广泛、格式多样、质量参差不齐。传统的用户信息抽检方法往往依赖于固定的规则或简单的统计模型,难以应对信息的高度复杂性和动态变化性。现有抽检技术存在模型构建复杂、对先验知识依赖强、缺乏自助优化能力、在处理大规模、非线性数据关系时灵活性欠佳等局限,例如基于贝叶斯网络的抽检方案,其模型结构与参数设定需大量先验经验且难以灵活调整以适应新的数据模式与业务变化,尽管贝叶斯网络具有一定抽检优化效果,但在复杂多变的用户信息环境中存在适应性差、精准度不足等问题。
2、因此有必要对于现有的用户信息抽检技术进行升级和优化。
技术实现思路
1、本专利技术的目的是提供一种基于深度学习的用户信息概率抽检系统和方法,能够自主学习并动态调整抽检策略,能够依据奖励反馈机制不断优化自身的决策策略,能够更好地适应复杂多变的实际场景,及时捕捉到新出现的风险因素或信息重要性变化,
...【技术保护点】
1.一种基于深度学习的用户信息概率抽检系统,其特征是:包括:
2.根据权利要求1所述的一种基于深度学习的用户信息概率抽检系统,其特征是:所述深度学习模型获取到所述用户信息抽检环境模型发出的奖励特征和下一个状态特征时,以状态-动作-奖励-下一个状态的四元组形式将数据存储在经验回放缓冲区中,并从经验回放缓冲区中随机采样一批数据,利用目标网络和当前网络计算目标值和预测值,通过最小化损失函数来更新当前模型的参数,直到模型收敛或达到预设的训练步数。
3.根据权利要求1所述的一种基于深度学习的用户信息概率抽检系统,其特征是:所述奖励特征为奖励函数根据模拟抽
...【技术特征摘要】
1.一种基于深度学习的用户信息概率抽检系统,其特征是:包括:
2.根据权利要求1所述的一种基于深度学习的用户信息概率抽检系统,其特征是:所述深度学习模型获取到所述用户信息抽检环境模型发出的奖励特征和下一个状态特征时,以状态-动作-奖励-下一个状态的四元组形式将数据存储在经验回放缓冲区中,并从经验回放缓冲区中随机采样一批数据,利用目标网络和当前网络计算目标值和预测值,通过最小化损失函数来更新当前模型的参数,直到模型收敛或达到预设的训练步数。
3.根据权利要求1所述的一种基于深度学习的用户信息概率抽检系统,其特征是:所述奖励特征为奖励函数根据模拟抽检结果,对于所述深度优化学习模型进行正向或负向的奖励反馈。
4.根据权利要求3所述的一种基于深度学习的用户信息概率抽检系统,其特征是:所述奖励函数在所述深度优化学习模型准确识别出高风险且重要性高的用户信息并进行抽检时,给予第一正向奖励;若漏检此类关键信息或对低风险、...
【专利技术属性】
技术研发人员:丁建新,胡磊,陈磊,
申请(专利权)人:江苏苏商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。