基于强化学习的特征提取方法、装置和计算机设备制造方法及图纸

技术编号:23344939 阅读:33 留言:0更新日期:2020-02-15 04:24
本申请涉及一种基于强化学习的特征提取方法、装置和计算机设备,所述方法包括:获取学习对象的特征提取代码;所述特征提取代码根据人工编写确定;根据所述特征提取代码,获取所述学习对象的状态特征;采用所述状态特征训练基于强化学习的深度网络结构;获取训练后的深度网络结构的最优网络结构和最优权重参数;根据所述最优网络结构和所述最优权重参数,生成最优特征提取策略;所述最优特征提取策略用于提取保险业务用户的画像特征,以便根据所述画像特征解析所述保险业务用户的投保需求。采用本方法,设置特征提取代码应用于模型训练,可提高特征提取效率,即以建模效果作为学习奖励激发计算机不断优化学习策略,以学习到新的特征提取方式。

Feature extraction method, device and computer equipment based on Reinforcement Learning

【技术实现步骤摘要】
基于强化学习的特征提取方法、装置和计算机设备
本申请涉及计算机
,特别是涉及一种基于强化学习的特征提取方法、装置、计算机可读存储介质和计算机设备。
技术介绍
强化学习又称为试错学习,是一种让智能体(agent)在学习对象的环境中不断交互,并根据环境的反馈激励(reward)进行学习的一种机器学习算法,该学习算法不基于任何先验知识,可以完全自主学习。根据学习对象的不同,可以有不同的智能体,例如学习对象为保险业务时,智能体可以是保险业务中的参保用户等。传统的强化学习例如DeepQNetwork(DQN)在训练自身的神经网络模型时,完全根据机器通过自主学习得到的数据作为训练数据,并未针对不同场景设置训练模型所用特征的最优提取路径,而是采用人工提取方式提取特征,不仅费时费力,还导致模型训练效果不佳。
技术实现思路
基于此,有必要针对现有技术中模型训练所用特征提取效率低的技术问题,提供一种基于强化学习的特征提取方法、装置、计算机可读存储介质和计算机设备。一方面,本专利技术实施例提供一种基于强化学习的特征提取方法,本文档来自技高网...

【技术保护点】
1.一种基于强化学习的特征提取方法,其特征在于,包括如下步骤:/n获取学习对象的特征提取代码;所述特征提取代码根据人工编写确定;/n根据所述特征提取代码,获取所述学习对象的状态特征;/n采用所述状态特征训练基于强化学习的深度网络结构;/n获取训练后的深度网络结构的最优网络结构和最优权重参数;/n根据所述最优网络结构和所述最优权重参数,生成最优特征提取策略;所述最优特征提取策略用于提取保险业务用户的画像特征,以便根据所述画像特征解析所述保险业务用户的投保需求。/n

【技术特征摘要】
1.一种基于强化学习的特征提取方法,其特征在于,包括如下步骤:
获取学习对象的特征提取代码;所述特征提取代码根据人工编写确定;
根据所述特征提取代码,获取所述学习对象的状态特征;
采用所述状态特征训练基于强化学习的深度网络结构;
获取训练后的深度网络结构的最优网络结构和最优权重参数;
根据所述最优网络结构和所述最优权重参数,生成最优特征提取策略;所述最优特征提取策略用于提取保险业务用户的画像特征,以便根据所述画像特征解析所述保险业务用户的投保需求。


2.根据权利要求1所述的方法,其特征在于,所述采用所述状态特征训练基于强化学习的深度网络结构,包括:
通过强化学习收益评估函数,采用所述状态特征训练所述深度网络结构。


3.根据权利要求2所述的方法,其特征在于,所述通过强化学习收益评估函数,采用所述状态特征训练所述深度网络结构,包括:
通过所述强化学习收益评估函数,确定所述状态特征对应的收益优化策略;
根据所述收益优化策略,更新所述特征提取代码;
根据更新后的特征提取代码更新所述状态特征,得到更新后的状态特征;
根据更新后的状态特征,训练所述深度网络结构。


4.根据权利要求3所述的方法,其特征在于,所述根据更新后的状态特征,训练所述深度网络结构,包括:
根据更新后的状态特征,计算所述深度网络结构的真实收益,以及,获取历史预估收益;所述历史预估收益为所述深度网络结构在训练前的预估收益;
将所述历史预估收益与所述真实收益进行比较,确定权重参数调整策略;
根据所述权重参数调整策略,对所述深度网络结构的权重参数进行调整;
按照预设的权重调整次数重复执行上述步骤,直至训练所述深度网络结构得到所述最优网络结构及其对应的最优权重参数。


5.根据权利要求4所述的方法,其特征在于,所述根据所述权重参数调整策略,对所述深度网络结构的权重参数进行调整,包括:...

【专利技术属性】
技术研发人员:陈尧
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1