一种多层、多数据类型动作空间的商业智能决策分析方法技术

技术编号:41904516 阅读:19 留言:0更新日期:2024-07-05 14:10
本发明专利技术属于强化学习商业智能决策应用技术领域,尤其涉及一种多层、多数据类型动作空间的商业智能决策分析方法。本发明专利技术在满足商业资金限定的前提下,随机选取商业决策动作,后依据商业决策范式给出评判,以此来获取信息充足的状态数据。本发明专利技术解决了目前模型训练数据的局限性,训练强化学习模型的动作空间相对单一,导致模型的鲁棒性不足等问题。通过多层级的决策动作的选取,以此来模拟实际商业场景中的复杂状态,进而获取多样化、多表征状态的数据,提升模型的鲁棒性,使得商业智能决策分析更为贴合实际。

【技术实现步骤摘要】

本专利技术属于强化学习商业智能决策应用,尤其涉及一种多层、多数据类型动作空间的商业智能决策分析方法


技术介绍

1、在当今复杂多变的社会环境中,强化学习被广泛应用于各种应用场景,成为实现动态决策规划的一种高效方式。强化学习主体在特定环境中的行动,以达到最大化累积奖励的目标,作为一种基于智能体与环境交互的学习范式,已经在诸多领域展现出巨大的潜力,并在智能系统领域也取得了显著的进展,这主要归功于计算能力的提高和深度学习技术的广泛应用。

2、然而,在商业智能决策中应用强化学习进行模型训练时,通常需要大量的状态数据来训练模型,以便模型能够准确地学习环境的特性。实际上,用于模型训练的真实状态数据通常来源于执行固定决策的真实场景。这些数据用于描述状态的信息相对有限,导致了强化学习模型训练样本的不足。因此,模型的训练效果受到限制,动态决策规划的结果可能不够准确。同时,目前训练强化学习模型的动作空间相对单一,而实际场景中是复杂多变,这也导致模型的鲁棒性不足。


技术实现思路

1、本专利技术针对商业智能决策分析所存在本文档来自技高网...

【技术保护点】

1.一种多层、多数据类型动作空间的商业智能决策分析方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种多层、多数据类型动作空间的商业智能决策分析方法,其特征在于,所述S1步骤的具体操作方法为:

3.根据权利要求1所述的一种多层、多数据类型动作空间的商业智能决策分析方法,其特征在于,所述S2步骤的具体操作为:

4.根据权利要求1所述的一种多层、多数据类型动作空间的商业智能决策分析方法,其特征在于,所述S3步骤的具体操作为:

5.根据权利要求1所述的一种多层、多数据类型动作空间的商业智能决策分析方法,其特征在于,所述S4步骤的具体操作...

【技术特征摘要】

1.一种多层、多数据类型动作空间的商业智能决策分析方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种多层、多数据类型动作空间的商业智能决策分析方法,其特征在于,所述s1步骤的具体操作方法为:

3.根据权利要求1所述的一种多层、多数据类型动作空间的商业智能决策分析方...

【专利技术属性】
技术研发人员:董文轩刘永红李晓芹李光辉
申请(专利权)人:山东蟠龙信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1