一种基于深度强化学习的数据产品动态定价方法及系统技术方案

技术编号:43625175 阅读:23 留言:0更新日期:2024-12-11 15:04
本发明专利技术涉及基于深度强化学习的数据产品动态定价方法及系统,属数据产品动态定价、数据交易平台和计算机领域。方法包括:初始化定价环境;构建基于深度强化学习的数据产品动态定价模型;训练数据产品动态定价模型,优化参数并更新模型的权重;利用经过训练的模型对数据产品进行动态定价;四个步骤通过环境处理模块、模型构建模块、训练模块、定价输出模块构成动态定价系统;本发明专利技术解决了深度强化学习Deep Q‑Network算法中“探索”与“利用”平衡和经验样本利用效率低的问题,提升数据产品动态定价性能,间接辅助实现数据产品累积收益的最大化。

【技术实现步骤摘要】

本专利技术涉及一种基于深度强化学习的数据产品动态定价方法及系统,属于数据产品动态定价、数据交易平台和计算机。


技术介绍

1、高效的数据交易市场是消除数据孤岛、促进数据交易流通的重要途径。数据交易平台作为数据要素市场的一种形式,是衔接数据供需方、提升数据要素市场化配置效率的核心载体,为数据买卖双方提供了信任与支持。相对于传统商品,数据产品具有时效性、双向价值不确定性、边际成本趋于零等特性,传统动态定价难以满足数据交易市场发展。

2、现有数据交易平台对数据产品定价以固定定价和协议定价为主,固定定价管理成本较低,但缺乏灵活性、市场变化适应性差;协议定价由第三方数据交易平台撮合、买卖双方协商,经过反复议价报价后达成一致,能够灵活调整、实现更好的个性化服务,但复杂度和管理成本高。动态定价可根据不断变化的外部环境对价格进行动态调整,实现数据产品卖方的最大化累积收益。强化学习以实现累积奖励最大化为目标,从观察中学习并用于解决马尔可夫决策过程,是目前解决动态定价最广泛的技术之一,深度强化学习将融合深度学习的感知能力和强化学习的决策能力,使其能够扩展到具有高维状本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习的数据产品动态定价方法,其特征在于:所述方法包括:

2.根据权利要求1所述的基于深度强化学习的数据产品动态定价方法及系统,其特征在于:所述步骤1中,初始化定价环境包括:

3.根据权利要求1所述的基于深度强化学习的数据产品动态定价方法及系统,其特征在于:所述步骤2中,具体步骤如下:

4.根据权利要求3所述的基于深度强化学习的数据产品动态定价方法及系统,其特征在于:所述步骤2.1中,探索策略选择定价模块包括:

5.根据权利要求3所述的基于深度强化学习的数据产品动态定价方法及系统,其特征在于:所述步骤2.2中,经验池维护模...

【技术特征摘要】

1.一种基于深度强化学习的数据产品动态定价方法,其特征在于:所述方法包括:

2.根据权利要求1所述的基于深度强化学习的数据产品动态定价方法及系统,其特征在于:所述步骤1中,初始化定价环境包括:

3.根据权利要求1所述的基于深度强化学习的数据产品动态定价方法及系统,其特征在于:所述步骤2中,具体步骤如下:

4.根据权利要求3所述的基于深度强化学习的数据产品动态定价方法及系统,其特征在于:所述步骤2.1中,探索策略选择定价模块包括:

5.根据权利要求3所述的基于深度强化学习的数据产品动态定价方法及系统,其特征在于:所述步骤2.2中,经验池维护模块包括:

6.根据权利要求1所述的基于深度强化学习的数据产品动态定价方法及系统,其特征在于:所述步骤2.3中,评估网络模块包括:

7.根据权利要求1所述的基于...

【专利技术属性】
技术研发人员:沈俊鑫王雅诗刘平清
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1