市场决策系统、方法、电子设备及可读存储介质技术方案

技术编号：34087441 阅读：6 留言：0更新日期：2022-07-11 20:21

本申请提供一种市场决策系统、方法、电子设备及存储介质，属于人工智能领域。市场决策方法包括：市场信息输入步骤，被输入与市场、市场主体、市场主体的利益相关方有关的市场信息，并且被输入初始化的各市场主体的状态；规则知识库构建步骤，根据已知的市场场景，定义市场主体的动作，并对动作及结果进行赋值，根据已有的市场数据调整赋值而构建市场规则；环境参数输入步骤，被输入对市场的环境造成影响的因素和参数；市场策略训练步骤，根据输入的市场信息、调整后的市场规则以及因素和参数，使每个市场主体相互对抗，使用强化学习的方式训练出各主体的最优模型；以及结果记录步骤，记录市场主体的结果及/或路径。记录市场主体的结果及/或路径。记录市场主体的结果及/或路径。

全部详细技术资料下载

【技术实现步骤摘要】
市场决策系统、方法、电子设备及可读存储介质

[0001]本申请实施例涉及人工智能
，具体涉及一种基于人工智能的市场决策系统、市场决策方法、电子设备及存储介质。

技术介绍

[0002]以往，公司在进行市场研究时会考虑竞争分析等各种市场策略，典型的方法是SWOT分析，即基于内外部竞争环境和竞争条件下的态势分析。专家通过调查列举各种主要内部优势、劣势和外部的机会和威胁等，用系统分析的思想，把各种因素相互匹配起来加以分析，从中得出一系列相应的结论。
[0003]近年来，随着人工智能技术的开发和普及，也在考虑将人工智能技术与市场决策分析相结合。例如，在专利文献1(CN111488988A)中，公开了一种基于对抗学习的控制策略模仿学习方法及装置，方法包括：获取人类专家的决策示教数据，并且获取与专家示教决策数据对应的仿真环境；构建控制策略网络，控制策略网络的输入为仿真环境返回的状态，输出为决策动作；使用当前策略网络在仿真环境进行交互，获得当前策略的决策轨迹数据，基于对抗学习的模仿学习方法对专家轨迹数据进行模仿，逐步缩减策略网络决策轨迹数据和专家决策轨迹数据之间的分布差异，以模仿学习得到能够产生专家决策轨迹的策略网络；将通过对抗模仿策略得到的控制策略网络的参数固定保持，以进行实际环境控制任务的应用。该方法结合数据与模型的双重优势，通过对抗学习策略获得鲁棒性更强的控制策略，简单易实现。
[0004]另外，在其他领域中，也考虑使用人工智能技术来应用于策略制定。例如，在专利文献2(CN111437608A)中，提供了...

【技术保护点】

【技术特征摘要】
1.一种市场决策方法，其基于人工智能而实现，其特征在于，包括：市场信息输入步骤，输入与市场、市场主体、市场主体的利益相关方有关的市场信息，并且输入初始化的各市场主体的状态；规则知识库构建步骤，根据已知的市场场景，定义所述市场主体的动作，并对所有的所述动作以及结果进行赋值，之后根据已有的市场数据，对被赋值的所述动作以及结果进行自动识别并调整赋值，从而构建市场规则；环境参数输入步骤，输入对市场的环境造成影响的因素和参数；市场策略训练步骤，根据在所述市场信息输入步骤中输入的信息、在所述规则知识库构建步骤中调整后的所述市场规则、以及在所述环境参数输入步骤中输入的因素和参数，使每个市场主体作为独立对抗主体相互对抗，得到各市场主体进行了各动作后的状态，以契合特定市场目的为评分，使用强化学习的方式训练出各市场主体的最优模型；以及结果记录步骤，将各个市场主体作为对抗主体的一方，记录其中的一方或多方的结果及/或路径。2.根据权利要求1所述的市场决策方法，其特征在于，在所述环境参数输入步骤中，输入的因素和参数包括系统随机输入的一些环境影响的因素和参数。3.根据权利要求1或2所述的市场决策方法，其特征在于，还包括：规则优化步骤，基于所述环境参数和所述市场规则进行优化，根据相互影响调整赋值。4.根据权利要求1或2所述的市场决策方法，其特征在于，还包括：市场策略学习步骤，以特定的所述市场主体的特定结果为评分依据，得到特定动作后的状态，并输出特定主体的最优结果和路径，在所述市场策略学习步骤中，使用监督学习的方式学习专家的决策行为，和专家的动作一致性越高的，评分越高，由此优化市场策略。5.根据权利要求1或2所述的市场决策方法，其特征在于，在对抗中，所述市场主体能够在预定时间内获取其他市场主体的行为和可能结果，并相互学习。6.一种市场决策系统，其基于人工智能而实现，其特征在于，包括：市场信息输入模块，其被输入与市场、市场主体、市场主体的利益相关方有关的市场信息，并且被输入初始化的各市场主体的状态；规则知识库构建模块，其根据已知的市场场景，定义所述市场主体的动作，并对所有的所述动作以及结果进行赋值，之后根据已有的市场数据，对被赋值的所述动作以及结果进行自动识别并调整赋值,从而构建市场规则；环境参数输入模块，其被输入对市场的环境造成影响的因素和参数；市场策略训练模块，其根据被输入所述市场信息输入模块的信息、由所述规则知识库构建模块调整后的所述市场规则、以及被输入所述环境参数输入模块的因素和参数，使每...

【专利技术属性】
技术研发人员：刘阳，颜红燕，刘晓宇，黄志勇，高源，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人