市场决策系统、方法、电子设备及可读存储介质技术方案

技术编号:34087441 阅读:6 留言:0更新日期:2022-07-11 20:21
本申请提供一种市场决策系统、方法、电子设备及存储介质,属于人工智能领域。市场决策方法包括:市场信息输入步骤,被输入与市场、市场主体、市场主体的利益相关方有关的市场信息,并且被输入初始化的各市场主体的状态;规则知识库构建步骤,根据已知的市场场景,定义市场主体的动作,并对动作及结果进行赋值,根据已有的市场数据调整赋值而构建市场规则;环境参数输入步骤,被输入对市场的环境造成影响的因素和参数;市场策略训练步骤,根据输入的市场信息、调整后的市场规则以及因素和参数,使每个市场主体相互对抗,使用强化学习的方式训练出各主体的最优模型;以及结果记录步骤,记录市场主体的结果及/或路径。记录市场主体的结果及/或路径。记录市场主体的结果及/或路径。

【技术实现步骤摘要】
市场决策系统、方法、电子设备及可读存储介质


[0001]本申请实施例涉及人工智能
,具体涉及一种基于人工智能的市场决策系统、市场决策方法、电子设备及存储介质。

技术介绍

[0002]以往,公司在进行市场研究时会考虑竞争分析等各种市场策略,典型的方法是SWOT分析,即基于内外部竞争环境和竞争条件下的态势分析。专家通过调查列举各种主要内部优势、劣势和外部的机会和威胁等,用系统分析的思想,把各种因素相互匹配起来加以分析,从中得出一系列相应的结论。
[0003]近年来,随着人工智能技术的开发和普及,也在考虑将人工智能技术与市场决策分析相结合。例如,在专利文献1(CN111488988A)中,公开了一种基于对抗学习的控制策略模仿学习方法及装置,方法包括:获取人类专家的决策示教数据,并且获取与专家示教决策数据对应的仿真环境;构建控制策略网络,控制策略网络的输入为仿真环境返回的状态,输出为决策动作;使用当前策略网络在仿真环境进行交互,获得当前策略的决策轨迹数据,基于对抗学习的模仿学习方法对专家轨迹数据进行模仿,逐步缩减策略网络决策轨迹数据和专家决策轨迹数据之间的分布差异,以模仿学习得到能够产生专家决策轨迹的策略网络;将通过对抗模仿策略得到的控制策略网络的参数固定保持,以进行实际环境控制任务的应用。该方法结合数据与模型的双重优势,通过对抗学习策略获得鲁棒性更强的控制策略,简单易实现。
[0004]另外,在其他领域中,也考虑使用人工智能技术来应用于策略制定。例如,在专利文献2(CN111437608A)中,提供了一种基于人工智能的游戏对局方法、装置、设备及存储介质;所述方法包括:响应于接收到的加入游戏对局的操作指令,获取在所述游戏对局中所有参与者的游戏对局数据流;通过训练好的神经网络模型对所述游戏对局数据流进行预测操作,得到预测结果,其中,所述训练好的神经网络模型至少包括自注意力编码模块;基于所述预测结果确定目标游戏策略;将所述目标游戏策略发送至服务器。如此,能够提高游戏策略的准确性。
[0005]专利文献
[0006]专利文献1:CN111488988A
[0007]专利文献2:CN111437608A

技术实现思路

[0008]然而,在SWOT分析中,纯粹依靠专家的方式,主观性太强,会有各类的遗漏,且需要人工地大量调查各种数据,耗时耗力。
[0009]在使用了人工智能技术的专利文献1的方法中,虽然解决了耗时耗力的问题,但是,仍然是通过学习专家的方式进行决策,决策的方式和可能性受人类自身的局限,可能失去一些能带来更优结果的策略。
[0010]另外,专利文献2的方法应用于游戏对战领域,游戏中的规则和策略相对固定,游戏的最终结果也很确定。但市场的随机性更强,需要考虑的因素和环境更多,竞争对手也多样化,显然专利文献2的方法无法直接应用于市场决策。
[0011]本申请实施例的目的是提供一种基于人工智能的市场决策系统、市场决策方法、电子设备及存储介质。能够基于真实市场中的竞争主体和宏观、微观环境和各竞争主体的竞争动作、规则,进行多竞争主体的竞争、合作等目的的对抗,覆盖尽可能多的可能性,分析各类好的结果和差的结果及对应的路径。从而提供基于人工智能的市场运营中的辅助决策依据。
[0012]为了解决上述技术问题,本申请是这样实现的:
[0013]依据本专利技术的一个方面,提供一种市场决策系统,其基于人工智能而实现,包括:市场信息输入模块,其被输入与市场、市场主体、市场主体的利益相关方有关的市场信息,并且被输入初始化的各市场主体的状态;规则知识库构建模块,其根据已知的市场场景,定义所述市场主体的动作,并对所有的所述动作以及结果进行赋值,之后根据已有的市场数据,对被赋值的所述动作以及结果进行自动识别并调整赋值,从而构建市场规则;环境参数输入模块,其被输入对市场的环境造成影响的因素和参数;市场策略训练模块,其根据被输入所述市场信息输入模块的信息、由所述规则知识库构建模块调整后的所述市场规则、以及被输入所述环境参数输入模块的因素和参数,使每个市场主体作为独立对抗主体相互对抗,得到各市场主体进行了各动作后的状态,以契合特定市场目的为评分,使用强化学习的方式训练出各市场主体的最优模型;以及结果记录模块,其将各个市场主体作为对抗主体的一方,记录其中的一方或多方的结果及/或路径。
[0014]可选地,在所述市场决策系统中,被输入所述环境参数输入模块的因素和参数包括系统随机输入的一些环境影响的因素和参数。
[0015]可选地,所述市场决策系统包括:规则优化模块,其基于所述环境参数和所述市场规则进行优化,根据相互影响调整赋值。
[0016]可选地,所述市场决策系统包括:市场策略学习模块,其以特定的所述市场主体的特定结果为评分依据,得到特定动作后的状态,并输出特定主体的最优结果和路径,所述市场策略学习模块使用监督学习的方式学习专家的决策行为,和专家的动作一致性越高的,评分越高,由此优化市场策略。
[0017]可选地,在所述市场决策系统中,在对抗中,所述市场主体能够在预定时间内获取其他市场主体的行为和可能结果,并相互学习。
[0018]依据本专利技术的另一个方面,提供一种市场决策方法,其基于人工智能而实现,包括:市场信息输入步骤,输入与市场、市场主体、市场主体的利益相关方有关的市场信息,并且输入初始化的各市场主体的状态;规则知识库构建步骤,根据已知的市场场景,定义所述市场主体的动作,并对所有的所述动作以及结果进行赋值,之后根据已有的市场数据,对被赋值的所述动作以及结果进行自动识别并调整赋值,从而构建市场规则;环境参数输入步骤,输入对市场的环境造成影响的因素和参数;市场策略训练步骤,根据在所述市场信息输入步骤中输入的信息、在所述规则知识库构建步骤中调整后的所述市场规则、以及在所述环境参数输入步骤中输入的因素和参数,使每个市场主体作为独立对抗主体相互对抗,得到各市场主体进行了各动作后的状态,以契合特定市场目的为评分,使用强化学习的方式
训练出各市场主体的最优模型;以及结果记录步骤,将各个市场主体作为对抗主体的一方,记录其中的一方或多方的结果及/或路径。
[0019]可选地,在所述环境参数输入步骤中,输入的因素和参数包括系统随机输入的一些环境影响的因素和参数。
[0020]可选地,还包括:
[0021]规则优化步骤,基于所述环境参数和所述市场规则进行优化,根据相互影响调整赋值。
[0022]可选地,还包括:
[0023]市场策略学习步骤,以特定的所述市场主体的特定结果为评分依据,得到特定动作后的状态,并输出特定主体的最优结果和路径,
[0024]在所述市场策略学习步骤中,使用监督学习的方式学习专家的决策行为,和专家的动作一致性越高的,评分越高,由此优化市场策略。
[0025]可选地,在对抗中,所述市场主体能够在预定时间内获取其他市场主体的行为和可能结果,并相互学习。
[0026]依据本专利技术的另一个方面,提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种市场决策方法,其基于人工智能而实现,其特征在于,包括:市场信息输入步骤,输入与市场、市场主体、市场主体的利益相关方有关的市场信息,并且输入初始化的各市场主体的状态;规则知识库构建步骤,根据已知的市场场景,定义所述市场主体的动作,并对所有的所述动作以及结果进行赋值,之后根据已有的市场数据,对被赋值的所述动作以及结果进行自动识别并调整赋值,从而构建市场规则;环境参数输入步骤,输入对市场的环境造成影响的因素和参数;市场策略训练步骤,根据在所述市场信息输入步骤中输入的信息、在所述规则知识库构建步骤中调整后的所述市场规则、以及在所述环境参数输入步骤中输入的因素和参数,使每个市场主体作为独立对抗主体相互对抗,得到各市场主体进行了各动作后的状态,以契合特定市场目的为评分,使用强化学习的方式训练出各市场主体的最优模型;以及结果记录步骤,将各个市场主体作为对抗主体的一方,记录其中的一方或多方的结果及/或路径。2.根据权利要求1所述的市场决策方法,其特征在于,在所述环境参数输入步骤中,输入的因素和参数包括系统随机输入的一些环境影响的因素和参数。3.根据权利要求1或2所述的市场决策方法,其特征在于,还包括:规则优化步骤,基于所述环境参数和所述市场规则进行优化,根据相互影响调整赋值。4.根据权利要求1或2所述的市场决策方法,其特征在于,还包括:市场策略学习步骤,以特定的所述市场主体的特定结果为评分依据,得到特定动作后的状态,并输出特定主体的最优结果和路径,在所述市场策略学习步骤中,使用监督学习的方式学习专家的决策行为,和专家的动作一致性越高的,评分越高,由此优化市场策略。5.根据权利要求1或2所述的市场决策方法,其特征在于,在对抗中,所述市场主体能够在预定时间内获取其他市场主体的行为和可能结果,并相互学习。6.一种市场决策系统,其基于人工智能而实现,其特征在于,包括:市场信息输入模块,其被输入与市场、市场主体、市场主体的利益相关方有关的市场信息,并且被输入初始化的各市场主体的状态;规则知识库构建模块,其根据已知的市场场景,定义所述市场主体的动作,并对所有的所述动作以及结果进行赋值,之后根据已有的市场数据,对被赋值的所述动作以及结果进行自动识别并调整赋值,从而构建市场规则;环境参数输入模块,其被输入对市场的环境造成影响的因素和参数;市场策略训练模块,其根据被输入所述市场信息输入模块的信息、由所述规则知识库构建模块调整后的所述市场规则、以及被输入所述环境参数输入模块的因素和参数,使每...

【专利技术属性】
技术研发人员:刘阳颜红燕刘晓宇黄志勇高源
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1