【技术实现步骤摘要】
对局解说的生成方法、装置、设备及存储介质
[0001]本申请实施例涉及人工智能
,特别涉及一种对局解说的生成方法、装置、设备及存储介质。
技术介绍
[0002]随着电子竞技的快速发展,游戏赛事解说的市场规模急剧上升,而基于人工智能的游戏解说会使得游戏的解说成本大幅降低。而所有游戏解说的内容都是根据当前的事件选择生成的,所以事件选择的重要性不言而喻。
[0003]相关技术中,根据游戏核心数据,实时抽象生成事件池,再通过事件过滤来去除掉一些过期和超出范围的事件,进而再根据游戏核心数据通过专家知识库识别出现在游戏的一些状态来给每个事件的关键性打分,从而实现游戏解说的事件选择。
[0004]但是,这种基于规则的事件选择,仅仅考虑了当前事件的关键性,而没有充分考虑解说过程中各个事件之间的连贯性和故事性,影响了游戏智能解说的使用体验。
技术实现思路
[0005]本申请实施例提供了一种对局解说的生成方法、装置、设备及存储介质,能够提高对局解说的连贯性和故事性。所述技术方案如下:
[0006]一方面,本申请实施例提供了一种对局解说的生成方法,所述方法包括:
[0007]获取当前对局时刻的事件选择状态,所述事件选择状态包括当前对局时刻可选择的解说事件集合、历史已选择的解说事件集合以及当前对局中的状态属性;
[0008]将所述当前对局时刻的事件选择状态输入事件选择模型中的第一策略网络,得到所述第一策略网络输出的事件选择策略,所述事件选择策略指基于当前对局时刻的事件选择状态进行 ...
【技术保护点】
【技术特征摘要】
1.一种对局解说的生成方法,其特征在于,所述方法包括:获取当前对局时刻的事件选择状态,所述事件选择状态包括当前对局时刻可选择的解说事件集合、历史已选择的解说事件集合以及当前对局中的状态属性;将所述当前对局时刻的事件选择状态输入事件选择模型中的第一策略网络,得到所述第一策略网络输出的事件选择策略,所述事件选择策略指基于当前对局时刻的事件选择状态进行事件选择的策略;将所述事件选择策略输入所述事件选择模型中的第二策略网络,得到所述第二策略网络输出的所述事件选择策略对应的目标选择事件,所述目标选择事件是指被选择为当前对局时刻对对局进行解说的事件;基于所述目标选择事件,生成当前对局时刻的对局解说。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述第二策略网络进行训练,得到训练后的第二策略网络;基于所述训练后的第二策略网络,对所述第一策略网络进行训练,得到训练后的第一策略网络。3.根据权利要求2所述的方法,其特征在于,所述对所述第二策略网络进行训练,得到训练后的第二策略网络,包括:获取第一样本事件选择策略、第一样本事件选择状态以及专家解说事件轨迹,所述专家解说事件轨迹包括专家在进行对局解说过程中的事件选择策略以及各个时刻的事件选择状态;基于所述第一样本事件选择策略以及所述第一样本事件选择状态,通过所述第二策略网络,确定第二样本事件选择状态;基于所述第一样本事件选择策略、所述第一样本事件选择状态、所述第二样本事件选择状态以及所述专家解说事件轨迹,确定事件选择损失;以所述事件选择损失对所述第二策略网络进行训练,得到所述训练后的第二策略网络。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一样本事件选择策略以及所述第一样本事件选择状态,通过所述第二策略网络,确定第二样本事件选择状态,包括:将所述第一样本事件选择策略以及所述第一样本事件选择状态输入所述第二策略网络,得到所述第二策略网络输出的第一样本选择事件;基于所述第一样本选择事件以及第一样本事件选择环境,确定所述第二样本事件选择状态,其中,所述第一样本事件选择环境包括样本对局环境以及样本事件所处的选择环境。5.根据权利要求3所述的方法,其特征在于,所述基于所述第一样本事件选择策略、所述第一样本事件选择状态、所述第二样本事件选择状态以及所述专家解说事件轨迹,确定事件选择损失,包括:基于所述第一样本事件选择状态、所述第二样本事件选择状态以及所述专家解说事件轨迹,通过判别器确定样本状态转移的第一边缘分布与专家状态转移的第二边缘分布之间的JS散度,所述JS散度表征所述第一边缘分布与所述第二边缘分布之间的离散程度;基于所述第一样本事件选择策略、所述第一样本事件选择状态以及所述第二样本事件选择状态,通过策略编码器确定所述第一样本事件选择策略与样本状态转移之间的相互信
息熵,所述相互信息熵表征所述第一样本事件选择策略与所述样本状态转移之间的关联程度;基于所述JS散度以及所述相互信息熵,确定所述事件选择损失。6.根据权利要求3所述的方法,其特征在于,所述方法还包括:构建专家解说事件轨迹打分器;基于所述专家解说事件轨迹打分器对应的打分标准,对所述专家解说事件轨迹进行打分,得到所述专家解说事件轨迹对应的打分结果;基于所述打分结果,对所述专家解说事件轨迹进行筛选,得到筛选后的专家解说事件轨迹。7.根据权利要求2所述的方法,其特征在于,所述基于所述训练后的第二策略网络,对所述第一策略网络进行训练,得到训练后的第一策略网络,包括:获取第三样本事件选择状态;将所述第三样本事件选择状态输入所述第一策略网络,得到所述第一策略网络输出的第二样本事件选择策略;将所述第二样本事件选择策略输入所述第二策略网络,得到所述第二策略网络输出的第二样本选择事件;基于所述第二样本选择事件以...
【专利技术属性】
技术研发人员:李鸣霄,刘思亮,黄鑫龙,沈晓斌,安东岳,陈祺,杨雄锴,唐杰,陈梓阳,杜楠,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。