策略优化处理方法、装置、存储介质及电子装置制造方法及图纸

技术编号：32923303 阅读：13 留言：0更新日期：2022-04-07 12:14

本申请实施例提供了一种策略优化处理方法、装置、存储介质及电子装置，该方法包括：使用蒙特卡洛算法对知识库中多个行业类型的问答信息进行模拟，得到该多个行业类型的模拟结果；根据该蒙特卡洛算法多个行业类型的模拟结果对对应的该蒙特卡洛算法进行优化，使得该模拟结果对应的目标问答信息满足预设条件；确定该目标问答信息对应的策略为目标策略，该目标策略用于通过提供给对应行业类型的客户端，可以解决相关技术中对于不同行业类型，AI处理用户问答时采用相同的提问方式，准确性不高的问题，基于蒙特卡洛算法对知识库中的不同行业类型模拟，提高对用户问题分析的准确性，提高了AI自动回复语句的准确性。AI自动回复语句的准确性。AI自动回复语句的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
策略优化处理方法、装置、存储介质及电子装置

[0001]本申请实施例涉及通信领域，具体而言，涉及一种策略优化处理方法、装置、存储介质及电子装置。

技术介绍

[0002]人工智能(Artificial Intelligence，简称为AI)处理用户问答时，一般均采用预先设置好的提问方式，由于不同行业类型行业差异，导致准确性不高。
[0003]针对相关技术中对于不同行业类型，AI处理用户问答时采用相同的提问方式，准确性不高的问题，尚未提出解决方案。

技术实现思路

[0004]本申请实施例提供了一种策略优化处理方法、装置、存储介质及电子装置，以至少解决相关技术中对于不同行业类型，AI处理用户问答时采用相同的提问方式，准确性不高的问题。
[0005]根据本申请的一个实施例，提供了一种策略优化处理方法，包括：
[0006]使用蒙特卡洛算法对知识库中多个行业类型的问答信息进行模拟，得到所述多个行业类型的模拟结果；
[0007]根据所述多个行业类型的模拟结果对对应的所述蒙特卡洛算法进行优化，使得所述模拟结果对应的目标问答信息满足预设条件；
[0008]确定所述目标问答信息对应的策略为目标策略，所述目标策略用于提供给对应行业类型的客户端。
[0009]可选地，根据所述多个行业类型的模拟结果对对应的所述蒙特卡洛算法进行优化，使得所述模拟结果对应的目标问答信息满足预设条件包括：
[0010]对所述多个行业类型的问答信息使用蒙特卡洛算法进行模拟；
[0011]

【技术保护点】

【技术特征摘要】
1.一种策略优化处理方法，其特征在于，包括：使用蒙特卡洛算法对知识库中多个行业类型的问答信息进行模拟，得到所述多个行业类型的模拟结果；根据所述多个行业类型的模拟结果对对应的所述蒙特卡洛算法进行优化，使得所述模拟结果对应的目标问答信息满足预设条件；确定所述目标问答信息对应的策略为目标策略，其中，所述目标策略用于提供给对应行业类型的客户端。2.根据权利要求1所述的方法，其特征在于，根据所述多个行业类型的模拟结果对对应的所述蒙特卡洛算法进行优化，使得所述模拟结果对应的目标问答信息满足预设条件包括：对所述多个行业类型的问答信息使用蒙特卡洛算法进行模拟；对于每个行业类型的问答信息，统计模拟结果；获取所述模拟结果中模拟轮数与所述问答信息的回复质量，其中，所述回复质量通过模拟答复与标准答案的相似度确定；若所述模拟轮数与所述问答信息的回复质量满足所述预设条件，获取对应的所述目标问答信息。3.根据权利要求2所述的方法，其特征在于，在若所述模拟轮数与所述问答信息的回复质量满足所述预设条件，获取对应的所述目标问答信息之前，所述方法还包括：判断所述模拟轮数是否大于预设次数，并判断所述问答信息的回复质量是否大于预设阈值；在判断结果均为是的情况下，确定所述模拟轮数与所述问答信息的回复质量满足所述预设条件。4.根据权利要求1所述的方法，其特征在于，使用蒙特卡洛算法对知识库中多个行业类型的问答信息进行模拟，得到所述多个行业类型的模拟结果包括：对所述多个行业类型的问答信息中的每个行业类型的问答信息执行以下步骤，对于正在执行的行业类型称为当前行业类型：对所述当前行业类型的问答信息，随机选取一个状态行为对，其中，所述状态对应行业类型对应，所述行为对应所述问答信息；基于当前蒙特卡洛算法从选取的所述状态行为对开始模拟遍历语义样本，以获取所述状态对应的多个行为，将所述多个行为生成一段序列；根据价值函数统计所述序列上所述多个行为的价值；根据所述多个行为的价值对所述价值函数进行更新，得到更新后的价值函数；...

【专利技术属性】
技术研发人员：王乾，孙科，蒋艳军，赵轶新，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人