【技术实现步骤摘要】
角色对话模拟方法、装置、设备及存储介质
[0001]本专利技术涉及自然语言处理
,尤其涉及一种角色对话模拟方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]随着人工智能的快速发展,运用计算机技术在智能问答领域以及对话模拟领域中的应用逐渐增多。例如,医疗问诊领域需要对病人的身体状况、症状表现、疾病发展等信息进行针对性询问,是医生获取患者病症信息的重要来源。现如今,可以运用自然语言处理技术构建智能问诊对话系统,缓解医生与病患之间信息不对称,促进医疗资源的高效利用,针对用户,医生的对话进行模拟,是实现智能医疗问诊与疾病诊断的核心。现有技术的对话模拟系统中,常常使用的是模板问答、问答库问答的方式,存在则场景单一,角色智能对话模拟不够灵活的问题。
技术实现思路
[0003]本专利技术提供一种角色对话模拟方法、装置及计算机可读存储介质,其主要目的在于解决角色智能对话模拟不够灵活的问题。
[0004]为实现上述目的,本专利技术提供的一种角色对话模拟方法,包括:
[0005]获取对话语料 ...
【技术保护点】
【技术特征摘要】
1.一种角色对话模拟方法,其特征在于,所述方法包括:获取对话语料,对所述对话语料进行角色分类、文本清洗,得到不同角色对应的训练文本;构建预训练对话模型,并利用所述预训练对话模型对所述不同角色对应的训练文本进行位置编码,得到文本矩阵;对所述文本矩阵进行矩阵计算及预测计算,得到预测对话,根据所述预测对话和所述训练文本计算相关度结果,并判断所述相关度结果是否大于预设阈值;若所述相关度结果小于或等于所述阈值,则更新所述文本矩阵,并返回对所述文本矩阵进行矩阵计算及预测计算的步骤;若所述相关度结果大于所述阈值,则停止训练,得到对话模型;根据预设条件确定所述对话模型的角色,获取用户输入,对所述用户输入进行文本处理,得到目标文本;将所述目标文本输入所述对话模型中,得到模型输出结果,对所述模型输出结果进行重复性筛选及采样,得到目标输出结果,并根据所述目标输出结果判断句子生成是否结束;若句子生成未结束,则返回将所述目标文本输入所述对话模型中的步骤。若句子生成结束,则对所述目标输出结果进行拼接,得到回复对话。2.如权利要求1所述的角色对话模拟方法,其特征在于,所述对所述对话语料进行角色分类、文本清洗,得到不同角色对应的训练文本,包括:将所述对话语料输入预设的分类模型中,得到对话语料对应的角色预测结果;根据所述角色预测结果对所述对话语料进行分类,得到每个角色对应的语料;剔除所述每个角色对应的语料中的预设字符,得到每个角色对应的第一文本;对所述第一文本进行语义识别,计算语义识别结果与预设文本向量的距离值,将距离值小于预设阈值的语义识别结果所对应的文本删除,得到每个角色对应的第二文本;分别将每个角色对应的第二文本进行文本拼接,得到每个角色对应的训练文本。3.如权利要求2所述的角色对话模拟方法,其特征在于,所述分别将每个角色对应的第二文本进行文本拼接,得到每个角色对应的训练文本,包括:从多个角色中选取一个角色作为目标角色,将所述目标角色对应的第二文本作为目标文本;根据所述目标文本计算得到平均句长,并根据所述平均句长设置所述目标文本的长度,将设置好长度的目标文本进行首尾拼接,得到所述目标角色对应的训练文本。4.如权利要求1所述的角色对话模拟方法,其特征在于,所述构建预训练对话模型,包括:将模型划分为四部分,第一部分为向量生成层,第二部分为第一向量处理层,第三部分为第二向量处理层,第四部分为预测层;在所述向量生成层中添加位置编码结构及Embedding结构;在所述第一向量处理层中添加LayerNorm结构、Masked Multiself
‑
Attention结构以及残差连接结构;在所述第二向量处理层中添加LayerNorm结构、Feed Forward结构以及残差连接结构;在所述预测层中添加LayerNorm结构及预测函数。
5.如权利要求4所述的角色对话模拟方法,其特征在于,所述对所述文本矩阵进行矩阵计算及预测计算,得到预测对话,包括:利用所述第向量处理层对所述文本矩阵进行归一化、注意力计算以及残差计算,得到第一向量矩阵;利用所述第二向量处理层所述文本矩阵进行归一化、前馈神经调节以及残差计算,得到...
【专利技术属性】
技术研发人员:金晓辉,阮晓雯,陈远旭,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。