【技术实现步骤摘要】
随机采样的对话文本生成训练方法、装置及计算机介质
[0001]本专利技术涉及人工智能
,尤其涉及一种基于知识内容和用户行为协同的随机采样的对话文本生成训练方法、装置、设备及计算机可读存储介质。
技术介绍
[0002]医疗领域中常常涉及到诊断对话的生成预测操作、患者咨询操作等,例如,患者在网上对自身病情进行咨询,人工智能对患者进行初步医疗诊断以及生成预测对话。
[0003]当前医疗领域业内在多轮对话生成领域常用的方法是使用层级化的序列生成模型,即使用上下文的信息生成当前句子,通常在模型的训练的过程中,会将训练对话文本的除最后一句以外所有的对话句子作为训练样本,利用训练样本进行最后一句对话文本的预测生成。
[0004]在上述方法中,一方面由于训练样本作为一个整体,通常信息量会比较大,容易导致模型不能快速收敛,另一方面,由于在模型的训练过程中,该训练样本在多次迭代训练中的内容是比较稳定,容易引起模型的过拟合,上述两种情况均会降低模型训练的准确性。
技术实现思路
[0005]本专利技术提供一种随 ...
【技术保护点】
【技术特征摘要】
1.一种随机采样的对话生成训练方法,其特征在于,所述方法包括:在预设的对话文本中随机选择一句文本作为切割点,将切割点之间前的文本组成第一训练对话文本,利用预构建的对话生成模型,根据所述第一训练对话文本生成所述切割点的预测文本;计算所述切割点的预测文本与所述切割点的真实文本之间的第一误差;将所述切割点的预测文本替换所述切割点的真实文本,并将替换后的预设的对话文本中,除最后一句文本之外的所有对话文本作为第二训练对话文本,并生成所述预设的对话文本的最后一句文本的预测文本,计算所述最后一句文本的真实文本与所述最后一句文本的预测文本之间的第二误差;根据所述第一误差与所述第二误差计算总误差,当所述总误差满足预设条件时,得到对话生成模型,当不满足所述预设条件时,返回所述在预设的对话文本中随机选择一句文本作为切割点的步骤。2.如权利要求1所述的随机采样的对话生成训练方法,其特征在于,所述利用预构建的对话生成模型,根据所述第一训练对话文本生成所述切割点的预测文本,包括:利用所述对话生成模型的编码器提取所述第一训练对话文本的特征,得到第一训练对话文本对应的特征向量;利用所述对话生成模型的解码器,根据所述特征向量生成所述切割点的预测文本。3.如权利要求1所述的随机采样的对话文本生成训练方法,其特征在于,所述计算切割点的预测文本与所述切割点的真实文本之间的第一误差,包括:通过下述损失函数计算所述切割点的预测文本与所述切割点的真实文本的误差L(x,y):其中,表示在所述预设的对话文本中切割点总数量,x
n
表示所述第n个切割点的真实文本的向量,y
n
表示所述第n个切割点的预测文本的向量,表示所述对话生成模型在训练过程中的迭代次数,l
n
表示在第t次迭代训练中x
n
与y
n
之间的误差。4.如权利要求1所述的随机采样的对话文本生成训练方法,其特征在于,所述生成所述预设的对话文本的最后一句文本的预测文本,包括:依次对所述第二训练对话文本中每个文本进行向量转换,得到每个所述文本的真实向量;利用每个所述文本的真实向量与每个所述文本的预测向量,计算每个所述真实文本与每个所述预测文本的相似度权重;利用每个所述真实文本与每个所述预测文本生成所述第二训练对话文本的相似度向量;将所述相似度向量与每个所述文本的预测向量相加,得到所述预设的对话文本的最后一句文本的预测文本。5.如权利要求4所述的随机采样的对话文本生成训练方法,其特征在于,所述利用每个所述文本的真实向量与每个所述文本的预测向量,计算每个所述真实文本与每个所述预测
文本的相似度权重,包括:依次计算每个所述文本的真实向量与对应的预...
【专利技术属性】
技术研发人员:舒畅,陈又新,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。