当前位置: 首页 > 专利查询>度小满科技专利>正文

一种语义分析方法技术

技术编号:39675142 阅读:6 留言:0更新日期:2023-12-11 18:41
本申请实施例提供了一种语义分析方法

【技术实现步骤摘要】
一种语义分析方法、装置及电子设备


[0001]本申请涉及人工智能领域,尤其是自然语言处理领域,具体涉及一种语义分析方法

装置及电子设备


技术介绍

[0002]在人工智能领域,人机智能语音交互常用于各种场景中,比如机器人客服

智能音箱

智能电视等等

人机智能语音交互过程中,机器方针对用户所说的语言是否能够做到完整

准确地分析,决定了人机智能语音交互是否准确以及用户使用体验是否良好

因此,语义完整度分析是人机智能语音交互过程中重要的一环

[0003]相关技术采用的语义完整度分析方法,通过关键词和规则匹配的方式,根据人工总结的关键词匹配来判断用户所说的语音是否表达完整

若没有匹配成功,则表明用户表达完整,此时再根据接收到的语音信号给出对应的答复方案

此种方式过度依赖于人工总结的关键词,假设人工总结的关键词所表达的语义不够准确,容易存在人机交互过程中对用户所表达的意思产生误解,进而影响用户体验


技术实现思路

[0004]有鉴于此,本申请实施例提供了一种语义分析方法

装置及电子设备,以解决现有的语义分析方法所存在的语义分析完整度较差的问题

[0005]第一方面,本申请实施例提供了一种语义分析方法,所述方法包括:
[0006]获取用户输入的文本信号,将所述文本信号输入至目标语义分析模型中;
[0007]根据所述目标语义分析模型输出的语义完整度分类结果,确定目标分析结果;其中,所述目标语义分析模型预先通过如下方式训练得到:
[0008]利用预设训练样本数据对,对预设初始语义分析模型进行训练,以得到所述目标语义分析模型,其中,所述预设训练样本数据对至少包括:一条上文文本与一条所述上文文本对应的下文文本

[0009]结合第一方面,在第二种可能的实施例中,所述预设训练样本数据对预先通过如下方式获得:
[0010]分别以上文文本

所述上文文本对应的下文文本构建特征向量对,以得到一组预设语料数据对;
[0011]根据所述上文文本和所述下文文本的完整程度,对所述预设语料数据对添加分类标签信息,以得到所述训练样本数据对,其中,所述分类标签信息值用于表征文本的完整程度

[0012]结合第一方面的第二种可能的实施例,在第三种可能的实施例中,所述对预设初始语义分析模型进行训练,以得到目标语义分析模型,包括:
[0013]根据目标余弦相似度与所述分类标签信息值,构建目标损失函数,其中,所述目标余弦相似度为所述上文文本的上文特征向量与所述下文文本的下文特征向量之间的余弦
相似度;
[0014]基于所述目标损失函数,利用预设梯度回传算法对所述预设初始语义分析模型的网络参数进行多次迭代更新;
[0015]若更新后的语义分析模型的损失值不再变化,则确定所述损失值不再变化的的语义分析模型为所述目标语义分析模型

[0016]结合第一方面的第二种可能的实施例,在第四种可能的实施例中,所述方法还包括:
[0017]根据完整的下文文本以及所述完整的下文文本对应的上文文本,构建一组正预设语料数据对;
[0018]针对各目标正预设语料数据对,借助预设概率值,对所述目标正预设语料数据对中的下文文本进行截断,以获取目标截断后的下文文本;
[0019]基于所述目标截断后的下文文本以及所述完整的下文文本对应的上文文本,构建一组负预设语料数据对;
[0020]基于所述正预设语料数据对与所述负预设语料数据对,构建训练样本数据对集合

[0021]结合第一方面,在第五种可能的实施例中,所述用户输入的文本信号为针对目标上文文本信号对应的下文文本信号,所述将所述文本信号输入至所述目标语义分析模型中,根据所述目标语义分析模型输出的语义完整度分类结果确定目标分析结果,包括:
[0022]基于所述目标上文文本信号

所述用户的下文文本信号构建特征向量对;
[0023]将所述特征向量对分别输入至所述目标语义分析模型,由所述目标语义分析模型计算所述特征向量对内两个特征向量之间的相似度;
[0024]若所述相似度大于预设相似度阈值,则确定所述用户输入的文本信号为完整的文本

[0025]第二方面,本申请实施例提供了一种语义分析装置,所述装置包括:
[0026]获取模块,用于获取用户输入的文本信号,将所述文本信号输入至目标语义分析模型中;
[0027]分析模块,用于根据所述目标语义分析模型输出的语义完整度分类结果,确定目标分析结果;
[0028]训练模块,用于利用预设训练样本数据对,对预设初始语义分析模型进行训练,以得到所述目标语义分析模型,其中,所述预设训练样本数据对至少包括:一条上文文本与一条所述上文文本对应的下文文本

[0029]结合第二方面,在第二种可能的实施例中,所述装置还包括:
[0030]样本数据处理模块,用于分别以上文文本

所述上文文本对应的下文文本构建特征向量对,以得到一组预设语料数据对;根据所述上文文本和所述下文文本的完整程度,对所述预设语料数据对添加分类标签信息,以得到所述训练样本数据对,其中,所述分类标签信息值用于表征文本的完整程度

[0031]结合第二方面的第二种可能的实施例,在第三种可能的实施例中,所述训练模块,具体用于根据目标余弦相似度与所述分类标签信息值,构建目标损失函数,其中,所述目标余弦相似度为所述上文文本的上文特征向量与所述下文文本的下文特征向量之间的余弦
相似度;基于所述目标损失函数,利用预设梯度回传算法对所述预设初始语义分析模型的网络参数进行多次迭代更新;若更新后的语义分析模型的损失值不再变化,则确定所述损失值不再变化的语义分析模型为所述目标语义分析模型

[0032]结合第二方面的第二种可能的实施例,在第四种可能的实施例中,所述样本数据处理模块,还用于根据完整的下文文本以及所述完整的下文文本对应的上文文本,构建一组正预设语料数据对;针对各目标正预设语料数据对,借助预设概率值,对所述目标正预设语料数据对中的下文文本进行截断,以获取目标截断后的下文文本;基于所述目标截断后的下文文本以及所述完整的下文文本对应的上文文本,构建一组负预设语料数据对;基于所述正预设语料数据对与所述负预设语料数据对,构建训练样本数据对集合

[0033]结合第二方面,在第五种可能的实施例中,所述用户输入的文本信号为针对目标上文文本信号对应的下文文本信号,所述分析模块具体用于:
[0034]基于所述目标上文文本信号

所述用户的下文文本信号构建特征向量对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种语义分析方法,其特征在于,所述方法包括:获取用户输入的文本信号,将所述文本信号输入至目标语义分析模型中;根据所述目标语义分析模型输出的语义完整度分类结果,确定目标分析结果;其中,所述目标语义分析模型预先通过如下方式训练得到:利用预设训练样本数据对,对预设初始语义分析模型进行训练,以得到所述目标语义分析模型,其中,所述预设训练样本数据对至少包括:一条上文文本与一条所述上文文本对应的下文文本
。2.
根据权利要求1所述的方法,其特征在于,所述预设训练样本数据对预先通过如下方式获得:分别以上文文本

所述上文文本对应的下文文本构建特征向量对,以得到一组预设语料数据对;根据所述上文文本和所述下文文本的完整程度,对所述预设语料数据对添加分类标签信息,以得到所述训练样本数据对,其中,所述分类标签信息值用于表征文本的完整程度
。3.
根据权利要求2所述的方法,其特征在于,所述对预设初始语义分析模型进行训练,以得到目标语义分析模型,包括:根据目标余弦相似度与所述分类标签信息值,构建目标损失函数,其中,所述目标余弦相似度为所述上文文本的上文特征向量与所述下文文本的下文特征向量之间的余弦相似度;基于所述目标损失函数,利用预设梯度回传算法对所述预设初始语义分析模型的网络参数进行多次迭代更新;若更新后的语义分析模型的损失值不再变化,则确定所述损失值不再变化的语义分析模型为所述目标语义分析模型
。4.
根据权利要求2所述的方法,其特征在于,所述方法还包括:根据完整的下文文本以及所述完整的下文文本对应的上文文本,构建一组正预设语料数据对;针对各目标正预设语料数据对,借助预设概率值,对所述目标正预设语料数据对中的下文文本进行截断,以获取目标截断后的下文文本;基于所述目标截断后的下文文本以及所述完整的下文文本对应的上文文本,构建一组负预设语料数据对;基于所述正预设语料数据对与所述负预设语料数据对,构建训练样本数据对集合
。5.
根据权利要求1所述的方法,其特征在于,所述用户输入的文本信号为针对目标上文文本信号对应的下文文本信号,所述将所述文本信号输入至所述目标语义分析模型中,根据所述目标语义分析模型输出的语义完整度分类结果确定目标分析结果,包括:基于所述目标上文文本信号

所述用户的下文文本信号构建特征向量对;将所述特征向量对分别输入至所述目标语义分析模型,由所述目标语义分析模型计算所述特征向量对内两个特征向量之间的相似度;若所述相似度大于预设相似度阈值,则确定所述用户输入的文本信号为完整的文本
。6.
一种语义分析装置,其特征在于,所述装置包...

【专利技术属性】
技术研发人员:朱文静孙思宁
申请(专利权)人:度小满科技
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1