语义确定方法技术

技术编号:28478627 阅读:9 留言:0更新日期:2021-05-15 21:48
本发明专利技术实施例提供一种语义确定方法,本申请实施例通过获取待确定语义的语句;从预先处理好的语料中训练多任务的孪生网络模型,通过训练好的模型获得对应语料的所有句向量。从训练好的模型中提取出所述语句对应的句向量,计算所有句向量与所述语句向量之间的向量差值是否处于预设差值范围内,将符合预设条件的多个句向量的相似度进行排序,将相似度最高的句向量作为所述语句对应匹配的语义,进而匹配到具体的语句,采用这种方法避免了使用单一任务造成的欠拟合,以至输出结果的精确度低的问题。题。题。

【技术实现步骤摘要】
语义确定方法


[0001]本专利技术属于母婴智能人工分析领域,尤其涉及一种语义确定方法。

技术介绍

[0002]近年来,随着人工智能领域尤其是深度学习的快速发展,自然语言处理在人类的学习工作与生活中发挥着越来越重要的作用。智能问答的出现使得一大批应用或服务涌现出来,如百度的小度,阿里的天猫精灵,小米的小爱同学,苹果的Siri,微软的小冰等设备系统。
[0003]在现有技术中,问答型机器人的技术路线为将句子映射为句向量,在通过计算句向量的余弦相似度得到分值最高的句子,在将其对应的答案给用户。但是由于中文句子的语法结构的复杂多变,语义语境的多异性等因素,导致模型在线上的效果评估很差,给用户带来了不好的体验;尤其是在母婴领域使用的问答型机器人,如果不能充分理解中文语法结构的复杂性以及多异性,其不能准确输出计算结果,将会导致模型在线上的效果评估很差,将会对用户体验造成很大的困扰。

技术实现思路

[0004]为了解决上述现有技术中但是由于中文句子的语法结构的复杂多变,语义语境的多异性等因素,导致模型在线上的效果评估很差,给用户带来了不好的体验的技术问题,本申请提供了一种语义确定方法。
[0005]第一方面,本专利技术提供了一种语义确定方法,所述方法包括:获取待确定语义的语句C;将所述语句输入预设的孪生网络模型中,得到语句C的特征向量,其中所述孪生网络模型用于将语句向量化;从向量库中确定与语句C的特征向量相似度最高的相似向量;将与所述相似向量对应的标准语句确定为与所述语句对应的语义。
[0006]进一步地,所述孪生网络模型包括网络结构第一分支、网络结构第二分支、主分类任务、第一分支辅助任务和第二分支辅助任务,所述孪生网络模型的训练过程包括:从预设的训练语料中获取句子A与句子B;将所述句子A与句子B输入至所述孪生网络模型中,以使所述网络结构第一分支确定所述句子A的特征向量,所述网络结构第二分支确定所述句子B的特征向量,并使得所述孪生网络模型将所述句子A的特征向量与句子B的特征向量进行特征融合得到融合向量后,基于所述句子A的特征向量与句子B的特征向量以及所述融合向量,确定用于将待处理句子向量化的孪生网络模型的主分类任务。
[0007]进一步地,所述网络结构第一分支和网络结构第二分支、主分类任务、第一分支辅助任务和第二分支辅助任务的损失函数为自定义损失,其中损失函数的公式为:
其中,为孪生网络模型输出,i=1为第一分支辅助任务输出,i=2为主分类任务输出,i=3为第二分支辅助任务输出, ,为孪生网络模型超参数, 为孪生网络模型权重矩阵, 。
[0008]进一步地,所述从向量库中确定与语句C的特征向量相似度最高的相似向量,包括:通过余弦相似度公式,计算出每个句子向量与所述语句向量的相似度,其中句子向量存储在所述向量库中;若句子向量与所述语句C的特征向量的相似度大于预设阈值,则确定出所述句子向量与所述语句C的特征向量之间的向量差值处于预设差值范围内;从多个处于预设差值范围内的句子向量中确定与语句向量相似度最高的相似向量。
[0009]进一步地,语义确定方法还包括:若句子向量与所述语句C的特征向量的相似度小于预设阈值,则确定出所述句子向量与所述语句C的特征向量之间的向量差值未处于预设差值范围内。
[0010]进一步地,所述孪生网络模型的训练过程还包括:将获取的多个语句以及每个所述语句对应的标签输入孪生网络模型进行训练,以训练出每个所述语句所属的隐含标签以及句向量,其中,所述隐含标签用于机器对该语句进行分类的标签,句向量可包括多个维度。
[0011]进一步地,在计算所述网络结构第一分支对应的网络结构第二分支中每个句子向量与所述语句向量之间的向量差值是否处于预设差值范围内之前,还包括:从预先训练好的网络结构第一分支中提取出所述语句对应的隐含标签;从所述网络结构第一分支对应的网络结构第二分支中,筛选出属于所述隐含标签范围内的语句。
[0012]进一步地,所述网络结构第二分支与所述网络结构第一分支的权重相同。
[0013]本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例通过获取待确定语义的语句;从预先训练好的网络结构第一分支中提取出语句对应的句向量,计算网络结构第一分支对应的网络结构第二分支中每个句子向量与语句的句向量之间的向量差值是否处于预设差值范围内,将符合预设条件的多个相似度进行排序,将相似度最高的机器语句作为语句对应的语义,避免了使用单一模式造成语句的拟合,以至输出结果的精确度低的问题。
附图说明
[0014]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是本申请实施例的一种语义确定方法的主要操作步骤流程图;图2是本申请实施例的语义确定方法一具体模型实施流程示意图;
图3是本申请实施例的语义确定方法涉及的孪生网络模型的一具体实现流程示意图;图4是本申请实施例的语义确定方法中从向量库中确定与语句C的特征向量相似度最高的相似向量的具体操作步骤流程图;图5是本申请实施例的语义确定方法涉及的孪生网络模型的一整体实现流程示意图;图6是本申请实施例的Tensorflow_ranking模型实现流程图;图7是本申请实施例的一种电子设备结构示意图。
具体实施方式
[0015]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0016]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。
[0017]在现有技术中,问答型机器人的技术路线为将句子映射为句子向量,通过计算句子向量的余弦相似度得到分值最高的句子,再将其对应的答案给用户。但是由于中文句子的语法结构的复杂多变,语义语境的多异性等因素,导致模型在线上的效果评估很差,给用户带来了不好的体验。
[0018]监于此,专家学者们提出了大量的解决方法,主要分为:现有技术1:结合Bert中文预训练语言模型,将句子转换为空间向量的方法;现有技术2:结合Albert中文预训练语言模型,将句子转化为空间向量的方法。
[0019]虽然,在学者们的不断研究过程中,对当前方法进行了一定程度的改进,但是依然存在一定的问题。其中,现有技术1,基于微调Bert中文预训练语言模型这一方法基本代表了现如今提取句子向量最强大的方法,这种方法能够将一句话抽象为一定维度的句子向量,并且这一向量融合了句子的丰富语义特征,在模型的评估效果上的确比Word2Vec的效果好了很多,但是还是达不到上线的要求本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语义确定方法,其特征在于,所述方法包括:获取待确定语义的语句C;将所述语句输入预设的孪生网络模型中,得到语句C的特征向量,其中所述孪生网络模型用于将语句向量化;从向量库中确定与语句C的特征向量相似度最高的相似向量;将与所述相似向量对应的标准语句确定为与所述语句对应的语义。2.根据权利要求1所述的语义确定方法,其特征在于,所述孪生网络模型包括网络结构第一分支、网络结构第二分支、主分类任务、第一分支辅助任务和第二分支辅助任务,所述孪生网络模型的训练过程包括:从预设的训练语料中获取句子A与句子B;将所述句子A与句子B输入至所述孪生网络模型中,以使所述网络结构第一分支确定所述句子A的特征向量,所述网络结构第二分支确定所述句子B的特征向量,并使得所述孪生网络模型将所述句子A的特征向量与句子B的特征向量进行特征融合得到融合向量后,基于所述句子A的特征向量与句子B的特征向量以及所述融合向量,确定用于将待处理句子向量化的孪生网络模型的主分类任务。3.根据权利要求2所述的语义确定方法,其特征在于,所述网络结构第一分支和网络结构第二分支、主分类任务、第一分支辅助任务和第二分支辅助任务的损失函数为自定义损失,其中损失函数的公式为:其中,为孪生网络模型输出,i=1为第一分支辅助任务输出,i=2为主分类任务输出,i=3为第二分支辅助任务输出,,为孪生网络模型超参数,为孪生网络模型权重矩阵,。4.根据权利要求1所述的语义确定方法,其特征在于,所述从向量库中...

【专利技术属性】
技术研发人员:王光勇姜巍李乘风于游赵永强廖望梅张姗姗
申请(专利权)人:北京育学园健康管理中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1