文本语义匹配方法及冰箱组成比例

技术编号:38624925 阅读:9 留言:0更新日期:2023-08-31 18:26
本发明专利技术提供一种文本语义匹配方法及冰箱,所述方法包括:获取文本数据,提取其中具有不同长度的字段的至少两组文本特征,至少得到第一文本特征和第二文本特征;提取对应于所述第一文本特征和所述第二文本特征的交互文本特征;其中,所述交互文本特征表征两者的关联性和/或相似性;根据所述交互文本特征,确定所述文本数据的语义信息。本发明专利技术提供的文本语义匹配方法,按照不同长度的字段对文本数据执行特征提取,可以实现多粒度文本表达,丰富和增强文本的表达能力;提取各文本特征之间的交互特征,能够学习这些特征之间的内在依赖与联系,增强语言理解能力和表达能力,提高语义匹配的准确率,提升用户体验效果。提升用户体验效果。提升用户体验效果。

【技术实现步骤摘要】
文本语义匹配方法及冰箱


[0001]本专利技术涉及计算机
,具体地涉及一种文本语义匹配方法及冰箱。

技术介绍

[0002]文本语义是文本数据所要表达的含义、思想和情感,深入理解文本语义的本质与表示,有助于实现人工智能与人类通过语言真正意义上的理解和交流。文本语义应用广泛,特别可以应用于诸如冰箱等智能家电中,例如,智能冰箱与用户可通过文本、语音、图像等多模态数据方式实现诸如智能推荐、智能问答等多种人机交互场景,这些都与文本语义理解和匹配紧密相连,文本语义匹配方法成为人工智能技术应用的关键部分。
[0003]现有的文本语义匹配方法包括传统的机器学习算法以及基于文本数据语义层面进行特征提取和匹配等方法,现有的匹配方法依然存在着特征提取单一、文本数据语义处理粒度粗糙,未从字、词、短语和句子等多维度综合挖掘数据深层的语义、语境和语法以及其关联性等信息,使得语义信息匹配的准确率低、误差大,进而进一步地影响智能冰箱与用户交互的时效性和便捷性,用户体验效果差。

技术实现思路

[0004]本专利技术的目的之一在于提供一种文本语义匹配方法,以解决现有技术中文本语义匹配方法孤立地使用单一文本要素,忽略要素间的关联性,匹配语义结果精度低、误差大,无法准确、高效地体现文本数据原意的技术问题。
[0005]本专利技术的目的之一在于提供一种冰箱。
[0006]为了实现上述专利技术目的之一,本专利技术提供一种文本语义匹配方法,包括:获取文本数据,提取其中具有不同长度的字段的至少两组文本特征,至少得到第一文本特征和第二文本特征;提取对应于所述第一文本特征和所述第二文本特征的交互文本特征;其中,所述交互文本特征表征两者的关联性和/或相似性;根据所述交互文本特征,确定所述文本数据的语义信息。
[0007]作为本专利技术一实施方式的进一步改进,所述第一文本特征包括字文本特征、词文本特征、短语文本特征和句子文本特征至少其中之一;所述第二文本特征包括字文本特征、词文本特征、短语文本特征和句子文本特征至少其中之一。
[0008]作为本专利技术一实施方式的进一步改进,所述“获取文本数据,提取其中具有不同长度的字段的至少两组文本特征”具体包括:根据所述文本数据,基于字特征提取方法、词特征提取方法、短语特征提取方法和句子特征提取方法至少其中之一执行特征提取,对应得到所述字文本特征、所述词文本特征、所述短语文本特征和所述句子文本特征至少其中之一。
[0009]作为本专利技术一实施方式的进一步改进,所述关联性包括所述第一文本特征和所述第二文本特征的语法关联性、语义关联性和语境关联性至少其中之一;所述相似性包括所述第一文本特征和所述第二文本特征的语法相似性、语义相似性和语境相似性至少其中之
一。
[0010]作为本专利技术一实施方式的进一步改进,在所述“获取文本数据”之前,所述方法还包括:获取多源异构数据,提取所述多源异构数据的数据特征;其中,所述多源异构数据包括语音数据和视频数据至少其中之一;将所述数据特征输入卷积神经网络模型得到对应的第一文本信息;利用连接时序分类算法将所述第一文本信息和所述数据特征的序列长度进行对齐,并对所述第一文本信息执行全连接组合计算,得到所述文本数据。
[0011]作为本专利技术一实施方式的进一步改进,所述“将所述数据特征输入卷积神经网络模型得到对应的第一文本信息”具体包括:将所述数据特征输入多尺寸多通道卷积神经网络模型或蒸馏扩散模型,获得与所述数据特征相符的第一文本信息。
[0012]作为本专利技术一实施方式的进一步改进,在所述“提取所述多源异构数据的数据特征”之前,所述方法还包括:判断所述多源异构数据是否包括语音数据;所述“将所述数据特征输入卷积神经网络模型得到对应的第一文本信息”具体包括:若是,则将语音特征输入所述多尺寸多通道卷积神经网络模型中,获得与所述语音数据对应的第一文本信息;其中,所述数据特征包含所述语音特征;且/或,在所述“提取所述多源异构数据的数据特征”之前,所述方法还包括:判断所述多源异构数据是否包括视频数据;所述“将所述数据特征输入卷积神经网络模型得到对应的第一文本信息”具体包括:若是,则将所述视频特征输入所述蒸馏扩散模型中,获得与所述视频数据对应的第一文本信息;其中,所述数据特征包含所述视频特征。
[0013]作为本专利技术一实施方式的进一步改进,所述方法还包括:将所述视频数据输入3D深度卷积神经网络模型中,得到所述视频特征。
[0014]作为本专利技术一实施方式的进一步改进,所述“提取对应于所述第一文本特征和所述第二文本特征的交互文本特征”具体包括:基于注意力机制,计算表征第一文本向量的关联性的第一交互文本特征;其中,所述第一文本向量的关联性包括第一文本向量自身关联性和/或第一文本向量与其他数据的关联性;基于注意力机制,计算表征第二文本向量的关联性的第二交互文本特征;其中,所述第二文本向量的关联性包括第二文本向量自身关联性和/或第二文本向量与其他数据的关联性。
[0015]作为本专利技术一实施方式的进一步改进,所述“基于注意力机制,计算表征所述第一文本向量的关联性的第一交互文本特征”具体包括:基于自注意力机制,计算所述第一文本向量和所述第一文本向量对应元素之间的注意力权重,得到第一交互向量;基于相互注意力机制,计算所述第一文本向量和所述第二文本向量对应元素之间的注意力权重,得到第二交互向量;根据所述第一交互向量和所述第二交互向量,构建第一交互文本矩阵;对所述第一交互文本矩阵执行编码或池化操作,得到所述第一交互文本特征。
[0016]作为本专利技术一实施方式的进一步改进,所述第一交互向量和所述第二交互向量的维度相同;所述“根据所述第一交互向量和所述第二交互向量,构建第一交互文本矩阵”具体包括:将所述第一交互向量和所述第二交互向量作为矩阵的两个元素,构成所述第一交互文本矩阵。
[0017]作为本专利技术一实施方式的进一步改进,所述“基于注意力机制,计算表征第二文本向量的关联性的第二交互文本特征”具体包括:基于自注意力机制,计算所述第二文本向量和所述第二文本向量对应元素之间的注意力权重,得到第三交互向量;基于相互注意力机
制,计算所述第二文本向量和所述第一文本向量对应元素之间的注意力权重,得到第四交互向量;根据所述第三交互向量和所述第四交互向量,构建第二交互文本矩阵;对所述第二交互文本矩阵执行编码或池化操作,得到所述第二交互文本特征。
[0018]作为本专利技术一实施方式的进一步改进,所述第三交互向量和所述第四交互向量的维度相同;所述“根据所述第三交互向量和所述第四交互向量,构建第二交互文本矩阵”具体包括:将所述第三交互向量和所述第四交互向量作为矩阵的两个元素,构成所述第二交互文本矩阵。
[0019]作为本专利技术一实施方式的进一步改进,所述“根据所述交互文本特征,确定所述文本数据的语义信息”具体包括:基于注意力机制,对所述交互文本特征执行加权求和操作,得到交互特征向量;对所述交互特征向量执行最大化池化运算,得到池化特征向量;将所述池化特征向量依次输入全连接层、注意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本语义匹配方法,其特征在于,包括:获取文本数据,提取其中具有不同长度的字段的至少两组文本特征,至少得到第一文本特征和第二文本特征;提取对应于所述第一文本特征和所述第二文本特征的交互文本特征;其中,所述交互文本特征表征两者的关联性和/或相似性;根据所述交互文本特征,确定所述文本数据的语义信息。2.根据权利要求1所述的文本语义匹配方法,其特征在于,所述第一文本特征包括字文本特征、词文本特征、短语文本特征和句子文本特征至少其中之一;所述第二文本特征包括字文本特征、词文本特征、短语文本特征和句子文本特征至少其中之一。3.根据权利要求1所述的文本语义匹配方法,其特征在于,所述“获取文本数据,提取其中具有不同长度的字段的至少两组文本特征”具体包括:根据所述文本数据,基于字特征提取方法、词特征提取方法、短语特征提取方法和句子特征提取方法至少其中之一执行特征提取,对应得到所述字文本特征、所述词文本特征、所述短语文本特征和所述句子文本特征至少其中之一。4.根据权利要求1所述的文本语义匹配方法,其特征在于,所述关联性包括所述第一文本特征和所述第二文本特征的语法关联性、语义关联性和语境关联性至少其中之一;所述相似性包括所述第一文本特征和所述第二文本特征的语法相似性、语义相似性和语境相似性至少其中之一。5.根据权利要求1所述的文本语义匹配方法,其特征在于,在所述“获取文本数据”之前,所述方法还包括:获取多源异构数据,提取所述多源异构数据的数据特征;其中,所述多源异构数据包括语音数据和视频数据至少其中之一;将所述数据特征输入卷积神经网络模型得到对应的第一文本信息;利用连接时序分类算法将所述第一文本信息和所述数据特征的序列长度进行对齐,并对所述第一文本信息执行全连接组合计算,得到所述文本数据。6.根据权利要求5所述的文本语义匹配方法,其特征在于,所述“将所述数据特征输入卷积神经网络模型得到对应的第一文本信息”具体包括:将所述数据特征输入多尺寸多通道卷积神经网络模型或蒸馏扩散模型,获得与所述数据特征相符的第一文本信息。7.根据权利要求6所述的文本语义匹配方法,其特征在于,在所述“提取所述多源异构数据的数据特征”之前,所述方法还包括:判断所述多源异构数据是否包括语音数据;所述“将所述数据特征输入卷积神经网络模型得到对应的第一文本信息”具体包括:若是,则将语音特征输入所述多尺寸多通道卷积神经网络模型中,获得与所述语音数据对应的第一文本信息;其中,所述数据特征包含所述语音特征;且/或,在所述“提取所述多源异构数据的数据特征”之前,所述方法还包括:判断所述多源异构数据是否包括视频数据;所述“将所述数据特征输入卷积神经网络模型得到对应的第一文本信息”具体包括:若是,则将所述视频特征输入所述蒸馏扩散模型中,获得与所述视频数据对应的第一
文本信息;其中,所述数据特征包含所述视频特征。8.根据权利要求7所述的文本语义匹配方法,其特征在于,所述方法还包括:将所述视频数据输入3D深度卷积神经网络模型中,得到所述视频特征。9.根据权利要求1所述的文本语义匹配方法,其特征在于,所述“提取对应于所述第一文本特征和所述第二文本特征的交互文本特征”具体包括:基于注意力机制,计...

【专利技术属性】
技术研发人员:曾谁飞孔令磊张景瑞刘卫强李敏
申请(专利权)人:青岛海尔智能技术研发有限公司海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1