文本语义匹配方法及制冷设备系统技术方案

技术编号:38364001 阅读:15 留言:0更新日期:2023-08-05 17:31
本发明专利技术揭示了一种文本语义匹配方法及制冷设备系统,方法包括:将总文本数据中可标注的文本进行标注;通过槽位抽取对总文本数据中不可标注的文本和已标注的文本均进行结果匹配;若匹配成功则输出匹配结果;若匹配失败则通过神经网络计算匹配结果。该文本语义匹配方法的匹配利用了先标注再槽位抽取机制,槽位抽取包括三种情况:未标注的经槽位抽取后匹配成功;标注的经槽位抽取后匹配成功;标注的经槽位抽取后匹配失败,对匹配失败的一类再通过深度融合网络模型及计算匹配;从而使文本整体的匹配速度大大提高,且匹配精准度高,提高了用户的使用体验。户的使用体验。户的使用体验。

【技术实现步骤摘要】
文本语义匹配方法及制冷设备系统


[0001]本专利技术涉及制冷设备
,尤其涉及一种文本语义匹配方法及制冷设备系统。

技术介绍

[0002]随着人工智能的进步,人们希望将人工智能引入冰箱领域,使冰箱更加智能化。在冰箱智能化的过程中,涉及大量的针对冰箱场景的优化过程,这种优化包括用户与冰箱的口语的、文本的、视频的各种类型的交互的优化,在优化的过程中,专利技术人发现现有技术存在这样的问题:
[0003]现有的交互的响应速度慢,且准确率不够高,不能达到用户即时清晰地交流的需求,使用户明显感受到人机对话的不便,而不是如人与人对话一般的自然,使用体验较差。

技术实现思路

[0004]为解决上述的现有技术问题中的至少其一,本专利技术的目的在于提供一种交互响应速度快、反馈的信息精准的文本语义匹配方法及制冷设备系统

[0005]为实现上述专利技术目的,本专利技术一实施方式提供一种文本语义匹配方法,包括如下步骤:
[0006]将总文本数据中可标注的文本进行标注;
[0007]通过槽位抽取对所述总文本数据中不可标注的文本和已标注的文本均进行结果匹配,并判断匹配的结果;
[0008]若匹配成功则输出匹配结果;
[0009]若匹配失败,将失败对应的文本数据传输至深度融合网络模型进行特征提取,再根据特征提取结果计算文本语义的匹配结果;其中,所述深度融合网络模型是文本向量化模型和多维度特征提取模型的融合模型,所述文本向量化模型将文本数据向量化,所述多维度特征提取模型提取多维度交互特征和关联特征。
[0010]作为本专利技术的进一步改进,所述步骤通过槽位抽取对所述总文本数据中不可标注的文本和已标注的文本均进行结果匹配包括:
[0011]通过规则引擎对所述总文本数据中不可标注的文本和已标注的文本均进行结果匹配;
[0012]当所述规则引擎检测出问题时,通过快速修复模块自动分析和修复规则定义,并重新通过规则引擎进行结果匹配。
[0013]作为本专利技术的进一步改进,还包括步骤:
[0014]当所述快速修复模块无法解决所述规则引擎检测出的问题、或者规则修复后所述规则引擎依旧无法进行结果匹配时,所述槽位抽取匹配失败;其中,所述问题包括规则定义不准确、规则冲突、或规则执行效率低下。
[0015]作为本专利技术的进一步改进,所述步骤若匹配失败还包括:
[0016]将失败对应的文本数据传输至深度融合网络模型进行特征提取,提取出交互特征;
[0017]计算交互特征之间的聚合交互特征信息;
[0018]计算交互特征之间的差异化交互特征信息;
[0019]根据特征信息、聚合交互特征信息、差异化交互特征信息,计算文本语义的匹配结果。
[0020]作为本专利技术的进一步改进,所述步骤计算交互特征之间的聚合交互特征信息包括:
[0021]通过注意力加权求和,计算交互特征之间的聚合交互特征信息;
[0022]所述步骤计算交互特征之间的差异化交互特征信息包括:
[0023]通过注意力机制增强,计算交互特征之间的差异化交互特征信息。
[0024]作为本专利技术的进一步改进,所述步骤对所述总文本数据中可标注的文本进行标注包括:
[0025]对可标注的文本依次进行预标注、正式标注和标注质检,其中,当文本经过正式标注的值经过标注质检判断低于预设阈值时,将该文本返回预标注中重新标注。
[0026]作为本专利技术的进一步改进,所述步骤将总文本数据中可标注的文本进行标注包括:
[0027]将总文本数据中可标注的文本进行标注,并将标注后的文本分别存储为训练数据和测试数据;
[0028]所述步骤将失败对应的文本数据传输至深度融合网络模型进行特征提取包括:
[0029]对于匹配失败的被标注的文本数据,用所述训练数据训练所述深度融合网络模型,用所述测试数据通过所述深度融合网络模型预测结果。
[0030]作为本专利技术的进一步改进,还包括步骤:
[0031]对所述总文本数据中不可标注的文本进行数据清洗;
[0032]所述步骤将失败对应的文本数据传输至深度融合网络模型进行特征提取包括:
[0033]对于匹配失败的不可标注的文本数据,采用无监督学习算法用所述不可标注的文本训练所述深度融合网络模型。
[0034]作为本专利技术的进一步改进,所述总文本数据是由多模态数据和/或多源异构数据全部转写为文本数据并汇总而成。
[0035]作为本专利技术的进一步改进,还包括步骤:
[0036]采集多模态数据和/或多源异构数据并预处理,其中,所述多模态数据包括与文本、音频和视频数据,所述预处理包括对所述多模态数据的清洗、格式转化和存储;
[0037]将视频数据转写为文本数据;
[0038]将音频数据转写为文本数据;
[0039]获取历史文本数据;
[0040]将所述多模态数据中的文本数据、所述音频数据转写的文本数据、所述视频数据转写的文本数据、以及所述历史文本数据汇总为所述总文本数据。
[0041]作为本专利技术的进一步改进,所述步骤将视频数据转写为文本数据包括:
[0042]将所述视频数据中的音频和图像分离,得到音频数据和图像数据;
[0043]识别所述图像数据中的文字信息,转写为文本数据;
[0044]基于时空和长距离依赖特征识别图像数据,转写为文本数据;
[0045]其中,所述步骤基于时空和长距离依赖特征识别图像,转写为文本数据包括:
[0046]将基于时空和长距离依赖特征识别图像通过知识蒸馏和扩散模型的融合模型生成学生模型,通过所述学生模型将图像数据转写为文本数据。
[0047]作为本专利技术的进一步改进,所述步骤将视频数据转写为文本数据包括:
[0048]通过扩散网络模型获取所述视频数据中的关键帧图像;
[0049]识别所述关键帧图像生成文本数据。
[0050]作为本专利技术的进一步改进,所述步骤将音频数据转写为文本数据包括:
[0051]结合的获取数据的场景下的语音时空特性和上下文关系特征,建立基于融合神经网络MMCNN

RNN、CTC、以及Attention的深度循环卷积网络模型将音频数据转写为文本数据。
[0052]作为本专利技术的进一步改进,所述历史文本数据包括历史记录数据和历史交互数据,其中,所述历史记录数据包括用户的食材偏好数据、兴趣数据和评论数据,所述历史交互数据包括从客户端或制冷设备的交互端获取的交互记录。
[0053]作为本专利技术的进一步改进,所述文本向量化模型对字、词、短语、句子层级文本编码;
[0054]所述多维度特征提取模型使用多头注意力机制,分别提取字、词、词语、句子交互与关联特征、上下文语义信息。
[0055]作为本专利技术的进一步改进,所述步骤再根据特征提取结果计算文本语义的匹配结果包括:将特征提取后的向量依次经过全连接层和自注本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本语义匹配方法,其特征在于,包括如下步骤:将总文本数据中可标注的文本进行标注;通过槽位抽取对所述总文本数据中不可标注的文本和已标注的文本均进行结果匹配,并判断匹配的结果;若匹配成功则输出匹配结果;若匹配失败,将失败对应的文本数据传输至深度融合网络模型进行特征提取,再根据特征提取结果计算文本语义的匹配结果;其中,所述深度融合网络模型是文本向量化模型和多维度特征提取模型的融合模型,所述文本向量化模型将文本数据向量化,所述多维度特征提取模型提取多维度交互特征和关联特征。2.根据权利要求1所述的文本语义匹配方法,其特征在于,所述步骤通过槽位抽取对所述总文本数据中不可标注的文本和已标注的文本均进行结果匹配包括:通过规则引擎对所述总文本数据中不可标注的文本和已标注的文本均进行结果匹配;当所述规则引擎检测出问题时,通过快速修复模块自动分析和修复规则定义,并重新通过规则引擎进行结果匹配。3.根据权利要求2所述的文本语义匹配方法,其特征在于,还包括步骤:当所述快速修复模块无法解决所述规则引擎检测出的问题、或者规则修复后所述规则引擎依旧无法进行结果匹配时,所述槽位抽取匹配失败;其中,所述问题包括规则定义不准确、规则冲突、或规则执行效率低下。4.根据权利要求1所述的文本语义匹配方法,其特征在于,所述步骤若匹配失败还包括:将失败对应的文本数据传输至深度融合网络模型进行特征提取,提取出交互特征;计算交互特征之间的聚合交互特征信息;计算交互特征之间的差异化交互特征信息;根据特征信息、聚合交互特征信息、差异化交互特征信息,计算文本语义的匹配结果。5.根据权利要求4所述的文本语义匹配方法,其特征在于,所述步骤计算交互特征之间的聚合交互特征信息包括:通过注意力加权求和,计算交互特征之间的聚合交互特征信息;所述步骤计算交互特征之间的差异化交互特征信息包括:通过注意力机制增强,计算交互特征之间的差异化交互特征信息。6.根据权利要求1所述的文本语义匹配方法,其特征在于,所述步骤对所述总文本数据中可标注的文本进行标注包括:对可标注的文本依次进行预标注、正式标注和标注质检,其中,当文本经过正式标注的值经过标注质检判断低于预设阈值时,将该文本返回预标注中重新标注。7.根据权利要求1所述的文本语义匹配方法,其特征在于,所述步骤将总文本数据中可标注的文本进行标注包括:将总文本数据中可标注的文本进行标注,并将标注后的文本分别存储为训练数据和测试数据;所述步骤将失败对应的文本数据传输至深度融合网络模型进行特征提取包括:对于匹配失败的被标注的文本数据,用所述训练数据训练所述深度融合网络模型,用
所述测试数据通过所述深度融合网络模型预测结果。8.根据权利要求1所述的文本语义匹配方法,其特征在于,还包括步骤:对所述总文本数据中不可标注的文本进行数据清洗;所述步骤将失败对应的文本数据传输至深度融合网络模型进行特征提取包括:对于匹配失败的不可标注的文本数据,采用...

【专利技术属性】
技术研发人员:曾谁飞李华刚孔令磊张景瑞刘卫强李敏
申请(专利权)人:青岛海尔智能技术研发有限公司海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1