当前位置: 首页 > 专利查询>青岛海尔智能技术研发有限公司海尔智家股份有限公司专利>正文

用于多模态数据的文本分类方法及装置、制冷设备、介质制造方法及图纸

技术编号：39146960 阅读：13 留言：0更新日期：2023-10-23 14:57

本申请涉及数据处理技术领域，公开一种用于多模态数据的文本分类方法，包括：根据多模态数据，获得文本信息、语音信息以及图像信息；根据语音信息以及图像信息，获得语音文本特征向量以及图像文本特征向量；对文本信息、语音文本特征向量以及图像文本特征向量进行文本预处理，获得短文本数据。本申请能够获得高质量的短文本，提升多模态数据短文本提取的有效性。本申请还公开一种用于多模态数据的文本分类装置及制冷设备、介质。介质。介质。

全部详细技术资料下载

【技术实现步骤摘要】
用于多模态数据的文本分类方法及装置、制冷设备、介质

[0001]本申请涉及数据处理
，例如涉及一种用于多模态数据的文本分类方法及装置、制冷设备、介质。

技术介绍

[0002]目前，随着多模态语音降噪技术、语音识别技术和信号处理技术的快速发展，从多模态数据中提取出用以实现交互的语音或者文本成为工业界的研究热点。在智能家居场景下，针对用户交互场景，智能认知与感知存在交互慢和反馈信息错误率高的问题，影响用户的产品体验。因此，如何从多模态数据中提取获得高质量的短文本，成为当前亟需解决的技术难题。
[0003]相关技术公开一种基于多模态深度学习的文本分类方法，包括：S01，获取实时音视频数据和历史音视频数据。S02，对实时音视频数据和历史音视频数据进行预处理，获取有效的语音数据和视频数据。S03，转写有效语音数据为语音文本数据。S04，获取有效视频数据中局部区域的视频图像，并转写视频图像为图像文本数据。S05，根据语音文本数据和图像文本数据，获得该文本数据的上下文信息和文本语义特征的权重信息。S06，将上下文信息和权重信息经全连接层组合后，输出至分类器计算得分得到分类结果信息，并判断音视频数据生成文本的类型信息。S07，输出生成文本的类别信息。
[0004]在实现本公开实施例的过程中，发现相关技术中至少存在如下问题：
[0005]相关技术选取实时音视频数据和历史音视频数据作为参考数据，通过参考数据生成交互场景的文本。虽然实时音视频数据和历史音视频数据包含有文本特征，但是，多模态数据的数据来源不限于...

【技术保护点】

【技术特征摘要】
1.一种用于多模态数据的文本分类方法，其特征在于，包括：根据多模态数据，获得文本信息、语音信息以及图像信息；根据语音信息以及图像信息，获得语音文本特征向量以及图像文本特征向量；对文本信息、语音文本特征向量以及图像文本特征向量进行文本预处理，获得短文本数据。2.根据权利要求1所述的方法，其特征在于，所述根据语音信息以及图像信息，获得语音文本特征向量以及图像文本特征向量，包括：对语音信息进行预处理，获得有效语音数据以及有效视频数据；对有效语音数据进行语音识别处理，获得语音文本特征向量；根据有效视频数据以及图像信息，获得图像文本特征向量。3.根据权利要求2所述的方法，其特征在于，所述根据有效视频数据以及图像信息，获得图像文本特征向量，包括：对有效视频数据进行帧提取处理，获得第二图像数据；对图像信息进行过滤处理，获得第一图像数据；对第一图像数据以及第二图像数据进行图像合成处理，获得图像数据；输入图像数据至第一深度神经网络模型进行模型训练，获得图像文本特征向量。4.根据权利要求3所述的方法，其特征在于，所述第一深度神经网络模型包括迁移与蒸馏扩散深度融合模型。5.根据权利要求2所述的方法，其特征在于，所述对有效语音数据进行语音识别处理，获得语音文本特征向量，包括：输入有效语音数据至编码器进行语音编码，获得语音编码数据；输入语音编码数据至解码器进行语音解码，获得语音文本特征向量。6.根据权利要求1至5任一项所述的方法，其特征在于，所述对文本信息、语音文本特征向量以及图像文本特征向量进行文本预处理，获得短文本数据，包括：提取文本信息、语音文本特征向量以及图像文本特征向量各自的短文本信息；汇集文本信息、语音文本特征向量以及图像文本特征向量各自的短文本信息，获得短文本数据。7.根据权利要求1至5任一项所述的方法，其特征在于，还包括：对短文本数据进行数据标注处理，获得待质检数据；在待质检数据满足质检要求的情况下，利用已训练完成的Bert模型对待质检数据进行文本特征提取，获得目标短文本特征数据；利用FocalLoss损失函数对目标短文本特征数据进行短文本分类处理，获得目标短文本数据。8.根据权利要求7所述的方法，其特征在于，按照以下方式训练Bert模型：以基准网络参数对初始Bert模型进行模型训练，获得模型训练后的网络参数以及排序信息；根据模型训练后的网络参数以及排序信息，确定网络参数的目标数量；利用目标数量的网络参数训练初始Bert模型，获得已训练完成的Bert模型。9.根据权利要求8所述的方法，其特征在于，所述利用目标数量的网络参...

【专利技术属性】
技术研发人员：曾谁飞，刘卫强，李敏，孔令磊，张景瑞，谢充，吴国章，窦振东，谭夏霞，李京昌，葛宗玉，魏倩，马全亭，
申请(专利权)人：青岛海尔智能技术研发有限公司海尔智家股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人