多模态的融合方法、装置、设备及介质制造方法及图纸

技术编号：37764412 阅读：13 留言：0更新日期：2023-06-06 13:22

本发明专利技术涉及人工智能技术领域，提供了一种多模态的融合方法、装置、设备及介质，其中，方法包括：通过对多个模态进行编码，得到各个模态的特征向量，并进行预处理，得到各个模态对应的特征向量，根据各个目标特征向量对应的维度为每个目标特征向量设置多个权重矩阵，以获取暂时向量并进行逐元素相加，得到模态向量，并进行融合操作，得到多个模态对应的总向量，可以应用于电子商务，通过神经网络进行实现。本发明专利技术的有益效果：实现了保留更多的模态信息，使最终的总向量的融合效果更好。使最终的总向量的融合效果更好。使最终的总向量的融合效果更好。

全部详细技术资料下载

【技术实现步骤摘要】
多模态的融合方法、装置、设备及介质

[0001]本专利技术涉及人工智能
，特别涉及一种多模态的融合方法、装置、设备及介质。

技术介绍

[0002]目前，多模态学习已成为近年来不断研究的热点之一。模态指的是信息的来源或者形式，例如，一种信息可以通过视频、语音、图像、文字等多种形式进行表现，则每一种形式的表现都是该信息的一种模态。目前，在电子商务领域中，业内多模态特征融合一般是把多个模态的特征向量拼接在一起，然而这种方法会丢失许多的模态信息，导致融合的效果不理想。

技术实现思路

[0003]本专利技术的主要目的为提供一种多模态的融合方法、装置、设备及介质，旨在解决现有的多模态特征融合方法会丢失许多的模态信息，导致融合的效果不理想的问题。
[0004]本专利技术提供了一种多模态的融合方法，包括：
[0005]获取多个待融合的模态；
[0006]将各个所述待融合的模态经过编码器进行编码，得到各个所述待融合的模态对应的特征向量；
[0007]对所述特征向量进行预处理，得到各个所述特征向量的目标特征向量；其中预处理的方式为对所述特征向量进行增加或者减少维度；
[0008]根据各个所述目标特征向量对应的维度为每个所述目标特征向量设置多个权重矩阵；其中，所述权重矩阵的横列数量与所述目标特征向量的纵列数量相同，各个所述权重矩阵的纵列数量为预设值；
[0009]将各个所述目标特征向量与对应的多个所述权重矩阵相乘，得到各个所述目标特征向量分别对应的多个暂时向量，其中，所...

【技术保护点】

【技术特征摘要】
1.一种多模态的融合方法，其特征在于，包括：获取多个待融合的模态；将各个所述待融合的模态经过编码器进行编码，得到各个所述待融合的模态对应的特征向量；对所述特征向量进行预处理，得到各个所述特征向量的目标特征向量；其中预处理的方式为对所述特征向量进行增加或者减少维度；根据各个所述目标特征向量对应的维度为每个所述目标特征向量设置多个权重矩阵；其中，所述权重矩阵的横列数量与所述目标特征向量的纵列数量相同，各个所述权重矩阵的纵列数量为预设值；将各个所述目标特征向量与对应的多个所述权重矩阵相乘，得到各个所述目标特征向量分别对应的多个暂时向量，其中，所述暂时向量的数量与所述权重矩阵相同；将各个所述目标特征向量对应的多个所述暂时向量进行逐元素相加，得到各个所述目标特征向量对应的且纵列数量为预设值的模态向量；将所述模态向量进行融合操作，得到多个模态对应的总向量。2.如权利要求1所述的多模态的融合方法，其特征在于，所述对所述特征向量进行预处理，得到各个所述特征向量的目标特征向量的步骤，包括：对所述特征向量的最后一个位置增加一个标量为1的维度，得到目标特征向量。3.如权利要求1所述的多模态的融合方法，其特征在于，所述将所述模态向量进行融合操作，得到多个模态对应的总向量的步骤，包括：将各个模态向量进行向量内积操作，得到多个模态对应的总向量。4.如权利要求1所述的多模态的融合方法，其特征在于，所述将所述模态向量进行融合操作，得到多个模态对应的总向量的步骤，包括：将各个模态向量进行向量拼接，得到拼接向量；将所述拼接向量输入全连接层，在全连接层乘以n
×
m*m的权重，得到总向量；其中，n为模态向量的个数，m为所述预设值。5.如权利要求1所述的多模态的融合方法，其特征在于，所述将各个所述待融合的模态经过编码器进行编码，得到各个所述待融合的模态对应的特征向量的步骤，包括：获取各个模态的表现形式；其中表现形式至少包括文本、图像、语音三种表现形式；根据各个模态的表现形式设置对应的编码器；利用对应的编码器对各个模态进行编码，得到各个模态对应的特征向量。6.如权利要...

【专利技术属性】
技术研发人员：舒畅，陈又新，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人