一种语义信息融合方法、装置、电子设备及存储介质制造方法及图纸

技术编号：27935603 阅读：11 留言：0更新日期：2021-04-02 14:15

本申请实施例提供一种语义信息融合方法、装置、电子设备及存储介质，涉及语义信息融合技术领域。该方法包括利用语言模型根据每个类别单词对应的第一词嵌入向量获取句子的第二词嵌入向量；通过语料库获得每个类别单词对应的视觉特征描述；根据所述视觉特征描述获取融合视觉特征的句嵌入向量；将所述第二词嵌入向量和所述句嵌入向量按照预设的比例系数进行融合，以生成融合视觉特征后的词嵌入向量，在原有类别单词的词嵌入向量基础上，补充其他类别的视觉特征信息，从而缓解语义间隔造成的影响，解决现有方法中导致语义间隔的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种语义信息融合方法、装置、电子设备及存储介质
本申请涉及语义信息融合
，具体而言，涉及一种语义信息融合方法、装置、电子设备及存储介质。
技术介绍
目前在零样本图像分类任务中常使用词嵌入向量和属性向量这两种语义向量来表征类别，但普遍具有单词可能会产生歧义性和词嵌入向量与类别的视觉特征没有必然联系两个问题，从而导致语义间隔问题。
技术实现思路
本申请实施例的目的在于提供一种语义信息融合方法、装置、电子设备及存储介质，在原有类别单词的词嵌入向量基础上，补充其他类别的视觉特征信息，从而缓解语义间隔造成的影响，解决现有方法中导致语义间隔的问题。本申请实施例提供了一种语义信息融合方法，所述方法包括：利用语言模型根据每个类别单词对应的第一词嵌入向量获取句子的第二词嵌入向量；通过语料库获得每个类别单词对应的视觉特征描述；根据所述视觉特征描述获取融合视觉特征的句嵌入向量；将所述第二词嵌入向量和所述句嵌入向量按照预设的比例系数进行融合，以生成融合视觉特征后的词嵌入向量。在上述实现过程中，通过SIF算法融入视觉特征信息生成的词嵌入向量不仅具有较强的语义性，且在语义空间中与相近的类别也会更加相似，有效缓解语义间隔带来的影响。进一步地，所述利用语言模型根据每个类别单词对应的第一词嵌入向量获取句子的第二词嵌入向量，包括：通过Word2Vec模型或GloVe模型获取每个类别单词的第一词嵌入向量；根据所述第一词嵌入向量利用词袋模型获取句子的第二词嵌入...

【技术保护点】
1.一种语义信息融合方法，其特征在于，所述方法包括：/n利用语言模型根据每个类别单词对应的第一词嵌入向量获取句子的第二词嵌入向量；/n通过语料库获得每个类别单词对应的视觉特征描述；/n根据所述视觉特征描述获取融合视觉特征的句嵌入向量；/n将所述第二词嵌入向量和所述句嵌入向量按照预设的比例系数进行融合，以生成融合视觉特征后的词嵌入向量。/n

【技术特征摘要】
1.一种语义信息融合方法，其特征在于，所述方法包括：
利用语言模型根据每个类别单词对应的第一词嵌入向量获取句子的第二词嵌入向量；
通过语料库获得每个类别单词对应的视觉特征描述；
根据所述视觉特征描述获取融合视觉特征的句嵌入向量；
将所述第二词嵌入向量和所述句嵌入向量按照预设的比例系数进行融合，以生成融合视觉特征后的词嵌入向量。

2.根据权利要求1所述的语义信息融合方法，其特征在于，所述利用语言模型根据每个类别单词对应的第一词嵌入向量获取句子的第二词嵌入向量，包括：
通过Word2Vec模型或GloVe模型获取每个类别单词的第一词嵌入向量；
根据所述第一词嵌入向量利用词袋模型获取句子的第二词嵌入向量；
所述第二词嵌入向量表示为：

其中，vs表示所述句子的第二词嵌入向量，n表示所述句子中的单词总数，vi表示所述句子的第i个单词的第一词嵌入向量。

3.根据权利要求1所述的语义信息融合方法，其特征在于，所述通过语料库获得每个类别单词对应的视觉特征描述，包括：
通过爬虫的方式采集网络数据库中的视觉特征信息，以生成语料库；
获取所述语料库中的每个类别单词对应的视觉特征描述。

4.根据权利要求1所述的语义信息融合方法，其特征在于，所述根据所述视觉特征描述获取融合视觉特征的句嵌入向量，包括：
对所述视觉特征描述进行学习，以获取所述视觉特征描述的第三词嵌入向量；
利用Sent2Vec模型并结合n-gram的词和所述第三词嵌入向量，以获得所述句嵌入向量；
所述句嵌入向量表示为：

其中，R(W)表示句子W中出现n-gram的列表，vw表示单词w的第一词嵌入向量，vW表示句子W的句嵌入向量。

5.根据权利要求4所述的语义信息融合方法，其特征在于，所述将所述第二词嵌入向量和所述句嵌入向量按照预设的比例系数进行融合，以生成融合视觉特征后的词嵌入向量，包括：
获取所述比例系数，以生成词嵌入向量；
所述词嵌入向量表示为：
vf＝α...

【专利技术属性】
技术研发人员：任亮，傅雨梅，文齐辉，车倩，
申请(专利权)人：北京知因智慧科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人