特征提取方法、装置、存储介质及电子设备制造方法及图纸

技术编号:34014743 阅读:21 留言:0更新日期:2022-07-02 15:28
本公开涉及一种特征提取方法、装置、存储介质及电子设备,以捕捉查询向量之间更细粒度的特征关联信息,减少近似误差,得到更能表征数据语义的高层特征信息。该方法包括:确定待提取特征的目标数据,基于目标数据确定多个查询向量、多个键向量和多个值向量;确定每一查询向量对应的多个键值对信息,每一键值对信息是基于多个键向量、多个值向量和一数据样本确定的,其中用于确定多个键值对信息的多个数据样本是基于多个概率分布进行采样得到的,多个概率分布基于多个查询向量确定;针对每一查询向量,基于查询向量和多个数据样本进行随机映射,得到多个随机查询向量,基于多个随机查询向量和多个键值对信息,确定查询向量对应的特征信息。征信息。征信息。

【技术实现步骤摘要】
特征提取方法、装置、存储介质及电子设备


[0001]本公开涉及数据处理
,具体地,涉及一种特征提取方法、装置、存储介质及电子设备。

技术介绍

[0002]随着计算机技术的不断发展,神经网络模型可以通过自注意力机制(self

attention mechanism)对输入序列中任意两个元素之间的关系建模,从而捕捉输入序列中长距离元素之间的依赖关系。相关技术中存在多种注意力机制,其中随机特征注意力机制(Random Feature Attention,RFA)可以将传统自注意力机制中计算相似度的函数线性化,以提高计算效率。但是,此种随机特征注意力机制是一种有偏估计,具有较大的近似误差,从而会影响模型输出结果的准确性。

技术实现思路

[0003]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004]第一方面,本公开提供一种特征提取方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种特征提取方法,其特征在于,所述方法包括:确定待提取特征的目标数据,并基于所述目标数据确定多个查询向量、多个键向量和多个值向量;确定每一所述查询向量对应的多个键值对信息,其中,每一所述键值对信息是基于所述多个键向量、所述多个值向量和一数据样本确定的,且用于确定所述多个键值对信息的多个所述数据样本是基于多个概率分布进行采样得到的,所述多个概率分布是基于所述多个查询向量确定的;针对每一所述查询向量,基于所述查询向量和所述多个数据样本进行随机映射,得到多个随机查询向量,并基于所述多个随机查询向量和所述多个键值对信息,确定所述查询向量对应的特征信息。2.根据权利要求1所述的方法,其特征在于,所述确定每一所述查询向量对应的多个键值对信息,包括:根据每个查询向量确定一概率分布,并按照第一预设数量,基于每个查询向量对应的所述概率分布进行采样,得到每个所述查询向量对应的多个数据样本,其中所述第一预设数量用于表征期望的样本数量;针对每个查询向量,基于所述多个键向量、所述多个值向量和所述查询向量对应的多个数据样本,确定多个键值对信息。3.根据权利要求1所述的方法,其特征在于,所述确定每一所述查询向量对应的多个键值对信息,包括:按照第二预设数量将所述多个查询向量划分为多个查询向量组,其中所述第二预设数量用于表征期望的查询向量组的数量,且所述第二预设数量小于所述多个查询向量的数量;根据每个查询向量组确定一概率分布,并根据每个查询向量组对应的所述概率分布采样一数据样本,得到多个数据样本;根据每个数据样本、所述多个键向量和所述多个值向量,确定一键值对信息,得到多个共用键值对信息;将所述多个共用键值对信息确定为每一所述查询向量对应的多个键值对信息。4.根据权利要求3所述的方法,其特征在于,所述基于所述多个随机查询向量和所述多个键值对信息,确定所述查询向量对应的特征信息,包括:确定每个查询向量组对应的概率分布与多个查询向量组对应的概率分布之间的第一相似度,并针对每个查询向量,确定所述查询向量与每个查询向量组的平均查询向量之间的第二相似度;根据所述第一相似度和所述第二相似度,确定计算权重;根据所述计算权重,将所述多个随机查询向量和所述多个键值对信息进行加权求和,得到所述查询向量对应的特征信息。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:针对每个查询向量组对应的概率分布,根据所述概率分布和标准正态分布,确定所述概率分布对应的重要性采样权重;所述根据所述计算权重,将所述多个随机查询向量和所述多个键值对信息进行加权求
和,得到所述查询向量对应的特征信息,包括:将所述计算权重和所述重要性采样权重的乘积确定为目标...

【专利技术属性】
技术研发人员:王崇郑琳
申请(专利权)人:脸萌有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1