嵌入向量评估方法、装置与电子设备制造方法及图纸

技术编号:25346842 阅读:33 留言:0更新日期:2020-08-21 17:06
本发明专利技术实施例提供一种嵌入向量评估方法、装置与电子设备,其中方法包括:获取分别针对多个目标物生成的多个嵌入向量,并将所述嵌入向量进行两两配对;针对所有两两配对的嵌入向量,计算嵌入向量间的向量距离,并基于所述向量距离,获取所述目标物间相互关系的第一描述向量;确定所述目标物的指定属性特征的类型,并基于所述类型和所述第一描述向量,获取所述目标物间相互关系中关于所述指定属性特征的第二描述向量;获取所述目标物间关于所述指定属性特征的相互关系的实际度量向量,并基于所述实际度量向量和所述第二描述向量,对所述嵌入向量进行质量评估。本发明专利技术实施例能够有效提高对物品嵌入向量评估的准确性,并有效增强评估方案的适用性。

【技术实现步骤摘要】
嵌入向量评估方法、装置与电子设备
本专利技术涉及计算机应用
,更具体地,涉及一种嵌入向量评估方法、装置与电子设备。
技术介绍
无监督嵌入向量技术是一种通过无监督的学习算法得到物品的向量表示的技术,也即生成物品的嵌入向量的技术。在无监督嵌入向量技术中,学习的目标和嵌入向量的使用目标之间通常会存在不一致的问题,因此学习的损失函数无法直接表示物品的嵌入向量在具体任务中是否有效,也即无法评估生成的嵌入向量的质量的优劣。现有技术针对嵌入向量的评估具有很大的局限性。例如,在词向量有效性的评估中,通常是在语义理解数据集上评估词向量在该任务上的准确性。这种评估方法存在两大问题:其一,应用仅局限在自然语言处理(NaturalLanguageProcessing,NLP)领域,在其它很多业务领域无法复用;其二,并没有直接衡量词向量的效果,而是转化为其他任务效果的评估,结果不够准确。
技术实现思路
为了克服上述问题或者至少部分地解决上述问题,本专利技术实施例提供一种嵌入向量评估方法、装置与电子设备,用以有效提高对物品嵌入向量本文档来自技高网...

【技术保护点】
1.一种嵌入向量评估方法,其特征在于,包括:/n获取分别针对多个目标物生成的多个嵌入向量,并将所述嵌入向量进行两两配对;/n针对所有两两配对的嵌入向量,计算嵌入向量间的向量距离,并基于所述向量距离,获取所述目标物间相互关系的第一描述向量;/n确定所述目标物的指定属性特征的类型,并基于所述类型和所述第一描述向量,获取所述目标物间相互关系中关于所述指定属性特征的第二描述向量;/n获取所述目标物间关于所述指定属性特征的相互关系的实际度量向量,并基于所述实际度量向量和所述第二描述向量,对所述嵌入向量进行质量评估。/n

【技术特征摘要】
1.一种嵌入向量评估方法,其特征在于,包括:
获取分别针对多个目标物生成的多个嵌入向量,并将所述嵌入向量进行两两配对;
针对所有两两配对的嵌入向量,计算嵌入向量间的向量距离,并基于所述向量距离,获取所述目标物间相互关系的第一描述向量;
确定所述目标物的指定属性特征的类型,并基于所述类型和所述第一描述向量,获取所述目标物间相互关系中关于所述指定属性特征的第二描述向量;
获取所述目标物间关于所述指定属性特征的相互关系的实际度量向量,并基于所述实际度量向量和所述第二描述向量,对所述嵌入向量进行质量评估。


2.根据权利要求1所述的嵌入向量评估方法,其特征在于,若所述指定属性特征类型对应的指定属性特征为离散特征,则在所述对所述嵌入向量进行质量评估的步骤之前,还包括:
基于所述离散特征的各离散值分别对应的第二描述向量,计算所述离散特征间的平均距离,并利用所述平均距离更新所述第二描述向量;
相应的,所述对所述嵌入向量进行质量评估的步骤具体包括:根据所述实际度量向量与更新后的第二描述向量中对应相同的指定属性特征维度,确定所述实际度量向量和所述更新后的第二描述向量的对应关系;
对于任一对具有对应关系的实际度量向量和更新后的第二描述向量,计算所述实际度量向量中实际度量值维度与所述更新后的第二描述向量中平均距离维度之间的皮尔逊相关系数或者卡方值;
基于所述皮尔逊相关系数或者卡方值,确定所述实际度量值与所述离散特征间的平均距离的相关性,相关性越大,则判定所述嵌入向量的质量越高,反之质量越低;
其中,所述实际度量值是基于不同目标物分别对应的所述指定属性特征的实际取值,在所述指定属性特征间作函数变换计算获取的。


3.根据权利要求2所述的嵌入向量评估方法,其特征在于,在所述计算所述离散特征间的平均距离的步骤之后,还包括:
对于两两配对的嵌入向量,以对应的两个目标物中一个目标物的指定属性特征为横坐标,另一个目标物的指定属性特征为纵坐标,并以所述对应的两个目标物的指定属性特征间的平均距离为方格取值,绘制方格图,以根据所述方格图展示并定性评估所述嵌入向量的有效性。


4.根据权利要求1所述的嵌入向量评估方法,其特征在于,若所述指定属性特征类型对应的指定属性特征为连续特征,则所述对所述嵌入向量进行质量评估的步骤具体包括:
根据所述实际度量向量与所述第二描述向量中相同的指定属性特征维度,确定所述实际度量向量和所述第二描述向量的对应关系;
对于任一对具有对应关系的实际度量向量和第二描述向量,计算所述实际...

【专利技术属性】
技术研发人员:刘敏赵丽袁彬
申请(专利权)人:贝壳技术有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1