相似度确定、网络训练、查找方法及装置和存储介质制造方法及图纸

技术编号:24011259 阅读:44 留言:0更新日期:2020-05-02 01:49
一种数据相似度确定方法和装置、非暂时性存储介质、神经网络的训练方法和装置以及相似对象查找方法。该数据相似度确定方法包括:获取第一对象的第一数据,其中,第一数据包括为第一模态或第二模态的第一子数据;将第一子数据映射为语义比较空间中的第一语义表示,其中,语义比较空间使得第一模态的数据映射至语义比较空间得到的语义表示以及第二模态的数据映射至语义比较空间得到的语义表示是可计算相似度的;获取第二对象的第二数据,其中,第二数据包括为第一模态或第二模态的第二子数据;将第二子数据映射为语义比较空间中的第二语义表示;至少基于第一语义表示和第二语义表示计算第一数据和第二数据之间的相似度。

Similarity determination, network training, search methods, devices and storage media

【技术实现步骤摘要】
相似度确定、网络训练、查找方法及装置和存储介质
本公开的实施例涉及一种数据相似度确定方法、数据相似度确定装置、非暂时性存储介质、用于数据相似度确定的神经网络的训练方法和装置、相似对象查找方法和装置。
技术介绍
随着医疗信息化的高速发展,电子医疗数据呈指数级增长。海量的电子医疗数据为开展大数据分析和挖掘提供了机会。例如,对于给定患者,可以从大量的电子医疗数据中找出与该给定患者相似的患者。这些与该给定患者相似的患者的诊断、治疗和康复等信息可以在以下方面作为重要参考:评估健康风险,选择治疗方案,估计住院时长和治疗费用,由此可以为给定患者提供个性化医疗服务,提高医疗服务质量。上述利用相似患者的信息提供个性化医疗服务的过程类似于医生在观测大量的临床案例数据后进行临床决策的过程,在临床上具有较大的意义。
技术实现思路
本公开的至少一个实施例提供了一种数据相似度确定方法,其包括:获取第一对象的第一数据,其中,所述第一数据包括为第一模态或第二模态的第一子数据;将所述第一子数据映射为语义比较空间中的第一语义表示,其中,所述语义比较空间使得为所述第一模态的数据映射至所述语义比较空间得到的语义表示以及为所述第二模态的数据映射至所述语义比较空间得到的语义表示是可计算相似度的;获取第二对象的第二数据,其中,所述第二数据包括为所述第一模态或所述第二模态的第二子数据;将所述第二子数据映射为所述语义比较空间中的第二语义表示;至少基于所述第一语义表示和所述第二语义表示计算所述第一数据和所述第二数据之间的相似度。例如,在所述数据相似度确定方法的至少一个示例中,所述第一模态是文本,所述第二模态是影像。例如,在所述数据相似度确定方法的至少一个示例中,所述第一数据包括为所述第一模态的第一子数据和为所述第二模态的第三子数据;所述第二数据包括为所述第一模态的第二子数据和为所述第二模态的第四子数据;所述第一对象包括第一特性,所述第一子数据包括描述所述第一特性的第一子语义,以及所述第三子数据包括描述所述第一特性的第三子语义;所述第二对象包括第二特性,所述第二子数据包括描述所述第二特性的第二子语义,以及所述第四子数据包括描述所述第二特性的第四子语义;所述方法还包括:将所述第三子数据映射为所述语义比较空间中的第三语义表示,以及将所述第四子数据映射为所述语义比较空间中的第四语义表示;所述至少基于所述第一语义表示和所述第二语义表示计算所述第一数据和所述第二数据之间的相似度包括:基于所述第一语义表示、所述第二语义表示、所述第三语义表示和所述第四语义表示得到所述第一数据和所述第二数据之间的相似度。例如,在所述数据相似度确定方法的至少一个示例中,基于所述第一语义表示、所述第二语义表示、所述第三语义表示和所述第四语义表示得到所述第一数据和所述第二数据之间的相似度包括:计算所述第一语义表示和所述第四语义表示之间的相似度以及所述第二语义表示和所述第三语义表示之间的相似度中的至少一个。例如,在所述数据相似度确定方法的至少一个示例中,基于所述第一语义表示、所述第二语义表示、所述第三语义表示和所述第四语义表示得到所述第一数据和所述第二数据之间的相似度还包括:计算所述第一语义表示和所述第二语义表示之间的相似度以及所述第三语义表示和所述第四语义表示之间的相似度中的至少一个。例如,在所述数据相似度确定方法的至少一个示例中,所述第一数据和所述第二数据之间的相似度等于所述第一语义表示和所述第四语义表示之间的相似度,所述第二语义表示和所述第三语义表示之间的相似度,所述第一语义表示和所述第二语义表示之间的相似度,以及所述第三语义表示和所述第四语义表示之间的相似度之和。例如,在所述数据相似度确定方法的至少一个示例中,所述第一语义表示、所述第二语义表示、所述第三语义表示和所述第四语义表示均表达为向量;以及所述第一语义表示对应的向量的维度,所述第二语义表示对应的向量的维度,所述第三语义表示对应的向量的维度,以及所述第四语义表示对应的向量的维度彼此相等。例如,在所述数据相似度确定方法的至少一个示例中,所述第一数据和所述第二数据之间的相似度f(pi,pj)采用下述的表达式获取:f(pi,pj)=f((ti,gi),(tj,gj))=sim1(ti,tj)+sim2(ti,gj)+sim2(gi,tj)+sim1(gi,gj),rti=NN1(ti),rgi=NN2(gi),rtj=NN1(tj),rgj=NN2(gj),其中,pi为所述第一数据,pj为所述第二数据,ti为所述第一子数据,gi为所述第三子数据,tj为所述第二子数据,gj为所述第四子数据,sim1(ti,tj)为所述第一子数据和所述第二子数据之间的相似度,sim1(gi,gj)为所述第三子数据和所述第四子数据之间的相似度,sim2(ti,gj)为所述第一子数据和所述第四子数据之间的相似度,sim2(gi,tj)为所述第二子数据和所述第三子数据之间的相似度,NN1为使用第一神经网络对对应的子数据进行映射,NN2为使用第二神经网络对对应的子数据进行映射,rti为所述第一语义表示,rgi为所述第三语义表示,rtj为所述第二语义表示,rgj为所述第四语义表示。例如,在所述数据相似度确定方法的至少一个示例中,使用第一神经网络将所述第一子数据映射为所述第一语义表示以及将所述第二子数据映射为所述第二语义表示;以及使用第二神经网络将所述第三子数据映射为所述第三语义表示以及将所述第四子数据映射为所述第四语义表示。本公开的至少一个实施例还提供了一种数据相似度确定装置,其包括:获取模块、映射模块和相似度计算模块。所述获取模块被配置为获取第一对象的第一数据以及第二对象的第二数据,所述第一数据包括为第一模态或第二模态的第一子数据,所述第二数据包括为所述第一模态或所述第二模态的第二子数据;所述映射模块被配置为将所述第一子数据映射为语义比较空间中的第一语义表示,并将所述第二子数据映射为所述语义比较空间中的第二语义表示,所述语义比较空间使得为所述第一模态的数据映射至所述语义比较空间得到的语义表示以及为所述第二模态的数据映射至所述语义比较空间得到的语义表示是可计算相似度的;以及所述相似度计算模块被配置为至少基于所述第一语义表示和所述第二语义表示计算所述第一数据和所述第二数据之间的相似度。例如,在所述数据相似度确定装置的至少一个示例中,所述第一数据包括为所述第一模态的第一子数据和为所述第二模态的第三子数据;所述第二数据包括为所述第一模态的第二子数据和为所述第二模态的第四子数据;所述第一对象包括第一特性,所述第一子数据包括描述所述第一特性的第一子语义,以及所述第三子数据包括描述所述第一特性的第三子语义;所述第二对象包括第二特性,所述第二子数据包括描述所述第二特性的第二子语义,以及所述第四子数据包括描述所述第二特性的第四子语义;所述映射模块还被配置为将所述第三子数据映射为所述语义比较空间中的第三语义表示,以及将所述第四子数据映射为所述语义比较空间中的第四本文档来自技高网...

【技术保护点】
1.一种数据相似度确定方法,包括:/n获取第一对象的第一数据,其中,所述第一数据包括为第一模态或第二模态的第一子数据;/n将所述第一子数据映射为语义比较空间中的第一语义表示,其中,所述语义比较空间使得为所述第一模态的数据映射至所述语义比较空间得到的语义表示以及为所述第二模态的数据映射至所述语义比较空间得到的语义表示是可计算相似度的;/n获取第二对象的第二数据,其中,所述第二数据包括为所述第一模态或所述第二模态的第二子数据;/n将所述第二子数据映射为所述语义比较空间中的第二语义表示;以及/n至少基于所述第一语义表示和所述第二语义表示计算所述第一数据和所述第二数据之间的相似度。/n

【技术特征摘要】
1.一种数据相似度确定方法,包括:
获取第一对象的第一数据,其中,所述第一数据包括为第一模态或第二模态的第一子数据;
将所述第一子数据映射为语义比较空间中的第一语义表示,其中,所述语义比较空间使得为所述第一模态的数据映射至所述语义比较空间得到的语义表示以及为所述第二模态的数据映射至所述语义比较空间得到的语义表示是可计算相似度的;
获取第二对象的第二数据,其中,所述第二数据包括为所述第一模态或所述第二模态的第二子数据;
将所述第二子数据映射为所述语义比较空间中的第二语义表示;以及
至少基于所述第一语义表示和所述第二语义表示计算所述第一数据和所述第二数据之间的相似度。


2.根据权利要求1所述的数据相似度确定方法,其中,所述第一模态是文本,所述第二模态是影像。


3.根据权利要求1所述的数据相似度确定方法,其中,所述第一数据包括为所述第一模态的第一子数据和为所述第二模态的第三子数据;
所述第二数据包括为所述第一模态的第二子数据和为所述第二模态的第四子数据;
所述第一对象包括第一特性,所述第一子数据包括描述所述第一特性的第一子语义,以及所述第三子数据包括描述所述第一特性的第三子语义;
所述第二对象包括第二特性,所述第二子数据包括描述所述第二特性的第二子语义,以及所述第四子数据包括描述所述第二特性的第四子语义;
所述方法还包括:
将所述第三子数据映射为所述语义比较空间中的第三语义表示,以及将所述第四子数据映射为所述语义比较空间中的第四语义表示;以及
所述至少基于所述第一语义表示和所述第二语义表示计算所述第一数据和所述第二数据之间的相似度包括:基于所述第一语义表示、所述第二语义表示、所述第三语义表示和所述第四语义表示得到所述第一数据和所述第二数据之间的相似度。


4.根据权利要求3所述的数据相似度确定方法,其中,基于所述第一语义表示、所述第二语义表示、所述第三语义表示和所述第四语义表示得到所述第一数据和所述第二数据之间的相似度包括:
计算所述第一语义表示和所述第四语义表示之间的相似度以及所述第二语义表示和所述第三语义表示之间的相似度中的至少一个。


5.根据权利要求4所述的数据相似度确定方法,其中,基于所述第一语义表示、所述第二语义表示、所述第三语义表示和所述第四语义表示得到所述第一数据和所述第二数据之间的相似度还包括:
计算所述第一语义表示和所述第二语义表示之间的相似度以及所述第三语义表示和所述第四语义表示之间的相似度中的至少一个。


6.根据权利要求5所述的数据相似度确定方法,其中,所述第一数据和所述第二数据之间的相似度等于所述第一语义表示和所述第四语义表示之间的相似度,所述第二语义表示和所述第三语义表示之间的相似度,所述第一语义表示和所述第二语义表示之间的相似度,以及所述第三语义表示和所述第四语义表示之间的相似度之和。


7.根据权利要求6所述的数据相似度确定方法,其中,所述第一语义表示、所述第二语义表示、所述第三语义表示和所述第四语义表示均表达为向量;
所述第一语义表示对应的向量的维度,所述第二语义表示对应的向量的维度,所述第三语义表示对应的向量的维度,以及所述第四语义表示对应的向量的维度彼此相等;以及
所述第一数据和所述第二数据之间的相似度f(pi,pj)采用下述的表达式获取:
f(pi,pj)=f((ti,gi),(tj,gj))=sim1(ti,tj)+sim2(ti,gj)+sim2(gi,tj)+sim1(gi,gj),
rti=NN1(ti),rgi=NN2(gi),rtj=NN1(tj),rgj=NN2(gj),












其中,pi为所述第一数据,pj为所述第二数据,
ti为所述第一子数据,gi为所述第三子数据,tj为所述第二子数据,gj为所述第四子数据,
sim1(ti,tj)为所述第一子数据和所述第二子数据之间的相似度,
sim1(gi,gj)为所述第三子数据和所述第四子数据之间的相似度,
sim2(ti,gj)为所述第一子...

【专利技术属性】
技术研发人员:张振中
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1