基于贝叶斯的数据匹配方法、装置、设备及可读存储介质制造方法及图纸

技术编号:31378052 阅读:24 留言:0更新日期:2021-12-15 11:18
本申请公开了一种基于贝叶斯的数据匹配方法、装置、设备及存储介质,涉及人工智能及智慧医疗技术领域,基于贝叶斯估计建立数据匹配模型,提取与目标数据相似的待匹配数据,有效去排除混淆因素带来的影响,提高分析准确率。所述方法包括:根据数据来源,将历史样本数据拆分为目标数据和待匹配数据;对目标数据和样本训练数据进行模型训练,得到数据匹配模型;将待匹配数据输入数据匹配模型,计算待匹配数据与目标数据之间的数据相似度和数据方差;查询预设相似度阈值和预设方差阈值,基于预设相似度阈值和预设方差阈值,在待匹配数据中确定数据相似度大于等于预设相似度阈值且数据方差小于等于预设方差阈值的目标匹配数据,将目标匹配数据输出。标匹配数据输出。标匹配数据输出。

【技术实现步骤摘要】
基于贝叶斯的数据匹配方法、装置、设备及可读存储介质


[0001]本申请涉及人工智能及智慧医疗
,特别是涉及一种基于贝叶斯的数据匹配方法、装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]随着智慧医疗技术的不断进步,医疗行业的不断发展,深度学习模型在疾病分析领域中应用广泛,在一些疾病的分析中,利用相关疾病的历史数据信息作为深度学习模型的训练样本,基于深度学习模型强大的数据学习能力和灵活的处理结构,能够辅助智慧医疗平台进行分析,提高相关疾病分析的准确率。
[0003]相关技术中,由于深度学习模型需要大量的训练样本,而在实际医疗场景中适合深度学习模型的单源训练样本较少,因此,在实际应用过程中一般会组合不同来源的多个数据源作为训练样本,提供给深度学习模型进行训练。
[0004]在实现本申请的过程中,申请人发现相关技术至少存在以下问题:
[0005]不同来源的数据存在一些混杂因素,在合并多个数据源进行训练时,如果不同数据源的分布不一致,即便扩充了数据集,任务训练的难度仍然很大,且深度学习模型无法有效排除混淆因素带本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于贝叶斯的数据匹配方法,其特征在于,包括:根据数据来源,将历史样本数据拆分为目标数据和待匹配数据,所述目标数据的数据来源指示所述目标数据来自于同一目标机构,所述待匹配数据的数据来源指示所述待匹配数据来自于与所述目标机构不同的多个其他机构;对所述目标数据和样本训练数据进行模型训练,得到数据匹配模型,所述样本训练数据是按照第一拆分比例在所述待匹配数据中提取得到的;将所述待匹配数据输入数据匹配模型,计算所述待匹配数据与目标数据之间的数据相似度和数据方差;查询预设相似度阈值和预设方差阈值,基于所述预设相似度阈值和所述预设方差阈值,在所述待匹配数据中确定目标匹配数据,将所述目标匹配数据输出,所述目标匹配数据的数据相似度大于等于所述预设相似度阈值且数据方差小于等于所述预设方差阈值。2.根据权利要求1所述的方法,其特征在于,所述根据数据来源,将历史样本数据拆分为目标数据和待匹配数据,包括:采集所述历史样本数据,查询所述历史样本数据的所述数据来源;按照所述数据来源,将所述数据来源指示所述历史样本数据为同一所述目标机构的所述历史样本数据,划分为所述目标数据;将所述数据来源指示所述待匹配数据来自于与所述目标机构不同的多个其他机构的所述历史样本数据,划分为所述待匹配数据。3.根据权利要求1所述的方法,其特征在于,所述对所述目标数据和样本训练数据进行模型训练,得到数据匹配模型,包括:按照第一预设拆分比例,对所述待匹配数据进行拆分,得到样本训练数据;对所述目标数据添加正样本标签,对所述样本训练数据添加负样本标签,将添加标签后的所述目标数据和所述样本训练数据作为训练数据集;按照第二预设拆分比例,将所述训练数据集进行拆分,得到模型训练集和模型验证集;基于贝叶斯估计功能,提取所述模型训练集的样本特征,按照所述样本特征,构建所述数据匹配模型。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:基于贝叶斯估计功能,提取所述模型验证集的所述样本特征,按照所述样本特征构建验证模型;将所述验证模型与所述数据匹配模型进行比对,确定所述验证模型与所述数据匹配模型之间的模型偏差量;运用自适应矩估计算法,按照所述模型偏差量指示的偏差特征,对所述样本特征的网络权重进行调整并重新训练所述数据匹配模型,直至所述验证模型和所述数据匹配模型之间的所述模型偏差量小于偏差量阈值。5.根据权利要求1所述的方法,其特征在于,所述将所述待匹配数据输入数据匹配模型,计算所述待匹配数据与目标数据之间的数据相似度和数据方差,包括:将所述待匹配数据输入至所述数据匹配模型,获取数据匹配预测值;统计所述待匹配数据的输...

【专利技术属性】
技术研发人员:孙瑜尧李响李晓宇
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1