临床药物试验患者的匹配方法、装置及计算机设备制造方法及图纸

技术编号:33632143 阅读:16 留言:0更新日期:2022-06-02 01:37
本发明专利技术公开了一种临床药物试验患者的匹配方法、装置及计算机设备,涉及计算机技术领域,可解决目前在进行临床药物试验患者的匹配时,工作量大,效率较低,且容易造成错误累计以及信息损失的技术问题。其中方法包括:获取试验患者的患者信息以及医药试验入排条件信息,患者信息包括第一数值类信息和就诊信息,医药试验入排条件信息包括第二数值类信息和描述信息;将第一数值类信息和第二数值类信息进行数值匹配,获取第一匹配结果;对就诊信息和描述信息进行预处理,将预处理后的就诊信息和描述信息进行嵌入匹配,获取第二匹配结果;根据第一匹配结果和第二匹配结果生成试验患者与医药试验的最终匹配结果。医药试验的最终匹配结果。医药试验的最终匹配结果。

【技术实现步骤摘要】
临床药物试验患者的匹配方法、装置及计算机设备


[0001]本申请涉及计算机
,尤其涉及到一种临床药物试验患者的匹配方法、装置及计算机设备。

技术介绍

[0002]临床药物创新研发在我国政策的鼓励下发展迅速,一个难题是如何在药物的临床试验阶段为创新药找到合适的患者进行试验。进行试验的不同药物对患者的情况有不同的要求,如要求患者以往治疗中未用过含吉西他滨的药物;可以允许患者患有乙肝,但乙肝定量不能超过2000IU/mL等,如何在众多非结构化语言描述和数值描述的条件(药物试验的入排条件)下,为药物试验找到合适的患者,是一个工作量巨大且容易出错的任务。
[0003]药物试验的入排条件一般用非结构化的自然语言描述,而患者信息(年龄、诊断结果、手术治疗、药物治疗等)则是结构化的信息,如何对两者进行匹配,一种常规的思路是采用常见的NLP技术如分词、NER等对句子描述的入排条件进行预处理结构化,然后再与患者信息进行匹配。然而这种方法是分步单独处理的,导致工作量大,效率较低,且容易造成错误累计以及信息损失。

技术实现思路

[0004]有鉴于此,本申请提供了一种临床药物试验患者的匹配方法、装置及计算机设备,可用于解决目前在进行临床药物试验患者的匹配时,工作量大,效率较低,且容易造成错误累计以及信息损失的技术问题。
[0005]根据本申请的一个方面,提供了一种临床药物试验患者的匹配方法,该方法包括:
[0006]获取试验患者的患者信息以及药物试验入排条件信息,所述患者信息包括第一数值类信息和就诊信息,所述药物试验入排条件信息包括第二数值类信息和描述信息;
[0007]将所述第一数值类信息和所述第二数值类信息进行数值匹配,获取第一匹配结果;
[0008]对所述就诊信息和所述描述信息进行预处理,将预处理后的所述就诊信息和所述描述信息进行嵌入匹配,获取第二匹配结果;
[0009]根据所述第一匹配结果和第二匹配结果生成所述试验患者与医药试验的最终匹配结果。
[0010]可选地,所述将所述第一数值类信息和所述第二数值类信息进行数值匹配,获取第一匹配结果,包括:
[0011]对所述第一数值类信息和所述第二数值类信息分别进行三元素提取,并基于所述三元素生成所述第一数值类信息对应的患者信息三元组,以及生成所述第二数值类信息对应的入排条件信息三元组,其中,所述患者信息三元组包括患者数据项的数值、患者数据项单位以及患者数据项含义,所述入排条件信息三元组包括预设数据项的数值条件、预设数据项单位以及预设数据项含义;
[0012]基于所述预设数据项单位、所述预设数据项含义,以及所述患者数据项单位以及患者数据项含义,在所述患者信息三元组中筛选与所述预设数据项匹配的目标患者数据项;
[0013]将所述目标患者数据项的数值与所述预设数据项的数值条件进行对比,获取得到第一匹配结果。
[0014]可选地,所述对所述就诊信息和所述描述信息进行预处理,包括:
[0015]对所述就诊信息中每一字段的字段值进行独热编码处理,得到高维二值向量,并采用预设降维算法将所述高维二值向量进行低维表示学习,得到所述就诊信息对应的第一特征向量;
[0016]将所述描述信息输入预训练完成的语言表征模型,得到所述描述信息对应的第二特征向量;
[0017]对所述第一特征向量和所述第二特征向量进行归一化处理,以使所述第一特征向量和所述第二特征向量处于同一特征空间维度。
[0018]可选地,所述语言表征模型为BERT语言模型,在将所述描述信息输入预训练完成的语言表征模型,得到所述描述信息对应的第二特征向量之前,所述方法还包括:
[0019]获取样本描述信息,以及所述样本描述信息对应的样本特征向量;
[0020]对所述样本描述信息随机进行部分数据遮盖后,输入初始BERT语言模型,以输出训练结果;
[0021]计算所述训练结果与所述样本特征向量的损失值;
[0022]若所述损失值达到模型收敛要求,则将所述初始BERT语言模型确定为所述语言表征模型;
[0023]若所述损失值未达到模型收敛要求,则更新所述初始BERT语言模型的模型参数,并对更新后的初始BERT语言模型进行迭代训练,直至所述损失值符合模型收敛要求,将符合所述模型收敛要求的初始BERT语言模型确定为所述语言表征模型。
[0024]可选地,所述将预处理后的所述就诊信息和所述描述信息进行嵌入匹配,获取第二匹配结果,包括:
[0025]将处于同一特征空间维度的所述第一特征向量和所述第二特征向量输入深度为2的神经网络中,得到匹配分值;
[0026]将所述匹配分值与预设阈值进行对比,获取第二匹配结果。
[0027]可选地,在对所述就诊信息和所述描述信息进行预处理,将预处理后的所述就诊信息和所述描述信息进行嵌入匹配,获取第二匹配结果之前,还包括:
[0028]根据所述第一匹配结果判断所述试验患者与医药试验是否匹配成功;
[0029]若是,则对所述就诊信息和所述描述信息进行预处理,将预处理后的所述就诊信息和所述描述信息进行嵌入匹配,获取第二匹配结果;根据所述第一匹配结果和第二匹配结果生成所述试验患者与医药试验的最终匹配结果;
[0030]若否,则输出所述试验患者与医药试验匹配失败的最终匹配结果。
[0031]可选地,所述根据所述第一匹配结果和第二匹配结果生成所述试验患者与医药试验的最终匹配结果,其特征在于,包括:
[0032]若判断所述第一匹配结果和第二匹配结果为匹配成功,则输出所述试验患者与医
药试验匹配成功的最终匹配结果;
[0033]若判断所述第一匹配结果和第二匹配结果中至少一个为匹配失败,则输出所述试验患者与医药试验匹配失败的最终匹配结果。
[0034]根据本申请的另一个方面,提供了一种临床药物试验患者的匹配装置,该装置包括:
[0035]获取模块,用于获取试验患者的患者信息以及药物试验入排条件信息,所述患者信息包括第一数值类信息和就诊信息,所述药物试验入排条件信息包括第二数值类信息和描述信息;
[0036]第一匹配模块,用于将所述第一数值类信息和所述第二数值类信息进行数值匹配,获取第一匹配结果;
[0037]第二匹配模块,用于对所述就诊信息和所述描述信息进行预处理,将预处理后的所述就诊信息和所述描述信息进行嵌入匹配,获取第二匹配结果;
[0038]生成模块,用于根据所述第一匹配结果和第二匹配结果生成所述试验患者与医药试验的最终匹配结果。
[0039]可选地,所述第一匹配模块,包括:第一生成单元、筛选单元、第一对比单元;
[0040]所述第一生成单元,用于对所述第一数值类信息和所述第二数值类信息分别进行三元素提取,并基于所述三元素生成所述第一数值类信息对应的患者信息三元组,以及生成所述第二数值类信息对应的入排条件信息三元组,其中,所述患者信息三元组包括患者数据项的数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种临床药物试验患者的匹配方法,其特征在于,包括:获取试验患者的患者信息以及医药试验入排条件信息,所述患者信息包括第一数值类信息和就诊信息,所述医药试验入排条件信息包括第二数值类信息和描述信息;将所述第一数值类信息和所述第二数值类信息进行数值匹配,获取第一匹配结果;对所述就诊信息和所述描述信息进行预处理,将预处理后的所述就诊信息和所述描述信息进行嵌入匹配,获取第二匹配结果;根据所述第一匹配结果和第二匹配结果生成所述试验患者与医药试验的最终匹配结果。2.根据权利要求1所述的方法,其特征在于,所述将所述第一数值类信息和所述第二数值类信息进行数值匹配,获取第一匹配结果,包括:对所述第一数值类信息和所述第二数值类信息分别进行三元素提取,并基于所述三元素生成所述第一数值类信息对应的患者信息三元组,以及生成所述第二数值类信息对应的入排条件信息三元组,其中,所述患者信息三元组包括患者数据项的数值、患者数据项单位以及患者数据项含义,所述入排条件信息三元组包括预设数据项的数值条件、预设数据项单位以及预设数据项含义;基于所述预设数据项单位、所述预设数据项含义,以及所述患者数据项单位以及患者数据项含义,在所述患者信息三元组中筛选与所述预设数据项匹配的目标患者数据项;将所述目标患者数据项的数值与所述预设数据项的数值条件进行对比,获取得到第一匹配结果。3.根据权利要求1所述的方法,其特征在于,所述对所述就诊信息和所述描述信息进行预处理,包括:对所述就诊信息中每一字段的字段值进行独热编码处理,得到高维二值向量,并采用预设降维算法将所述高维二值向量进行低维表示学习,得到所述就诊信息对应的第一特征向量;将所述描述信息输入预训练完成的语言表征模型,得到所述描述信息对应的第二特征向量;对所述第一特征向量和所述第二特征向量进行归一化处理,以使所述第一特征向量和所述第二特征向量处于同一特征空间维度。4.根据权利要求3所述的方法,其特征在于,所述语言表征模型为BERT语言模型,在将所述描述信息输入预训练完成的语言表征模型,得到所述描述信息对应的第二特征向量之前,所述方法还包括:获取样本描述信息,以及所述样本描述信息对应的样本特征向量;对所述样本描述信息随机进行部分数据遮盖后,输入初始BERT语言模型,以输出训练结果;计算所述训练结果与所述样本特征向量的损失值;若所述损失值达到模型收敛要求,则将所述初始BERT语言模型确定为所述语言表征模型;若所述损失值未达到模型收敛要求,则更新所述初始BERT语言模型的模型参数,并...

【专利技术属性】
技术研发人员:刘海伦黄明星李银锋董婉吴志超王月宝黄平沈鹏
申请(专利权)人:北京健康之家科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1