一种基于互联网的医学检测项目的构建方法技术

技术编号:38582271 阅读:15 留言:0更新日期:2023-08-26 23:26
本发明专利技术涉及一种基于互联网的医学检测项目的构建方法,包括:在目标门诊病历集中提取患者主诉词集,对每个患者主诉词语进行重复频次排序,得到患者主诉词语序列,在患者主诉词语序列中提取主诉词语聚类集,在主诉词语聚类集中提取最大聚类中心值对应的主诉词语聚类,将最大聚类中心值对应的主诉词语聚类作为标准主诉聚类,得到标准主诉聚类集,计算当前主诉词集与每一个标准主诉聚类的相似度集,根据相似度集,在准主诉聚类集中提取相似度大于相似阈值的标准主诉聚类,得到目标主诉聚类集,将目标主诉聚类集对应的医学检测项目集作为目标医学检测项目集。本发明专利技术可以解决医学检测项目的获取存在耗费人力大、精准度差的问题。精准度差的问题。精准度差的问题。

【技术实现步骤摘要】
一种基于互联网的医学检测项目的构建方法


[0001]本专利技术涉及激光处理
,尤其涉及一种基于互联网的医学检测项目的构建方法。

技术介绍

[0002]医学检测项目是对人体器官或部位进行的医学测试项目,医学检测项目包含多种类别,例如:胃镜检查、血常规检查、x光检查、ct检查、MRI检查以及心电图检查等等。医学检测是诊断疾病、监测疾病进展以及健康检查的重要手段。
[0003]当前患者到医院就诊时,通常是患者向医生口述自己的病情,再由医生撰写病人主诉。医生在充分与患者进行沟通并了解基本病况后即可提出各项医学检测项目的建议。患者根据医生建议的医学检测项目再去进行身体检查。但这种方式下的医学检测项目需要医生根据自己的专业知识及从医经验进行确定,因此医学检测项目的获取存在耗费人力大、精准度差的问题。

技术实现思路

[0004]本专利技术提供一种基于互联网的医学检测项目的构建方法其主要目的在于解决医学检测项目的获取存在耗费人力大、精准度差的问题。
[0005]为实现上述目的,本专利技术提供的一种基于互联网的医学检测项目的构建方法,包括:
[0006]在预构建的局域互联网中提取历史门诊病历集及医学检测项目集,在所述医学检测项目集中依次提取医学检测项目;
[0007]在所述历史门诊病历集中提取包含所述医学检测项目的历史门诊病历,得到目标门诊病历集,在所述目标门诊病历集中提取患者主诉词集;
[0008]获取所述患者主诉词集中每个患者主诉词语的重复频次,根据所述重复频次对所述患者主诉词集中每个患者主诉词语进行重复频次排序,得到患者主诉词语序列;
[0009]根据预构建的聚类算法在所述患者主诉词语序列中提取主诉词语聚类集,在所述主诉词语聚类集中提取最大聚类中心值对应的主诉词语聚类;
[0010]将所述最大聚类中心值对应的主诉词语聚类作为所述医学检测项目的标准主诉聚类,汇总所有医学检测项目的标准主诉聚类,得到标准主诉聚类集;
[0011]接收用户输入的当前主诉词集,利用预构建的相似度计算公式,计算所述当前主诉词集与标准主诉聚类集中每一个标准主诉聚类的相似度,得到相似度集,所述相似度计算公式如下所示:
[0012][0013]其中,S
i
表示第i个标准主诉聚类与所述当前主诉词集的相似度,a表示对数底数,N
i
表示第i个标准主诉聚类的词语总数,c
i
表示当前主诉词集与第i个标准主诉聚类的词语
重复数;
[0014]根据所述相似度集,在所述标准主诉聚类集中提取相似度大于预设相似阈值的标准主诉聚类,得到目标主诉聚类集,将所述目标主诉聚类集对应的医学检测项目集作为所述用户的目标医学检测项目集。
[0015]可选地,所述根据预构建的聚类算法在所述患者主诉词语序列中提取主诉词语聚类集,包括:
[0016]根据所述患者主诉词语序列中每个患者主诉词语的重复频次构建主诉词语频次序列;
[0017]在所述主诉词语频次序列中随机选取两个重复频次,将所述两个重复频次作为初始聚类中心组;
[0018]根据所述初始聚类中心组对所述主诉词语频次序列进行分类,得到第一初始频次聚类及第二初始频次聚类;
[0019]判断所述第一初始频次聚类及第二初始频次聚类中是否存在不同的初始聚类中心组将所述主诉词语频次序列进行再分类;
[0020]若所述第一初始频次聚类及第二初始频次聚类中存在不同的初始聚类中心组将所述主诉词语频次序列进行再分类,则返回上述在所述主诉词语频次序列中随机选取两个重复频次的步骤;
[0021]若所述第一初始频次聚类及第二初始频次聚类中不存在不同的初始聚类中心组将所述主诉词语频次序列进行再分类,则根据所述第一初始频次聚类及第二初始频次聚类获取主诉词语聚类集。
[0022]可选地,所述根据所述初始聚类中心组对所述主诉词语频次序列进行分类,得到第一初始频次聚类及第二初始频次聚类,包括:
[0023]在所述主诉词语频次序列中依次提取待归类频次,判断所述待归类频次与所述初始聚类中心组中两个聚类中心的差值的大小;
[0024]若所述待归类重复频次与所述初始聚类中心组中第一个聚类中心的差值小于等于所述待归类重复频次与所述初始聚类中心组中第二个聚类中心的差值,则将所述待归类重复频次归类为第一个聚类中心;
[0025]若所述待归类重复频次与所述初始聚类中心组中第一个聚类中心的差值不小于等于所述待归类重复频次与所述初始聚类中心组中第二个聚类中心的差值,则将所述待归类重复频次归类为第二个聚类中心,直至完成主诉词语频次序列中所有待归类重复频次的归类,得到所述第一初始频次聚类及第二初始频次聚类。
[0026]可选地,所述判断所述第一初始频次聚类及第二初始频次聚类中是否存在不同的初始聚类中心组将所述主诉词语频次序列进行再分类,包括:
[0027]分别在所述第一初始频次聚类及第二初始频次聚类中依次提取第一重复频次及第二重复频次;
[0028]依次组合所述第一重复频次及第二重复频次,得到校验聚类中心组;
[0029]根据所述校验聚类中心组对所述主诉词语频次序列进行再分类,得到第一校验频次聚类及第二校验频次聚类;
[0030]判断所述第一校验频次聚类及第二校验频次聚类分别与所述第一初始频次聚类
及第二初始频次聚类是否相同;
[0031]若所述第一校验频次聚类及第二校验频次聚类不分别与所述第一初始频次聚类及第二初始频次聚类相同,则所述第一初始频次聚类及第二初始频次聚类中存在不同的初始聚类中心组将所述主诉词语频次序列进行再分类;
[0032]若所述第一校验频次聚类及第二校验频次聚类分别与所述第一初始频次聚类及第二初始频次聚类相同,则所述第一初始频次聚类及第二初始频次聚类中不存在不同的初始聚类中心组将所述主诉词语频次序列进行再分类。
[0033]可选地,所述根据所述第一初始频次聚类及第二初始频次聚类获取主诉词语聚类集,包括:
[0034]分别获取所述第一初始频次聚类中重复频次及第二初始频次聚类中重复频次与患者主诉词语序列的第一对应关系及第二对应关系;
[0035]根据所述第一对应关系及第二对应关系在所述患者主诉词语序列提取第一主诉词语聚类及第二主诉词语聚类,得到主诉词语聚类集。
[0036]可选地,所述在所述目标门诊病历集中提取患者主诉词集,包括:
[0037]在所述目标门诊病历集中提取患者主诉语段集;
[0038]对所述患者主诉语段集进行分词处理,得到患者主诉词集。
[0039]可选地,所述获取所述患者主诉词集中每个患者主诉词语的重复频次,包括:
[0040]根据目标门诊病历对所述患者主诉词集进行分类,得到不同患者对应的患者主诉词组集合;
[0041]根据所述患者主诉词组集合中不同患者主诉词组之间患者主诉词语的重复频次统计每个患者主诉词语的重复频次。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于互联网的医学检测项目的构建方法,其特征在于,所述方法包括:在预构建的局域互联网中提取历史门诊病历集及医学检测项目集,在所述医学检测项目集中依次提取医学检测项目;在所述历史门诊病历集中提取包含所述医学检测项目的历史门诊病历,得到目标门诊病历集,在所述目标门诊病历集中提取患者主诉词集;获取所述患者主诉词集中每个患者主诉词语的重复频次,根据所述重复频次对所述患者主诉词集中每个患者主诉词语进行重复频次排序,得到患者主诉词语序列;根据预构建的聚类算法在所述患者主诉词语序列中提取主诉词语聚类集,在所述主诉词语聚类集中提取最大聚类中心值对应的主诉词语聚类;将所述最大聚类中心值对应的主诉词语聚类作为所述医学检测项目的标准主诉聚类,汇总所有医学检测项目的标准主诉聚类,得到标准主诉聚类集;接收用户输入的当前主诉词集,利用预构建的相似度计算公式,计算所述当前主诉词集与标准主诉聚类集中每一个标准主诉聚类的相似度,得到相似度集,所述相似度计算公式如下所示:其中,S
i
表示第i个标准主诉聚类与所述当前主诉词集的相似度,a表示对数底数,N
i
表示第i个标准主诉聚类的词语总数,c
i
表示当前主诉词集与第i个标准主诉聚类的词语重复数;根据所述相似度集,在所述标准主诉聚类集中提取相似度大于预设相似阈值的标准主诉聚类,得到目标主诉聚类集,将所述目标主诉聚类集对应的医学检测项目集作为所述用户的目标医学检测项目集。2.如权利要求1所述的构建方法,其特征在于,所述根据预构建的聚类算法在所述患者主诉词语序列中提取主诉词语聚类集,包括:根据所述患者主诉词语序列中每个患者主诉词语的重复频次构建主诉词语频次序列;在所述主诉词语频次序列中随机选取两个重复频次,将所述两个重复频次作为初始聚类中心组;根据所述初始聚类中心组对所述主诉词语频次序列进行分类,得到第一初始频次聚类及第二初始频次聚类;判断所述第一初始频次聚类及第二初始频次聚类中是否存在不同的初始聚类中心组将所述主诉词语频次序列进行再分类;若所述第一初始频次聚类及第二初始频次聚类中存在不同的初始聚类中心组将所述主诉词语频次序列进行再分类,则返回上述在所述主诉词语频次序列中随机选取两个重复频次的步骤;若所述第一初始频次聚类及第二初始频次聚类中不存在不同的初始聚类中心组将所述主诉词语频次序列进行再分类,则根据所述第一初始频次聚类及第二初始频次聚类获取主诉词语聚类集。3.如权利要求2所述的构建方法,其特征在于,所述根据所述初始聚类中心组对所述主
诉词语频次序列进行分类,得到第一初始频次聚类及第二初始频次聚类,包括:在所述主诉词语频次序列中依次提取待归类频次,判断所述待归类频次与所述初始聚类中心组中两个聚类中心的差值的大小;若所述待归类重复频次与所述初始聚类中心组中第一个聚类中心的差值小于等于所述待归类重复频次与所述初始聚类中心组中第二个聚类中心的差值,则将所述待归类重复频次归类为第一个聚类中心;若所述待归类重复频次与所述初始聚类中心组中第一个聚类中心的差值不小于等于所述待归类重复频次与所述初始聚类中心组中第二个聚类中心的差值,则将所述待归类重复频次归类为第二个聚类中心,直至完成主诉词语频次序列中所有待归类重复频次的归类,得到所述第一初始频次聚类及第二初始频次聚类。4.如权利要求2所述的构建方法,其特征在于,所述判断所述第一初始频次聚类及第二初始频次聚类中是否存在不同的初始聚类中心组将所述主诉词语频次序列进行再分类,包括:分别...

【专利技术属性】
技术研发人员:肖璇彭锐王少亭何晓云郑红云
申请(专利权)人:武汉大学人民医院湖北省人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1