【技术实现步骤摘要】
基于共现分析和谱聚类的医疗数据信息检索方法
[0001]本专利技术涉及医疗数据信息检索领域,尤其涉及一种基于共现分析和谱聚类的医疗数据信息检索方法。
技术介绍
[0002]随着科技的不断发展,互联网上的信息愈来愈丰富,获取信息的方式也愈来愈便捷,网络己经成为人们日常学习和生活中不可或缺的一部分,医疗也进入大数据时代,人们可以非常容易地从互联网上获取与医疗相关的基础知识,如疾病的症状、治疗和预防等信息。同时也发展出了许多线上医疗问答网站,不需要病人与医生实地面对面检查,而是采用线上问诊的方式,极大地节省了人力物力和时间,在很大程度上保护了病人的隐私。另外,某些需要大量重复的常规性决策工作,科学地应用计算机医疗信息检索系统可以有效提高效率,节省成本,减少误差。合理运用计算机技术既可以有效提高临床服务质量,又可以大幅降低成本。因此,大力发展计算机辅助医疗信息检索系统具有非常重要意义。
[0003]在实际工作中,医生的每一个决策都对患者非常重要,所以医生需要不断地学习,时时关注临床科学的最新技术和方法。而医学界的权威文献和最 ...
【技术保护点】
【技术特征摘要】
1.一种基于共现分析和谱聚类的医疗数据信息检索方法,其特征在于,所述方法包括步骤:(1)对检索任务词汇进行查询扩展,将扩展后的检索任务词汇分类为检索词、扩展词和特征词,对文献进行首次记分,如果首次得分大于阈值T则选中文献,小于阈值T则放弃文献;(2)对选中文献进行二次计分和共现分析,得到二次得分和共现得分,并通过首次得分、二次得分和共现得分计算文献的综合得分;(3)使用词袋模型将文献的化学词列表、医学主题词列表、摘要和关键词列表组成描述文献的向量,以向量距离矩阵作为谱聚类的输入对选中文献进行聚类,输出聚类簇;(4)输出平均综合得分最高的那个类作为检索结果,并对检索结果中的文献按综合得分进行降序排序输出。2.根据权利要求1所述的基于共现分析和谱聚类的医疗数据信息检索方法,其特征在于,步骤(1)中,首次记分的方法为,通过化学词列表、医学主题词列表、摘要和关键词列表做文献首次记分,得到文献首次得分Frist_Score;其中,检索词、扩展词和特征词分别记3分、2分、1分;遍历文献化学词列表、医学主题词列表、摘要和关键词列表中包含的检索任务词汇,若为检索词,则首次得分Frist_Score加3分;若为扩展词,则首次得分Frist_Score加2分;若为特征词,则首次得分Frist_Score加1分;累加得到首次得分Frist_Score。3.根据权利要求1所述的基于共现分析和谱聚类的医疗数据信息检索方法,其特征在于,步骤(1)中,阈值T为首次得分去重后的第三四分位数。4.根据权利要求2所述的基于共现分析和谱聚类的医疗数据信息检索方法,其特征在于,步骤(2)中,二次记分的方法为,计算化学词列表、医学主题词列表和关键词列表的平均计分;其中,化学词列表的平均计分为,遍历文献化学词列表中包含的检索任务词汇,若为检索词,则化学词列表得分加3分;若为扩展词,则化学词列表得分加2分;若为特征词,则化学词列表得分加1分;累加得到化学词列表得分;将化学词列表得分除以化学词列表的长度,得到化学词列表平均计分;然后,二次得分Second_...
【专利技术属性】
技术研发人员:陈宣亦,张子成,章斌,朱志安,杨杰,
申请(专利权)人:南京云设智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。