【技术实现步骤摘要】
患病率的预测方法、装置、计算机设备和存储介质
[0001]本申请涉及计算机
,特别是涉及一种患病率的预测方法、装置、计算机设备和存储介质。
技术介绍
[0002]罕见病是发病率极低的一类疾病的统称。根据一项综述研究,平均而言,各个国家与组织定义罕见病为发病率低于每10万人40至50例的疾病。因为罕见病在发病早期存在诊断困难,每名罕见病患者平均需要6
‑
8年的时间才能得到准确的诊断。庞大的患病群体难以定位,罕见病相关的研究难以有效开展。因此,在罕见病的诊疗和研究中,对于罕见病的早期筛查和识别具有重要的意义。
[0003]目前,在互联网时代,搜索引擎已成为人们日常生活中获取信息的重要方式,用户在搜索引擎上搜索与疾病相关的查询数据能够反映一定的疾病状况及发展趋势。因此,罕见病的早期筛查和识别方法即可利用搜索引擎搜索数据,进而直接基于搜索到的数据对罕见病的人群分布情况进行预测。
[0004]然而,上述预测罕见病的患病率的方法存在准确度低的问题。
技术实现思路
[0005]基于此 ...
【技术保护点】
【技术特征摘要】
1.一种患病率的预测方法,其特征在于,所述方法包括:根据关键词表从搜索引擎的历史数据库中提取会话数据集;将所述会话数据集输入至会话分类模型中进行会话分类,得到分类结果;所述会话分类模型用于对会话的意图进行分类;根据所述分类结果对所述会话数据集进行筛选,得到目标会话数据集;将所述目标会话数据集输入至预测模型中进行患病率预测,得到预测结果。2.根据权利要求1所述的方法,其特征在于,所述会话分类模型包括长短期记忆子模型和多层感知机子模型,所述将所述会话数据集输入至会话分类模型中进行会话分类,得到分类结果,包括:对所述会话数据集进行特征提取,得到会话特征和查询特征;将所述查询特征输入至所述长短期记忆子模型进行向量转换,得到所述查询特征对应的向量特征;将所述查询特征对应的向量特征和所述会话特征输入至所述多层感知机子模型进行分类,得到所述分类结果。3.根据权利要求1或2所述的方法,其特征在于,所述根据所述分类结果对所述会话数据集进行筛选,得到目标会话数据集,包括:根据所述分类结果确定所述会话数据集中属于罕见病相关类型的会话和热点新闻相关类型的会话;根据所述罕见病相关类型的会话和所述热点新闻相关类型的会话构建所述目标会话数据集。4.根据权利要求1或2所述的方法,其特征在于,所述根据关键词表从搜索引擎的历史数据库中提取会话数据集,包括:根据所述关键词表中第一级别的关键词从搜索引擎的历史数据库中提取与所述第一级别关键词匹配的罕见病相关查询;根据所述第一级别关键词匹配的罕见病相关查询从所述历史数据库中提取所述会话数据集。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一级别关键词匹配的罕...
【专利技术属性】
技术研发人员:张敏,李佳玉,刘奕群,马少平,苏航,张抒扬,金晔,张磊,
申请(专利权)人:中国医学科学院北京协和医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。