【技术实现步骤摘要】
一种基于机器学习算法的智能化癌症问卷分析方法
本专利技术具体涉及一种基于机器学习算法的智能化癌症问卷分析方法。
技术介绍
人们常说“癌症”习惯上泛指所有恶性肿瘤。癌症具有细胞分化和增殖异常、生长失去控制、浸润性和转移性等生物学特征,其发生是一个多因子、多步骤的复杂过程,分为致癌、促癌、演进三个过程,与吸烟、感染、职业暴露、环境污染、不合理膳食、遗传因素密切相关。根据肿瘤发生的不同部位和性质,对患者的临床表现和体征进行综合分析,结合实验室检查和影像学、细胞病理学检查通常能做出明确诊断。除了明确是否有恶性肿瘤,还可进一步了解其范围和程度,以便拟定治疗方案和评估预后。但目前仍缺乏理想的特异性强的早期诊断方法,尤其对深部肿瘤的早期诊断更为困难。而如何对癌症进行以预防为目的的治疗为医学领域所关注的重点。在癌症风险预警中,流行病学问卷是经济、有效的手段。传统问卷分析方法是基于经验和规则,这种方法智能程度较低,难以过滤冗余信息和定位关键信息,且只能定性输出判断结果,不能定量输出每种癌症的具体患病概率。为克服传统方法的缺点, ...
【技术保护点】
1.一种基于机器学习算法的智能化癌症问卷分析方法,其特征在于,包括以下步骤:/n步骤1、建立关于患者状态信息的文本信息库,并将该文本信息库进行标准化处理并存储到服务器内;/n步骤2、通过服务器对步骤1中标准化后的文本信息库进行筛选,剔除低质量的文本信息库;/n步骤3、对经过步骤2筛选后的文本信息进行样本均衡处理,并通过风险预测模型进行风险预估。/n
【技术特征摘要】
1.一种基于机器学习算法的智能化癌症问卷分析方法,其特征在于,包括以下步骤:
步骤1、建立关于患者状态信息的文本信息库,并将该文本信息库进行标准化处理并存储到服务器内;
步骤2、通过服务器对步骤1中标准化后的文本信息库进行筛选,剔除低质量的文本信息库;
步骤3、对经过步骤2筛选后的文本信息进行样本均衡处理,并通过风险预测模型进行风险预估。
2.如权利要求1所述的一种基于机器学习算法的智能化癌症问卷分析方法,其特征在于,所述的步骤1中的文本信息库为表格形式的选择题、填空题的集合。
3.如权利要求2所述的一种基于机器学习算法的智能化癌症问卷分析方法,其特征在于,通过独热向量方法对步骤1中选择题形式的文本信息的各选项进行编码进行标准化处理并存储至服务器中,对于填空题形式的文本信息通过手动录入到服务器中。
...
【专利技术属性】
技术研发人员:李劲鹏,陶娅玲,蔡挺,
申请(专利权)人:中国科学院大学宁波华美医院,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。