The invention relates to a system and a method for predicting prostate cancer recurrence, including doctor workstation and server, workstation for receiving the input information and display the prediction results; the server comprises an information acquisition module, preprocessing module, model training module, information receiving module, the predictor of prostate cancer recurrence. The information acquisition module acquires the training set; preprocessing module of feature information extraction, feature information preprocessing, feature generation word sets, and features of word generation characteristic value; model training module training model of cluster analysis, get the predictor of prostate cancer recurrence; information receiving module receives the user input information, and transmit information to the pretreatment module; prostate cancer recurrence after predictor training according to the characteristics of user input information, get the forecasting result of prostate cancer recurrence. The method solves the problems that the existing method consumes manpower, relies on subjective judgment of doctors, lacks uniform standards and is easy to cause misdiagnosis.
【技术实现步骤摘要】
一种基于特征值进行前列腺癌复发预测的系统和方法
本专利技术涉及疾病预测的
,尤其涉及一种基于特征值进行前列腺癌复发预测的系统和方法。
技术介绍
目前,正处于大数据时代,各行各业都有大规模的数据量,现有技术中的简单规则处理难以发挥这些数据的价值。硬件的高速发展给大数据的分析和应用提供了条件。高性能计算使得基于大规模数据的数据学习时间和数据处理代价大大降低了;大规模数据存储,使得能够更快、代价更小地处理大规模数据。由于硬件和算法的发展,使得在使用机器学习解决数据分析的问题后,能获得更加丰厚收益。现有的机器学习技术主要运用到新闻、电子商务等互联网领域,在传统领域,尤其是医学领域的应用十分匮乏。因此,本专利技术提供一种将机器学习方法运用到医学领域中,进行前列腺癌复发的预测,以弥补现有技术中,前列腺癌复发的预测主要依赖医生的主观判断,判断的准确性取决于医生的主观经验,不同的医生对患者病情的判断结果可能回不一致,这容易导致误诊,甚至可能会延误患者病情的问题。
技术实现思路
鉴于上述的分析,本专利技术旨在提供一种基于特征值进行前列腺癌复发预测的系统和方法,用以解决现有方法耗费 ...
【技术保护点】
一种基于特征值进行前列腺癌复发预测的系统,其特征在于,包括医生工作站和服务器,医生工作站用于接收输入信息和显示预测结果;服务器包括信息获取模块、预处理模块、模型训练模块、信息接收模块、前列腺癌复发预测器;信息获取模块获取前列腺癌病例的电子数据,从中获得训练集合;预处理模块提取训练集合中的每个病例的特征信息,对提取的特征信息进行预处理,生成训练用特征词集合,并为集合中的特征词生成对应的特征值,将特征值输入到模型训练模块;预处理模块还用于对用户输入信息进行特征信息提取、预处理和生成特征值的处理,并将该特征值输入到经过训练的前列腺癌复发预测器;模型训练模块利用特征值,训练聚类分析 ...
【技术特征摘要】
1.一种基于特征值进行前列腺癌复发预测的系统,其特征在于,包括医生工作站和服务器,医生工作站用于接收输入信息和显示预测结果;服务器包括信息获取模块、预处理模块、模型训练模块、信息接收模块、前列腺癌复发预测器;信息获取模块获取前列腺癌病例的电子数据,从中获得训练集合;预处理模块提取训练集合中的每个病例的特征信息,对提取的特征信息进行预处理,生成训练用特征词集合,并为集合中的特征词生成对应的特征值,将特征值输入到模型训练模块;预处理模块还用于对用户输入信息进行特征信息提取、预处理和生成特征值的处理,并将该特征值输入到经过训练的前列腺癌复发预测器;模型训练模块利用特征值,训练聚类分析模型,得到前列腺癌复发预测器;信息接收模块接收用户通过医生工作站输入的信息,并将接收的信息传输到预处理模块;经过训练的前列腺癌复发预测器根据预处理模块处理用户输入信息得到的特征值,得到前列腺癌复发的预测结果,并输出到医生工作站。2.根据权利要求1所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,所述预处理模块中提取的特征信息包括:前列腺癌的术前psa,术前fpsa,肿瘤级别、淋巴转移、骨转移、评分、是否生化复发。3.根据权利要求1所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,所述预处理模块中的预处理包括:对提取的特征信息进行分词;对噪声词进行剔除处理。4.根据权利要求3所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,在分词和噪声词剔除处理之后,还包括对特征词集合中的同义词进行替换。5.根据权利要求1或3或4所述的基于特征值进行前列腺癌复发预测的系统,其特征在于,预处理模块还包括对训练用特征词...
【专利技术属性】
技术研发人员:荣小辉,张洋,高彦回,刘为,
申请(专利权)人:思派北京网络科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。