The invention particularly relates to a clinical data group classification method based on Chinese medical complaint analysis. Based on the analysis of Chinese medical complaints, the method of clinical data group classification uses machine learning algorithm to analyze and mine the data group composed of all kinds of clinical examination data and main complaints entered by doctors to obtain the information and knowledge implied in the data group; analyzes and processes the data source provided by the hospital information system to obtain the data classification of the data group; stores the data group into The data category corresponding to the relevant knowledge base of clinical data center is enough. Based on the classification method of clinical data group of Chinese medical complaints analysis, the data model is established by using machine learning algorithm, and the data group composed of various clinical examination data and main complaints entered by doctors are analyzed and mined. The accurate classification of data group is realized, which can not only greatly improve the working efficiency of doctors, but also build small and micro clinical in hospital Data center is of great significance.
【技术实现步骤摘要】
一种基于中文医疗主诉分析的临床数据组分类方法
本专利技术涉及机器学习算法与数据挖掘
,特别涉及一种基于中文医疗主诉分析的临床数据组分类方法。
技术介绍
不同的医院、医院的不同等级,院内信息化程度参差不齐,在信息化程度不高的医院内部,各个业务系统存在数据孤岛,院内各系统之间,区域内医院和医院之间,医院和社会公众之间均存在不同程度的数据壁垒。随着大数据技术的不断发展,在政策和技术的双重推动下,医院有强烈的意愿消除内部的数据壁垒,建立微型、小型医院临床数据中心,对数据的互联互通、医生的科研需求、院内的疾病判断、减少医生误诊率等方面将会有重要的意义。医生在诊疗过程中,需要很多相关信息的辅助,最重要的信息来源是患者的各种临床检验检查数据组成的数据组。这些检验检测数据组成的数据组,汇入到疾病数据库之后,能够形成疾病辅助决策支持,对医生的工作进一步形成指导,从而准确判断疾病,给出诊疗方案,减少技术上的失误。因此,若能建立数据模型,对各种临床检验检查数据组成的数据组进行分析挖掘,实现对数据组的精准分类,将会大大提高医生的工作效率,对构建院内小型、微型临床数据中心具有重要意义。基于上述情况,本专利技术提出了一种基于中文医疗主诉分析的临床数据组分类方法。
技术实现思路
本专利技术为了弥补现有技术的缺陷,提供了一种简单高效的基于中文医疗主诉分析的临床数据组分类方法。本专利技术是通过如下技术方案实现的:一种基于中文医疗主诉分析的临床数据组分类方法,其特征在于:包括以下步骤:< ...
【技术保护点】
1.一种基于中文医疗主诉分析的临床数据组分类方法,其特征在于,包括以下步骤:/n第一步,使用机器学习算法对各种临床检验检查数据和医生录入的主诉项组成的数据组进行分析挖掘,获取数据组所隐含的信息和知识;/n第二步,根据医院信息系统提供的数据源对医生录入的主诉项内容进行分析处理,结合获取到的数据组隐含的信息和知识,得到数据组的数据分类;/n第三步,将数据组存入临床数据中心相关知识库对应的数据类别即可。/n
【技术特征摘要】 【专利技术属性】
1.一种基于中文医疗主诉分析的临床数据组分类方法,其特征在于,包括以下步骤:
第一步,使用机器学习算法对各种临床检验检查数据和医生录入的主诉项组成的数据组进行分析挖掘,获取数据组所隐含的信息和知识;
第二步,根据医院信息系统提供的数据源对医生录入的主诉项内容进行分析处理,结合获取到的数据组隐含的信息和知识,得到数据组的数据分类;
第三步,将数据组存入临床数据中心相关知识库对应的数据类别即可。
2.根据权利要求1所述的基于中文医疗主诉分析的临床数据组分类方法,其特征在于:所述第一步中,所述使用机器学习算法对各种临床检验检查数据组成的数据组进行分析挖掘,包括中文文本预处理、特征提取、数据建模和知识发现。
3.根据权利要求2所述的基于中文医疗主诉分析的临床数据组分类方法,其特征在于:所述中文文本预处理包括文本数据清洗、词切分和数据映射。
4.根据权利要求3所述的基于中文医疗主诉分析的临床数据组分类方法,其特征在于:所述数据清洗是指处理缺失数据与异常值,并剔除掉原始数据中与数据建模无关的数据。
5.根据权利要求3所述的基于中文医疗主诉分析的临床数据组分类方法,其特征在于:所述词切分是指使用用户自定义的分词词典将各种临床检验检查数据和医生录入的主诉项分别进行分词;所述用户自定义的分词词典采用主诉相关医学词典,并在词切分时加载使用。
技术研发人员:曹梦莉,王国超,
申请(专利权)人:山东健康医疗大数据有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。