【技术实现步骤摘要】
一种基于树结构的甲状腺超声报告的结构化处理方法
本专利技术涉及一种基于树结构模型的结构化系统,属于医疗设备
技术介绍
随着医疗信息化的快速发展,医疗机构在临床诊断的过程中产生了大量的原始电子病历数据,这些电子病历是记录患者诊断与治疗过程的重要信息,蕴含着丰富的知识。由于电子病历多为非结构化、叙述性文本,不能较好地存储、组织和管理病历中的临床信息,因此,未被结构化的电子病历文本很难被充分利用。所以目前对电子病历分析的研究主要集中在电子病历结构化的方面,通过对疾病的检查指标数据进行结构化,从杂乱、冗余、高复杂的非结构化电子病历数据获取规范、有价值的数据,最后利用人工智能算法对患者所患疾病进行诊断已成为研究热点。另外,如今大多数甲状腺电子病历仍是由自然语言书写而成,海量错综复杂的半结构化,甚至是非结构化的数据挑战着医疗行业。这使得尽管病人的数据充足,但难以从这些数据中获取知识,也使得资源难以合理地分配,给整个医疗行业的发展带来了巨大的压力。就甲状腺结节这一疾病而言,其患者的超声报告结果存储于叙述性医疗文本中,无法直接交由计算机识别分析。所以首要解决的问题就是实 ...
【技术保护点】
1.一种基于树模型的甲状腺超声医疗检查文本报告的结构化处理方法,其特征在于,包括以下步骤:步骤1、对甲状腺超声报告进行预处理,将甲状腺超声报告切分为多个短句;步骤2、建立甲状腺超声报告词性词典,包括以下步骤:步骤2.1、选取历史甲状腺超声报告作为数据训练集文件,利用步骤1的方法将数据训练集文件中的甲状腺超声报告切分为多个短句,形成短句集合训练数据;步骤2.2、使用聚类算法对短句集合训练数据进行短句聚类,得到分类后的短句集合,随后使用分词包、医疗词库、停用词包对不同类别下的每一个短句进行分词,获得每一个短句所对应的所有词语;步骤2.3、使用神经网络模型对不同类别中的所有词语进 ...
【技术特征摘要】
1.一种基于树模型的甲状腺超声医疗检查文本报告的结构化处理方法,其特征在于,包括以下步骤:步骤1、对甲状腺超声报告进行预处理,将甲状腺超声报告切分为多个短句;步骤2、建立甲状腺超声报告词性词典,包括以下步骤:步骤2.1、选取历史甲状腺超声报告作为数据训练集文件,利用步骤1的方法将数据训练集文件中的甲状腺超声报告切分为多个短句,形成短句集合训练数据;步骤2.2、使用聚类算法对短句集合训练数据进行短句聚类,得到分类后的短句集合,随后使用分词包、医疗词库、停用词包对不同类别下的每一个短句进行分词,获得每一个短句所对应的所有词语;步骤2.3、使用神经网络模型对不同类别中的所有词语进行命名实体识别,从而得到一个基于甲状腺超声报告的词性词典;步骤3、基于词性词典、依存句法分析树建立结构化模板树,包括以下步骤:步骤3.1、根据步骤2得到的词性词典得到甲状腺超声报告中每个词的词性关系,同时,根据依存句法分析树得到甲状腺超声报告中的每个词的语法关系;步骤3.2、结合每个词的词性关系与每个词的语法关系的内在联系确立建立结构化模板树的规则;步骤3.3、基于步骤3.2获得的规则,建立结构化模板树;步骤4、实时获得甲状腺超声报告后,利用步骤3建立的结构化模板树对甲状腺超声报告进行结构化,得到结构化结果。2.根据权利要求1所述的基于树模型的甲状腺超声医疗检查文本报告的结构化处理方法,其特征在于,步骤2.2中:采用的聚类算法为BIRCH层次聚类算法;分词时采用JIEBA中文分词。3....
【专利技术属性】
技术研发人员:潘乔,张敬谊,王晔,陈德华,杜逸凡,张鑫金,
申请(专利权)人:东华大学,万达信息股份有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。