医院诊断词典的校正方法、装置、服务器及存储介质制造方法及图纸

技术编号:39435846 阅读:8 留言:0更新日期:2023-11-19 16:19
本发明专利技术实施例公开了一种医院诊断词典的校正方法、装置、服务器及存储介质,其中,所述方法包括:接收诊断语句的分词结果;根据分词结果确定嫌疑分词的词性;查找嫌疑分词所在的语句,在词性为名词时,在所述语句中对所述嫌疑分词增加定语第一修饰性词语;在嫌疑分词的词性为动词时,在所述语句中对所述嫌疑分词增加副词第二修饰性词语,得到补充语句;对所述补充语句进行语法检测,在检测结果为错误时,对所述嫌疑分词进行调整,并根据调整后的分词确定嫌疑分词的词性,返回查找嫌疑分词所在的语句步骤,直至检测结果为正确。可弥补传统分词模型对病历分词不准确的缺点,能够实现对错误分词结果进行修正,得到正确的分词结果。得到正确的分词结果。得到正确的分词结果。

【技术实现步骤摘要】
医院诊断词典的校正方法、装置、服务器及存储介质


[0001]本专利技术涉及医院诊断词典
,尤其涉及一种医院诊断词典的校正方法、装置、服务器及存储介质。

技术介绍

[0002]随着医疗卫生信息化建设不断深入,数字化改造使得各类医疗信息管理系统所维护的医疗数据呈爆炸性增长,当前医疗信息化工作己经在绝大多数医院内全面开展并已略见成效,但各个医院之间的医疗数据彼此独立,难以在系统之间交流共享,“数据孤岛”现象日益严重。因此,需要通过一个综合性的医院医疗系统实现数据共享,进而为智能化诊疗提供基础。
[0003]医疗文本数据作为综合性的医院医疗系统的主要组成部分,可将病历数据转换为相应的结构化数据,便于后期进行有效的识别和提取,通过数据挖掘,将文本数据变为智能医疗诊断辅助的重要资源。医院诊断词典作为医疗文本数据的重要组成部分,可提供标准化的单词构成、解释和元数据说明。因此,准确的医院诊断词典是医疗文本数据的重要组成部分。
[0004]医院诊断词典是由各种文本数据通过分词构建而成。在实现本专利技术的过程中,专利技术人发现如下技术问题:现有的分词普遍采用分词模型进行分词,然后在病历数据中,医生往往习惯使用自然语言书写,并且经常采用一些简写,在该种情况下,现有的分词模型无法准确的进行分词,导致医院诊断词典中出现大量的错误或者冗余词语。

技术实现思路

[0005]本专利技术实施例提供了一种医院诊断词典的校正方法、装置、服务器及存储介质,以解决现有技术中对于病历数据采用分词模型进行分词准确度较低的技术问题。
[0006]第一方面,本专利技术实施例提供了一种医院诊断词典的校正方法,包括:接收诊断语句的分词结果;根据分词结果确定嫌疑分词的词性;查找嫌疑分词所在的语句,在词性为名词时,在所述语句中对所述嫌疑分词增加定语第一修饰性词语;在分词的词性为动词时,在所述语句中对所述嫌疑分词增加副词第二修饰性词语,得到补充语句;对所述补充语句进行语法检测,在检测结果为错误时,对所述嫌疑分词进行调整,并根据调整后的分词确定嫌疑分词的词性,返回查找嫌疑分词所在的语句步骤,直至检测结果为正确。
[0007]第二方面,本专利技术实施例还提供了一种医院诊断词典的校正装置,包括:接收模块,用于接收诊断语句的分词结果;确定模块,用于根据分词结果确定嫌疑分词的词性;
查找模块,用于查找嫌疑分词所在的语句,在词性为名词时,在所述语句中对所述嫌疑分词增加定语第一修饰性词语;增加模块,用于在嫌疑分词的词性为动词时,在所述语句中对所述嫌疑分词增加副词第二修饰性词语,得到补充语句;调整模块,用于对所述补充语句进行语法检测,在检测结果为错误时,对所述嫌疑分词进行调整,并根据调整后的分词确定嫌疑分词的词性,返回查找嫌疑分词所在的语句步骤,直至检测结果为正确。
[0008]第三方面,本专利技术实施例还提供了一种服务器,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述实施例提供的医院诊断词典的校正方法。
[0009]第四方面,本专利技术实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如上述实施例提供的医院诊断词典的校正方法。
[0010]本专利技术实施例提供的医院诊断词典的校正方法、装置、服务器及存储介质,通过接收诊断语句的分词结果;根据分词结果确定嫌疑分词的词性;查找嫌疑分词所在的语句,在词性为名词时,在所述语句中对所述嫌疑分词增加定语第一修饰性词语;在分词的词性为动词时,在所述语句中对所述嫌疑分词增加副词第二修饰性词语,得到补充语句;对所述补充语句进行语法检测,在检测结果为错误时,对所述嫌疑分词进行调整,并根据调整后的分词确定嫌疑分词的词性,返回查找嫌疑分词所在的语句步骤,直至检测结果为正确。通过对存在疑问的分词结果进行增加修饰性词或者短句,使之构成语义较为明确的长语句,并通过对长语句进行语法检测,在语法检测通过时,确定分词无错误,否则,对分词结果进行调整,直至满足语法检测要求。利用上述方式,针对诊断语句的特点,通过对其进行扩充,并利用扩充后的语句合理性判断分词是否错误。可弥补传统分词模型对病历分词不准确的缺点,能够实现对错误分词结果进行修正,得到正确的分词结果。
附图说明
[0011]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1是本专利技术实施例一提供的医院诊断词典的校正方法的流程示意图;图2是本专利技术实施例二提供的医院诊断词典的校正方法的流程示意图;图3是本专利技术实施例三提供的医院诊断词典的校正装置的结构示意图;图4是本专利技术实施例四提供的服务器的结构图。
具体实施方式
[0012]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
实施例一
[0013]图1是本专利技术实施例一提供的医院诊断词典的校正方法的流程图,本实施例可适用于对词典中错误分词进行校正的情况,该方法可以由医院诊断词典的校正装置来执行,并可集成于医院医疗系统服务器中,具体包括如下步骤:步骤110,接收诊断语句的分词结果。
[0014]在医疗领域中,医务人员用自然文本形式书写的诊断报告,即病历文本,典型的医疗病历文本实例众多,如诊断记录等。其作为病人在医疗诊断治疗全过程的原始记录,包含有病人的病程记录、检查检验结果、医嘱、手术记录、护理记录等医疗全程信息,作为医疗领域主要数据信息来源之一,蕴含着大量有价值但欠挖掘的医疗数据信息。在本实施例中,可以利用现有的基于词典的中文分词方法先对医疗病历文本中的诊断记录中的诊断语句进行分词,得到相应的分词结果。
[0015]步骤120,根据分词结果确定嫌疑分词的词性。
[0016]在本实施例中,所述嫌疑分词可以为检测得到的分词可能不正确的分词结果。可选的,可以通过多个不同的分词模型得到分词结果,确定存在差异的分词,并将其作为嫌疑分词。例如:可以通过基于词典的中文分词方法和正向匹配方法分别得到的分词结果确定嫌疑分词。并根据分词结果确定每个嫌疑分词的词性。词性主要分十二大类,分别是名词、动词、形容词、数词、量词、代词、副词、介词、连词、助词、叹词、拟声词。由于诊断语句中主要涉及名词、动词、形容词、和少量的副词,因此,可以只确定嫌疑分词是否属于上述三种词性即可。
[0017]步骤130,查找嫌疑分词所在的语句,在词性为名词时,在所述语句中对所述嫌疑分词增加定语第一修饰性词语。
[0018]在诊断语句中,医生通常采用小短句对病情进行描述,在该种情况下,很难确定分词是否准确。因此,在本实施例中,可对其所在的语句进行语义填充,即通过对其增加相应的修饰性词语判断分词是否准确。示例性的,可在嫌疑分词的词性为名词时,增加第一修饰性词语作为定词。可选的,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医院诊断词典的校正方法,其特征在于,包括:接收诊断语句的分词结果;根据分词结果确定嫌疑分词的词性;查找嫌疑分词所在的语句,在词性为名词时,在所述语句中对所述嫌疑分词增加定语第一修饰性词语;在嫌疑分词的词性为动词时,在所述语句中对所述嫌疑分词增加副词第二修饰性词语,得到补充语句;对所述补充语句进行语法检测,在检测结果为错误时,对所述嫌疑分词进行调整,并根据调整后的分词确定嫌疑分词的词性,返回查找嫌疑分词所在的语句步骤,直至检测结果为正确。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:增加第三修饰性词语,所述第三修饰性词语用于对所述第一修饰性词语进行进一步修饰;增加第四修饰性词语,所述第四修饰性词语用于对所述第二修饰性词语进行进一步修饰。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用至少两个分词模型得到分词结果,确定存在分词差异的分词作为嫌疑分词。4.根据权利要求1所述的方法,其特征在于,所述对所述嫌疑分词进行校正,包括:对所述嫌疑分词按最小元素进行拆分。5.根据权利要求4所述的方法,其特征在于,所述对所述嫌疑分词进行校正,还包括:在对所述嫌疑分词按最小元素进行拆分后得到分词仍然不正确时,将所述嫌疑分词的最小元素与前后字重新组合。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:对不同来源的词典中的分词所在的诊断方案的短句按照语法规则进行排序,得到第一诊断方案和第二诊断方案;对所述第一诊断方案和第二诊断方案中的近似词所在的诊断语句进行扩充,增加修饰语;从扩充后的第一诊断方案...

【专利技术属性】
技术研发人员:赵倩孙丰龙宋玉冰李华明徐长海王毅
申请(专利权)人:通用技术集团健康数字科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1