一种基于模糊匹配的医疗事件编码方法技术

技术编号:25989943 阅读:22 留言:0更新日期:2020-10-20 18:58
本发明专利技术提供了一种基于模糊匹配的医疗事件编码方法,该基于模糊匹配的医疗事件编码方法包括:对需要匹配的医疗事件的数据进行抽取关键词的标签;选择对应版本的专业词典;将步骤一中抽取的关键词的标签与专业词典进行模糊匹配,计算相似度;将计算的相似度与阈值进行比较;对相似度高于阈值的关键词进行编码。本发明专利技术充分考虑了药品的临床试验中发生医疗事件数据用语无法统一,格式复杂,人工编码误差大,没有统一标准的特点,采用计算机辅助实现了对医疗事件的标准化编码,工作量低、工作效率高、准确度高,为后续数据的统计分析工作做好充分的前期准备工作,节省临床试验成本,并加快整个临床试验的完成速度。

【技术实现步骤摘要】
一种基于模糊匹配的医疗事件编码方法
本专利技术属于医疗信息管理
,具体来说涉及一种基于模糊匹配的医疗事件编码方法。
技术介绍
在药品的临床试验过程中,会产生很多的医疗事件,为了完成相同、相似事件的统计和汇总,需要按照一定的规则对药品临床试验中出现的医疗事件进行统计和汇总,标准化管理。现目前针对医疗事件的编码方式是编码人员根据自己经验进行手工编码,或者使用编码词典提供的工具,进行关键字查询,寻找对应的单元。这两种方式工作量都是巨大的,并且在编码过程中会带入编码人员的主观意识,因为不同编码人员个体差异较大,导致编码后的内容存在较大差异因素,会严重影响后期药品的临床试验的数据分析。
技术实现思路
为了克服现有技术的不足,本专利技术提供一种工作量低、工作效率高、准确度高的借助计算机进行编码的一种基于模糊匹配的医疗事件编码方法。本专利技术解决上述技术问题的技术方案如下:一种基于模糊匹配的医疗事件编码方法,包括以下步骤:步骤一:对需要匹配的医疗事件的数据进行抽取关键词的标签;步骤二:选择对应版本的专业词典;步骤三:将步骤一中抽取的关键词的标签与专业词典进行模糊匹配,计算相似度;步骤四:将计算的相似度与阈值进行比较;计算的相似度达100%,则完全匹配,以此抽取的关键词作为该系列医疗事件的编码;高于阈值但达不到100%,则输出专业词典中相似度高的前三匹配词作为参考,人工干涉编码;低于阀值,则重复步骤一到步骤四。进一步的,所述步骤二中的对应版本的专业词典为MedDRA,是一个医学标准术语集。进一步的,所述的医疗事件为针对某一种医药进行临床试验时收集的不良事件和患者的病史等信息。进一步的,所述的阈值为50%-60%。进一步的,所述的相似度的计算方法是编辑距离算法、向量空间模型的余弦定理算法。进一步的,所述步骤一的抽取关键词,为抽取主干,去除干扰词和错别字。进一步的,所述的一种基于模糊匹配的医疗事件编码方法的计算机系统包括:标签提取模块,对需要匹配的医疗事件数据进行梳理后,抽取关键词的标签;匹配标签判断模块,根据设定的相似度计算方法计算抽取关键词的标签和专业词典数据的相似度;将计算出的相似度与阈值进行比较来判断该关键词是否能作为该系列医疗事件的编码。通过上述方法获得的某一系统医疗事件的编码数据后,用于药品的临床试验的数据管理,统计分析,提交给中外临床药物监管部门。本专利技术与现有技术相比,具有明显有益效果,从以上技术方案可知:本专利技术提供的基于模糊匹配的医疗事件编码方法,采用计算机自动运算匹配,对医疗事件信息进行识别并编码,大大减少了人工工作量,工作效率高,且易于查询,便于利用;算法简单,易于编程实现;通过抽取医疗事件的关键词,与专业词典进行模糊匹配后编码,编码更加准确标准化,避免现在手工录入中多种方式表达、使用不规范描述、录入有误、采用缩略词或俗称等,提高整理结果的准确度,提高效率,为后续数据的统计分析工作做好充分的前期准备工作,节省临床试验成本,并加快整个临床试验的完成速度。具体实施方式下面结合试验例和实施例,对本专利技术的上述内容作进一步的详细说明,但不应将此理解为本专利技术上述主题的范围仅限于以下实施例。实施例1:一种基于模糊匹配的医疗事件编码方法,包括以下步骤:步骤一:通过标签提取模块,对需要匹配的医疗事件的数据抽取主干,去除干扰词和错别字,进行抽取关键词的标签;步骤二:选择MedDRA专业词典,在计算机中预设;步骤三:通过匹配标签判断模块,根据设定的编辑距离算法,计算步骤一中抽取的关键词的标签与MedDRA专业词典的相似度;步骤四:将计算的相似度与阈值50%进行比较;若计算的相似度达100%,则完全匹配,以此抽取的关键词作为该系列医疗事件的编码;高于50%但达不到100%,则输出专业词典中相似度高的前三匹配词作为参考,人工干涉编码;低于50%,则重新抽取医疗事件的关键词的标签,重复步骤一到步骤四。实施例2:一种基于模糊匹配的医疗事件编码方法,包括以下步骤:步骤一:通过标签提取模块,对需要匹配的医疗事件的数据抽取主干,去除干扰词和错别字,进行抽取关键词的标签;步骤二:选择MedDRA专业词典,在计算机中预设;步骤三:通过匹配标签判断模块,根据设定的编辑距离算法,计算步骤一中抽取的关键词的标签与MedDRA专业词典的相似度;步骤四:将计算的相似度与阈值60%进行比较;若计算的相似度达100%,则完全匹配,以此抽取的关键词作为该系列医疗事件的编码;高于60%但达不到100%,则输出专业词典中相似度高的前三匹配词作为参考,人工干涉编码;低于60%,则重新抽取医疗事件的关键词的标签,重复步骤一到步骤四。实施例3:一种基于模糊匹配的医疗事件编码方法,包括以下步骤:步骤一:通过标签提取模块,对需要匹配的医疗事件的数据抽取主干,去除干扰词和错别字,进行抽取关键词的标签;步骤二:选择MedDRA专业词典,在计算机中预设;步骤三:通过匹配标签判断模块,根据设定的向量空间模型的余弦定理算法,计算步骤一中抽取的关键词的标签与MedDRA专业词典的相似度;步骤四:将计算的相似度与阈值55%进行比较;若计算的相似度达100%,则完全匹配,以此抽取的关键词作为该系列医疗事件的编码;高于55%但达不到100%,则输出专业词典中相似度高的前三匹配词作为参考,人工干涉编码;低于55%,则重新抽取医疗事件的关键词的标签,重复步骤一到步骤四。对某一药品的临床试验中产生的医疗事件,采用实施例1中的编码方法,通过标签提取模块,抽取得到关键词的标签一“口腔溃疡”和抽取关键词的标签二“右小腿前方外伤”。将关键词的标签一“口腔溃疡”,输入后,与计算机中预设专业词典MedDRA进行匹配,通过匹配标签判断模块,计算相似度,得到相似度为100%,具体输出为:匹配到MedDRA词典的“llt-name口腔溃疡、pt-name口腔溃疡、soc-name胃肠系统疾病”,则自动将关键词“口腔溃疡”作为该药品临床试验的医疗事件的标准编码。针对关键词的标签二“右小腿前方外伤”,输入后,与计算机中预设专业词典MedDRA进行匹配,通过匹配标签判断模块,计算相似度,得到相似度大于阈值50%,且排名前三的匹配词,具体输出为:“外伤,相似度90%;小腿外伤性截断,相似度57%;小腿挫伤,相似度55%。”,以此为参考,人工干涉编码,人工选择“小腿挫伤”作为该药品临床试验的医疗事件的标准编码。以上所述,仅是本专利技术的较佳实施例而已,并非对本专利技术作任何形式上的限制,任何未脱离本专利技术技术方案内容,依据本专利技术的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本专利技术技术方案的范围内。本文档来自技高网...

【技术保护点】
1.一种基于模糊匹配的医疗事件编码方法,其特征在于,包括以下步骤:/n步骤一:对需要匹配的医疗事件的数据进行抽取关键词的标签;/n步骤二:选择对应版本的专业词典;/n步骤三:将步骤一中抽取的关键词的标签与专业词典进行模糊匹配,计算相似度;/n步骤四:将计算的相似度与阈值进行比较;/n计算的相似度达100%,则完全匹配,以此抽取的关键词作为该系列医疗事件的编码;高于阈值但达不到100%,则输出专业词典中相似度高的前三匹配词作为参考,人工干涉编码;低于阀值,则重复步骤一到步骤四。/n

【技术特征摘要】
1.一种基于模糊匹配的医疗事件编码方法,其特征在于,包括以下步骤:
步骤一:对需要匹配的医疗事件的数据进行抽取关键词的标签;
步骤二:选择对应版本的专业词典;
步骤三:将步骤一中抽取的关键词的标签与专业词典进行模糊匹配,计算相似度;
步骤四:将计算的相似度与阈值进行比较;
计算的相似度达100%,则完全匹配,以此抽取的关键词作为该系列医疗事件的编码;高于阈值但达不到100%,则输出专业词典中相似度高的前三匹配词作为参考,人工干涉编码;低于阀值,则重复步骤一到步骤四。


2.根据权利要求1所述的一种基于模糊匹配的医疗事件编码方法,其特征在于,所述步骤二中的对应版本的专业词典为MedDRA,是一个医学标准术语集。


3.根据权利要求1所述的一种基于模糊匹配的医疗事件编码方法,其特征在于,所述的医疗事件为针对某一种医药进行临床试验时收集的不良事件和患者的病...

【专利技术属性】
技术研发人员:霍红建孟凡强陈阶
申请(专利权)人:翰博瑞强上海医药科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1