一种改进的应用于医技检查报告的智能纠错方法技术

技术编号:23149904 阅读:39 留言:0更新日期:2020-01-18 13:47
本发明专利技术公开了一种改进的应用于医技检查报告的智能纠错方法,包括词库构建过程、训练过程和智能纠错过程,不仅能够检测常规的拼写错误,另外通过使用训练循环卷积神经网络得到的纠错模型,考虑语序和词语搭配,标记出有问题的词组搭配,并依据拼音词库和词语关联词库,给出一组可替代错误分词的建议词。本发明专利技术不仅可以对拼写错误进行检查,而且可以通过训练得到的循环卷积神经网络模型对上下文的词语搭配进行检查;在应用纠错模型过程中,采取不同的策略,当分词被判定为错误时,由拼音词库DIC4和词语关联词库DIC5给出可替代当前分词的建议词,最终实现能够更加准确地对医技检查报告进行智能纠错。

An improved intelligent error correction method applied to medical technical examination report

【技术实现步骤摘要】
一种改进的应用于医技检查报告的智能纠错方法
本专利技术涉及一种纠错的
,特别是一种改进的应用于医技检查报告的智能纠错方法。
技术介绍
当今医院逐渐向信息电子化方向发展,医技检查报告也在由纸张化向电子化方向过渡,但是随之带来了报告中拼写错误检查的问题。不同地区、医院,报告系统中结构化模板的存在着较大差异,大多数报告医生还需要手动大量输入检查报告内容。对报告内容的准确性进行快速分析检测成为了一个亟待解决的问题。常用的解决方法是对输入信息进行分词,查看分词是否在词典中出现,如果没有出现,则认为录入信息错误,然后对信息进行纠错。该技术的存在的两个主要缺点是:(1)查寻错误分词时,仅仅针对可能的拼写错误进行了检查,没有充分考虑输入文本的上下文语义信息;(2)提供的纠错文字只包含了与错误分词的读音相同或相近的词语,没有考虑上下文词语的搭配。
技术实现思路
本专利技术的目的是为了解决上述现有技术的不足而提供一种不仅能够检测常规的拼写错误,而且通过利用训练得到的循环卷积神经网络模型充分联系上下文语义信息,并结合恰当的纠错策略对本文档来自技高网...

【技术保护点】
1.一种改进的应用于医技检查报告的智能纠错方法,其特征在于,包括以下步骤:/n步骤1、词库构建过程:/n1.1、将自定义的医学词典库导入jieba的自定义词典库,采用jieba分词方法对训练样本进行分词,对分词后的语料,经过去重和重编码处理后,生成医技检查报告编码词库DIC1、单词搜索词库DIC2、词组搜索词库DIC3、拼音词库DIC4和词语关联词库DIC5;/n步骤2、通过训练过程获得纠错模型:/n2.1、对分词后的语料依据句子分隔符进行分句,经过乱序和词语替换,产生语序语料和词语搭配语料集,然后依据编码词库DIC1进行数字化编码;/n2.2、将构建好的两个语料集分别送入到循环卷积神经网络中...

【技术特征摘要】
1.一种改进的应用于医技检查报告的智能纠错方法,其特征在于,包括以下步骤:
步骤1、词库构建过程:
1.1、将自定义的医学词典库导入jieba的自定义词典库,采用jieba分词方法对训练样本进行分词,对分词后的语料,经过去重和重编码处理后,生成医技检查报告编码词库DIC1、单词搜索词库DIC2、词组搜索词库DIC3、拼音词库DIC4和词语关联词库DIC5;
步骤2、通过训练过程获得纠错模型:
2.1、对分词后的语料依据句子分隔符进行分句,经过乱序和词语替换,产生语序语料和词语搭配语料集,然后依据编码词库DIC1进行数字化编码;
2.2、将构建好的两个语料集分别送入到循环卷积神经网络中进行训练,获得纠错模型Model1和Model2;
...

【专利技术属性】
技术研发人员:李文杰贾禄帅王小冬简刚唐武斌
申请(专利权)人:宁波市科技园区明天医网科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1