【技术实现步骤摘要】
一种改进的应用于医技检查报告的智能纠错方法
本专利技术涉及一种纠错的
,特别是一种改进的应用于医技检查报告的智能纠错方法。
技术介绍
当今医院逐渐向信息电子化方向发展,医技检查报告也在由纸张化向电子化方向过渡,但是随之带来了报告中拼写错误检查的问题。不同地区、医院,报告系统中结构化模板的存在着较大差异,大多数报告医生还需要手动大量输入检查报告内容。对报告内容的准确性进行快速分析检测成为了一个亟待解决的问题。常用的解决方法是对输入信息进行分词,查看分词是否在词典中出现,如果没有出现,则认为录入信息错误,然后对信息进行纠错。该技术的存在的两个主要缺点是:(1)查寻错误分词时,仅仅针对可能的拼写错误进行了检查,没有充分考虑输入文本的上下文语义信息;(2)提供的纠错文字只包含了与错误分词的读音相同或相近的词语,没有考虑上下文词语的搭配。
技术实现思路
本专利技术的目的是为了解决上述现有技术的不足而提供一种不仅能够检测常规的拼写错误,而且通过利用训练得到的循环卷积神经网络模型充分联系上下文语义信息,并 ...
【技术保护点】
1.一种改进的应用于医技检查报告的智能纠错方法,其特征在于,包括以下步骤:/n步骤1、词库构建过程:/n1.1、将自定义的医学词典库导入jieba的自定义词典库,采用jieba分词方法对训练样本进行分词,对分词后的语料,经过去重和重编码处理后,生成医技检查报告编码词库DIC1、单词搜索词库DIC2、词组搜索词库DIC3、拼音词库DIC4和词语关联词库DIC5;/n步骤2、通过训练过程获得纠错模型:/n2.1、对分词后的语料依据句子分隔符进行分句,经过乱序和词语替换,产生语序语料和词语搭配语料集,然后依据编码词库DIC1进行数字化编码;/n2.2、将构建好的两个语料集分别送入 ...
【技术特征摘要】
1.一种改进的应用于医技检查报告的智能纠错方法,其特征在于,包括以下步骤:
步骤1、词库构建过程:
1.1、将自定义的医学词典库导入jieba的自定义词典库,采用jieba分词方法对训练样本进行分词,对分词后的语料,经过去重和重编码处理后,生成医技检查报告编码词库DIC1、单词搜索词库DIC2、词组搜索词库DIC3、拼音词库DIC4和词语关联词库DIC5;
步骤2、通过训练过程获得纠错模型:
2.1、对分词后的语料依据句子分隔符进行分句,经过乱序和词语替换,产生语序语料和词语搭配语料集,然后依据编码词库DIC1进行数字化编码;
2.2、将构建好的两个语料集分别送入到循环卷积神经网络中进行训练,获得纠错模型Model1和Model2;
...
【专利技术属性】
技术研发人员:李文杰,贾禄帅,王小冬,简刚,唐武斌,
申请(专利权)人:宁波市科技园区明天医网科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。