一种基于深度学习超声文本诊断结果的辅助诊断方法技术

技术编号：37642244 阅读：26 留言：0更新日期：2023-05-25 10:09

本发明专利技术属于医学诊断技术领域，具体为一种基于深度学习超声文本诊断结果的辅助诊断方法，包括步骤1：Report Preparation，超声检查所见和诊断结果报告由医生人工输入，能够有效地处理报告，减少错别字和无效文本对信息抽取的影响，必须在提取所需信息之前对其进行预处理；步骤2：Information Extraction，把序列到序列模型应用到超声文本的信息抽取中，并结合基于规则的NLP算法完善seq2seq模型的结果：步骤3：Extrinsic Evaluation Framework，通过观察步骤2部分的结果，发现医生诊断习惯也会影响实验结果，不同医生对待同一个疾病的表述不同，因此，加入同义词处理和概率准确性方法来解决这一问题，其结构合理，普适性高，不受领域的限制，具有较好的可扩展性，可以迁移到其它医学诊断领域中。医学诊断领域中。医学诊断领域中。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习超声文本诊断结果的辅助诊断方法

[0001]本专利技术涉及医学诊断
，具体为一种基于深度学习超声文本诊断结果的辅助诊断方法。

技术介绍

[0002]超声是一种常用的成像方式，被医生公认为是一种强大的辅助诊断工具。其优点是检查方法简便、诊断准确率高。目前已经广泛应用于多种疾病的诊断中。在医院妇产科临床中，超声检查技术的应用也是至关重要的。超声可以筛查出子宫肌瘤、子宫肌腺症等常见妇科疾病。妇产科疾病病情多样、发生率高，对女性健康危害极大，而超声检查能非常有效地提高妇产科疾病的诊断效率，最大程度地避免妇科疾病恶化。在超声检查中，超声科医生通过超声影像结果观察各个脏器的形态、大小等物理特征，总结出超声检查所见文本，进而给出超声诊断结果。最终交由妇产科医生结合超声诊断结果和患者的临床表现给出最终的诊断结果。
[0003]知识提取(Knowledge Extraction,KE)指的是根据人们的实际需求，利用计算机技术识别文档中的信息片段，并将其转换为适合计算机存储、处理和检索的表示形式。KE系统的输入可能...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习超声文本诊断结果的辅助诊断方法，其特征在于：包括如下步骤：步骤1：Report Preparation，超声检查所见和诊断结果报告由医生人工输入，能够有效地处理报告，减少错别字和无效文本对信息抽取的影响，必须在提取所需信息之前对其进行预处理；步骤2：Information Extraction，把序列到序列模型应用到超声文本的信息抽取中，并结合基于规则的NLP算法完善seq2seq模型的结果；第一步将训练集的检查所见和诊断结果文本输入到transformer模型中训练；第二步将测试集的检查所见文本输入到第一步训练的模型中得到初步结果；第三步将其中的错误结果根据基于规则的NLP算法修改，得到信息抽取部分的最终结果：步骤3：Extrinsic Evaluation Framework，通过观察步骤2部分的结果，发现医生诊断习惯也会影响实验结果，不同医生对待同一个疾病的表述不同，因此，加入同义词处理和概率准确性方法来解决这一问题。2.根据权利要求1所述的一种基于深度学习超声文本诊断结果的辅助诊断方法，其特征在于：所述步骤1的具体流程如下：(1)处理结果中常见的拼写错误，例如“纳囊”被拼写为“那囊”；处理报告中的无效文本，超声报告中的检查结果是间接的诊断结果，医生根据超声报告和患者的临床表现产生最终的诊断结果，因此超声报告中会存在大量建议性语句，例如“建议会诊胎儿超声和产前咨询”、“请结合临床”，这些语句对医生判断病情没有帮助，因此将类似的条语句去除，减少其对后续特征抽取的影响；(2)使用Jieba Chinese word segmentation tool结合超声领域专业词典完成分词工作，构建超声领域专业词典；原因有两点：第一，超声检查报告中存在大量医学专业词汇，由于专业词汇在现实生活中出现的频率远远低于常用词汇，分词工具容易产生错误，例如“宫腔线清”会被分词工具分为“宫腔”和“线清”，而正确的分词结果是“宫腔线”和“清”；第二，医学检查报告使用的词汇相对闭合，数据集涉及到的词汇数量较少，在该数据集的检查所见文本中，只涉及3763个词语，在诊断结果文本中，只涉及498个词语，因此构建超声领域专业词典会显著增加分词的准确率，有助于后续的信息提取工作；通过观察报告文本，发现96.3％的专业词汇都是由两个字或三个字组成，四个字以上词汇都是由短词汇组成，因此在构建词典时以每个字为单位，使用bigram和trigram方法，将组合后的所有词语按照出现次数进行排序，从中取出次数较高的1281个词语，最终结合超声科医生的建议，标注了其中的382个词语作为自定义词典；(3)在分词任务结束后，对超声报告中的同义词进行处理，例如“宫颈处见外凸低回声”被分词为“宫颈处见外凸低回声”，“胃泡可见”被分词为“胃泡可见”；其中的“处见...

【专利技术属性】
技术研发人员：赵跃铭，胡亮，迟令，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人