System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及医疗信息化,特别是一种基于语音数据生成结构化报告的方法、系统及存储介质。
技术介绍
1、影像学结构化报告是一种承载诊断逻辑的生产力工具。完整的影像学诊断过程包括图像识别、鉴别诊断和针对性回答临床问题等三个阶段。使用结构化报告做诊断的工作形式表现为诊断医生通过阅读图像和相关病例资料,不断输入各类标签数据,结构化报告系统根据内置的专家共识规则,自动形成诊断结论。
2、以上腹部mr扫描为例,其覆盖肝、胆、胰、脾、肾等多个脏器的二十多种可能的病种。为了实现其结构化描述,结构化报告系统内通常为每个脏器的每个病种都设置有一个专用的结构化模板,加上正常的描述和解剖变异,当需要完成一个大范围的扫描时,诊断范围就可能覆盖40至50个模板。
3、很多情况下,虽然患者在多个脏器上都存在重要或者不重要的病变,但每个病变的描述可能只是位置、类型和大小等简单的描述。但如果涉及多个脏器,医生的操作过程就需要先选择脏器、疾病的模板,再找到描述这些简单特征对应的结构化章节,再去填写。这种操作相当花费时间,导致结构化报告的书写效率较低。
技术实现思路
1、本专利技术的主要目的在于提供了一种基于语音数据生成结构化报告的方法、系统及存储介质,旨在解决现有技术中结构化报告的书写效率较低的技术问题。
2、为实现上述目的,本专利技术提供了一种基于语音数据生成结构化报告的方法,其包括以下步骤:获取语音数据,将其转换为文本数据并进行显示,所述语音数据包括影像学相关内容;对文本数据进
3、可选的,所述分词处理具体包括以下步骤:获取文本数据的上下文数据;先对文本数据与上下文数据进行切分处理后得到对应的分词结果,再进行实体识别,得到文本数据与上下文数据中的命名实体;将命名实体分别与结构化报告中的章节进行第一匹配处理,得到命名实体对应的分类标签。
4、可选的,在第一匹配处理过程中,当分类标签被激活后,基于预设关联关系获取分词词库中属于该分类标签的关联词,并自动优化关联词的优先级参数,得到优化后的优先级参数。
5、可选的,自动优化关联词的优先级参数具体为提高关联词的优先级。
6、可选的,实体链接处理具体为:基于预设的知识库,将分词结果与对应的命名实体进行链接,得到命名实体对应的语义学编码。
7、可选的,数据匹配处理具体包括以下步骤:基于命名实体对应的语义学编码,获取其对应的结构化报告模板;结构化报告模板的各章节之间具备层级关系,且结构化报告模板内置有至少一棵语法元数据树,用于记录结构化报告元素与自然语言文本之间的对应关系,所述语法元数据树至少包括一棵语法元数据子树;基于结构化报告模板,获取文本数据对应的语法元数据树或语法元数据子树;将文本数据中的命名实体与语法元数据树中的节点或语法元数据子树中的节点进行第二匹配处理,以确定对应的节点。
8、可选的,数据填充处理具体为:将实体链接处理得到的语义学编码数组填充至数据匹配处理中获取的语法元数据树或语法元数据子树中,生成结构化报告内容。
9、可选的,过滤处理具体为:基于预设过滤规则,对文本数据进行过滤,过滤内容不录入结构化报告中。
10、与所述基于语音数据生成结构化报告的方法相对应的,本专利技术提供一种基于语音数据生成结构化报告的系统,其包括:语音识别模块,用于获取语音数据,将其转换为文本数据并进行显示,所述语音数据包括影像学相关内容;数据解析处理模块,用于对文本数据进行数据解析处理,生成结构化报告内容;数据解析处理至少包括:分词处理、实体链接处理、过滤处理、数据匹配处理与数据填充处理;所述分词处理基于预设分类标签的优先级参数进行,优先级参数包括预设的默认优先级参数和/或优化后的优先级参数;结构化内容新增模块,用于判断是否存在新增结构化内容;若是,则获取新增结构化内容对应的子模板或章节,并进行显示,再根据新增结构化内容,自动填写相应的结构化元素,以生成结构化报告;若否,则直接生成结构化报告。
11、此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于语音数据生成结构化报告的程序,所述基于语音数据生成结构化报告的程序被处理器执行时实现如上文所述的基于语音数据生成结构化报告的方法的步骤。
12、本专利技术的有益效果是:
13、(1)与现有技术相比,本专利技术通过将语音数据转换为文本数据后,结合数据解析处理步骤生成结构化报告内容,来实现结构化报告的快速录入,提升结构化报告的书写效率;并且基于预设分类标签的优先级参数进行分词处理,能够有效提高分词的准确度,以保证后续生成结构化报告内容的准确度;
14、(2)与现有技术相比,本专利技术通过结合文本数据的上下文信息进行实体识别,并且当分类标签被激活后,通过自动优化关联词的优先级参数,能够为关联词设置更高的优先级,进一步提高文本转化为结构化内容的过程中的分词的准确度;
15、(3)与现有技术相比,本专利技术通过语法元数据树记录结构化报告元素与自然语言文本之间的对应关系,为自然语言文本与结构化内容间的转换提供基础,能够提高结构化报告的生成效率;
16、(4)与现有技术相比,本专利技术通过基于预设过滤规则,对文本数据进行过滤,能够对一些不需要额外录入至结构化报告中的文本数据进行过滤,进一步提高结构化报告的录入速度与结构化报告的生成效率。
本文档来自技高网...【技术保护点】
1.基于语音数据生成结构化报告的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于语音数据生成结构化报告的方法,其特征在于:所述分词处理具体包括以下步骤:
3.根据权利要求2所述的基于语音数据生成结构化报告的方法,其特征在于:在第一匹配处理过程中,当分类标签被激活后,基于预设关联关系获取分词词库中属于该分类标签的关联词,并自动优化关联词的优先级参数,得到优化后的优先级参数。
4.根据权利要求3所述的基于语音数据生成结构化报告的方法,其特征在于:自动优化关联词的优先级参数具体为提高关联词的优先级。
5.根据权利要求3所述的基于语音数据生成结构化报告的方法,其特征在于:实体链接处理具体为:基于预设的知识库,将分词结果与对应的命名实体进行链接,得到命名实体对应的语义学编码。
6.根据权利要求5所述的基于语音数据生成结构化报告的方法,其特征在于:数据匹配处理具体包括以下步骤:
7.根据权利要求6所述的基于语音数据生成结构化报告的方法,其特征在于:数据填充处理具体为:将实体链接处理得到的语义学编码数组填充至
8.根据权利要求1所述的基于语音数据生成结构化报告的方法,其特征在于:过滤处理具体为:基于预设过滤规则,对文本数据进行过滤,过滤内容不录入结构化报告中。
9.基于语音数据生成结构化报告的系统,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于语音数据生成结构化报告的程序,所述基于语音数据生成结构化报告的程序被处理器执行时实现如权利要求1至8任一项所述的基于语音数据生成结构化报告的方法的步骤。
...【技术特征摘要】
1.基于语音数据生成结构化报告的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于语音数据生成结构化报告的方法,其特征在于:所述分词处理具体包括以下步骤:
3.根据权利要求2所述的基于语音数据生成结构化报告的方法,其特征在于:在第一匹配处理过程中,当分类标签被激活后,基于预设关联关系获取分词词库中属于该分类标签的关联词,并自动优化关联词的优先级参数,得到优化后的优先级参数。
4.根据权利要求3所述的基于语音数据生成结构化报告的方法,其特征在于:自动优化关联词的优先级参数具体为提高关联词的优先级。
5.根据权利要求3所述的基于语音数据生成结构化报告的方法,其特征在于:实体链接处理具体为:基于预设的知识库,将分词结果与对应的命名实体进行链接,得到命名实体对应的语义学编码。
6.根据权利要求5所述...
【专利技术属性】
技术研发人员:周建军,梁冬云,林炜峰,贺长征,岳新,张虽虽,
申请(专利权)人:复旦大学附属中山医院厦门医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。