一种生成医疗报告的方法及装置制造方法及图纸

技术编号：32118422 阅读：20 留言：0更新日期：2022-01-29 19:04

本申请公开了一种生成医疗报告的方法及装置，通过获取初始数据，对所述初始数据进行识别获取待生成报告文本；对所述待生成报告文本进行预处理获取预处理后的句子集合；对所述预处理后的句子集合进行处理获得重要句子集合；对所述重要句子集合进行命名实体识别获取实体属性集；获取报告模板，添加实体属性至报告模板中的对应位置，生成目标医疗报告，不仅可以提高效率，还能保证准确率，得到更加精准的报告。的报告。的报告。

全部详细技术资料下载

【技术实现步骤摘要】
一种生成医疗报告的方法及装置

[0001]本申请涉及计算机
，尤其涉及一种生成医疗报告的方法及装置。

技术介绍

[0002]医疗平台的业务中包含在线医学教学、视频诊疗会议等，在完成以上业务后，需要对以上教学课程或者诊疗会议进行相关的总结，由于人工完成不仅需要撰写者具备一定的专业知识，还需要浪费大量的时间进行会议纪要和整理，所以提出一种根据患者信息、视频内容进行总结，最终得到一个专业的医疗报告的方法。使用计算机代替人进行工作，不仅可以提高效率，还能保证准确率。
[0003]目前报告生成的方式主要是根据指定的模板，提取关键字、关键词以及关键语句等，在按照其属性填充到指定的模板内，从而得到一份报告，也就是采用基于抽取式方法。但是该方法的关键字词等均得来自原文，较为笨拙。而且文本重要性语句提取的方案主要是基于词频或者基于图结构的关键词和句子抽取，每一篇文本都是独立提取的，然而在大量的医疗会议记录中，实际成批的同类型记录文本中，可能内嵌的主题是一致的，是具有一定关联性的，以上方法并没有考虑到这一点，因此提取文本中的重要性语句效果不甚理想。另外通过词频计算的方式获取关键词往往无法知道关键词的属性，因此无法使用更为准确的模板，得到更加精准的报告。

技术实现思路

[0004]本申请提供了一种生成医疗报告的方法及装置，以解决现有方法无法使用更为准确的模板，得到更加精准的报告的问题。
[0005]第一方面，为实现上述目的，本申请提供了一种生成医疗报告的方法，所述方法包括：
[0006]获取初...

【技术保护点】

【技术特征摘要】
1.一种生成医疗报告的方法，其特征在于，所述方法包括：获取初始数据，对所述初始数据进行识别获取待生成报告文本；对所述待生成报告文本进行预处理获取预处理后的句子集合；对所述预处理后的句子集合进行处理获得重要句子集合；对所述重要句子集合进行命名实体识别获取实体属性集；获取报告模板，添加实体属性至报告模板中的对应位置，生成目标医疗报告。2.根据权利要求1所述的生成医疗报告的方法，其特征在于，所述对所述待生成报告文本进行预处理获取预处理后的句子集合，包括：对所述待生成报告文本进行分句、对所述待生成报告文本去除无用助词和\或对所述待生成报告文本中的医学专属名词进行纠正。3.根据权利要求2所述的生成医疗报告的方法，其特征在于，所述对所述待生成报告文本进行分句，包括：获取待生成报告文本中的标点符号及预设的分句最大长度；根据标点符号对待生成报告文本进行切分，获取第一分句集；遍历第一分句集，如果分句长度大于预设的分句最大长度，则对分句进行切分，获取第二分句集。4.根据权利要求1所述的生成医疗报告的方法，其特征在于，所述对所述预处理后的句子集合进行处理获得重要句子集合，包括：将所述预处理后的句子集合输入训练好的LDA主题模型，获取对应的主题；根据主题内词汇的概率分布，获取句子重要程度值；通过将所述句子重要程度值与阈值比较后，提取句子重要程度值大于阈值的句子，获取重要句子合集。5.根据权利要求4所述的生成医疗报告的方法，其特征在于，所述阈值为动态计算得到的数值。6.一种生成医疗报告...

【专利技术属性】
技术研发人员：岑汉，袁孟全，杨建，谭涛，
申请(专利权)人：贵阳叁玖互联网医疗有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人