一种组织病理报告的结构化处理方法及装置制造方法及图纸

技术编号:38878897 阅读:15 留言:0更新日期:2023-09-22 14:10
本发明专利技术涉及组织病理报告结构化技术领域,揭露了一种组织病理报告的结构化处理方法,包括:根据第一病理模板及第二病理模板构建病理组合模板,得到病理类目的病理组合模板集,获取病理诊断词语集所属的病理类目,获取每个病理组合模板的关键词频序列,根据所述关键词频序列计算病理组合模板与初始病理诊断文本的相似度,得到相似模板序列,根据相似模板序列提取的目标病理组合模板,接收用户在目标病理组合模板中输入的病理文本信息,得到目标病理报告文本。本发明专利技术还提出一种组织病理报告的结构化处理装置、电子设备以及计算机可读存储介质。本发明专利技术可以解决当前组织病理报告的填写存在结构化程度低,展示效果不佳的问题。展示效果不佳的问题。展示效果不佳的问题。

【技术实现步骤摘要】
一种组织病理报告的结构化处理方法及装置


[0001]本专利技术涉及组织病理报告结构化
,尤其涉及一种组织病理报告的结构化处理方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]组织病理报告是病理科医生撰写的医学报告,用于描述组织标本的病理学特征。可以包括标本来源、组织学特征、病理学特征、病理分级以及病理学评估等内容,组织病理报告对于病理诊断、治疗以及预后判断具有重要的意义。
[0003]组织病理报告的发布过程通常包括:样本收集、样本预处理、制片、阅片以及组织病理报告发布等过程。当前组织病理报告主要是医护工作人员根据组织病理的检查结果在病理系统中输入病理诊断报告,但病理诊断报告的表达形式通常比较杂乱,且一些流程步骤仍然存在纸质化的记录方式,因此当前组织病理报告的填写存在结构化程度低,展示效果不佳的问题。

技术实现思路

[0004]本专利技术提供一种组织病理报告的结构化处理方法、装置及计算机可读存储介质,其主要目的在于解决当前组织病理报告的填写存在结构化程度低,展示效果不佳的问题。
[0005]为实现上述目的,本专利技术提供的一种组织病理报告的结构化处理方法,包括:
[0006]获取病理类目集及所述病理类目集中每一个病理类目对应的病理类目题库,接收所述病理类目对应的病理名称集;
[0007]在所述病理名称集中依次提取病理名称,接收用户根据所述病理名称在所述病理类目题库中提取的病理题目集;
[0008]接收用户在所述病理题目集中标识的标签题目集,根据所述标签题目集构建第一病理模板,根据所述病理题目集及标签题目集构建第二病理模板;
[0009]根据所述第一病理模板及第二病理模板构建每个病理名称对应的病理组合模板,得到每个病理类目对应的病理组合模板集;
[0010]获取初始病理诊断文本,对所述初始病理诊断文本进行分词处理,得到病理诊断词语集;
[0011]获取所述初始病理诊断文本所属的病理类目,提取所述初始病理诊断文本所属的病理类目对应的病理组合模板集;
[0012]利用预构建的逆文档频率计算公式依次获取所述病理组合模板集中每个病理组合模板的关键词频序列;
[0013]根据所述关键词频序列计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度,得到相似模板序列;
[0014]接收用户根据所述相似模板序列在所述病理组合模板集中提取的目标病理组合模板;
[0015]接收用户根据所述初始病理诊断文本,在所述目标病理组合模板中输入的病理文本信息,得到目标病理报告文本。
[0016]可选地,所述利用预构建的逆文档频率计算公式依次获取所述病理组合模板集中每个病理组合模板的关键词频序列,包括:
[0017]在所述病理组合模板集中依次提取病理组合模板,在所述病理组合模版中依次提取模板词语;
[0018]识别所述模板词语在所述病理组合模板中的出现次数及所述病理组合模板中的总模板词语数;
[0019]根据所述模板词语在所述病理组合模板中的出现次数及总模板词语数计算所述模板词语在所述病理组合模板中的词频;
[0020]获取所述病理组合模板集中的病理组合模板数;
[0021]在所述病理组合模板集中识别包含所述模板词语的相关病理组合模板,统计所述相关病理组合模板的数量;
[0022]根据所述病理组合模板集中的病理组合模板数及所述相关病理组合模板的数量计算所述模板词语的逆文档频率;
[0023]根据所述模板词语在所述病理组合模板中的词频及所述逆文档频率,利用预构建的逆文档频率计算公式计算所述模板词语在所述病理组合模板中的关键指数;
[0024]根据所述病理组合模板中每个模板词语的关键指数对所述模板词语进行排序,得到所述关键词频序列。
[0025]可选地,所述逆文档频率计算公式,如下所示:
[0026][0027]其中,f
i
表示所述病理组合模板中第i个模板词语的关键指数,M表示所述病理组合模板中的模板词语总数,m
i
表示所述病理组合模板中第i个模板词语在所述病理组合模板中出现的次数,n
i
表示相关病理组合模板的数量,N表示病理组合模板集中的病理组合模板数,表示所述模板词语在所述病理组合模板中的词频,表示所述模板词语的逆文档频率。
[0028]可选地,所述根据所述关键词频序列计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度,得到相似模板序列,包括:
[0029]在所述病理组合模板集中依次提取病理组合模板,提取所述病理组合模板的关键词频序列;
[0030]识别所述病理诊断词语集与所述关键词频序列中的相同词语,得到相同词语集;
[0031]识别所述相同词语集中每个相同词语在所述初始病理诊断文本中的出现次数;
[0032]根据所述相同词语在所述初始病理诊断文本中的出现次数及所述相同词语的在所述关键词频序列中的关键指数,利用预构建的相似度计算公式计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度;
[0033]根据所述病理组合模板与所述初始病理诊断文本的相似度对所述病理组合模板集中每个病理组合模板进行排序,得到所述相似模板序列。
[0034]可选地,所述相似度计算公式,如下所示:
[0035][0036]其中,l表示病理组合模板与所述初始病理诊断文本的相似度,j表示相同词语在相同词语集中的序数,J表示相同词语集中相同词语的总数,f
j
表示相同词语集中第j个相同词语在关键词频序列中的关键指数,x
j
表示相同词语集中第j个相同词语在所述初始病理诊断文本中的出现次数,k表示调节因子。
[0037]可选地,所述接收用户根据所述初始病理诊断文本在所述目标病理组合模板中输入的病理文本信息,得到目标病理报告文本之后,所述方法还包括:
[0038]接收用户输入的检索关键词,在所述目标病理报告文本中提取第二病理模板中的模板词语集;
[0039]将所述检索关键词与模板词语集中的模板词语进行逐一匹配,得到匹配结果;
[0040]判断所述匹配结果是否为空;
[0041]若所述匹配结果不为空,则将所述匹配结果返回至预构建的用户界面;
[0042]若所述匹配结果为空,则在所述目标病理报告文本中提取第一病理模板中的模板词语集,并将所述检索关键词与模板词语集中的模板词语进行逐一匹配,得到匹配结果;
[0043]判断所述匹配结果是否为空;
[0044]若所述匹配结果为空,则提示用户所述检索关键词不存在;
[0045]若所述匹配结果不为空,则将所述匹配结果返回至所述用户界面。
[0046]可选地,所述根据所述病理题目集及标签题目集构建第二病理模板,包括:
[0047]在所述标签题目集中依次提取标签题目;
[0048]在所述病本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种组织病理报告的结构化处理方法,其特征在于,所述方法包括:获取病理类目集及所述病理类目集中每一个病理类目对应的病理类目题库,接收所述病理类目对应的病理名称集;在所述病理名称集中依次提取病理名称,接收用户根据所述病理名称在所述病理类目题库中提取的病理题目集;接收用户在所述病理题目集中标识的标签题目集,根据所述标签题目集构建第一病理模板,根据所述病理题目集及标签题目集构建第二病理模板;根据所述第一病理模板及第二病理模板构建每个病理名称对应的病理组合模板,得到每个病理类目对应的病理组合模板集;获取初始病理诊断文本,对所述初始病理诊断文本进行分词处理,得到病理诊断词语集;获取所述初始病理诊断文本所属的病理类目,提取所述初始病理诊断文本所属的病理类目对应的病理组合模板集;利用预构建的逆文档频率计算公式依次获取所述病理组合模板集中每个病理组合模板的关键词频序列;根据所述关键词频序列计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度,得到相似模板序列;接收用户根据所述相似模板序列在所述病理组合模板集中提取的目标病理组合模板;接收用户根据所述初始病理诊断文本,在所述目标病理组合模板中输入的病理文本信息,得到目标病理报告文本。2.如权利要求1所述的组织病理报告的结构化处理方法,其特征在于,所述利用预构建的逆文档频率计算公式依次获取所述病理组合模板集中每个病理组合模板的关键词频序列,包括:在所述病理组合模板集中依次提取病理组合模板,在所述病理组合模版中依次提取模板词语;识别所述模板词语在所述病理组合模板中的出现次数及所述病理组合模板中的总模板词语数;根据所述模板词语在所述病理组合模板中的出现次数及总模板词语数计算所述模板词语在所述病理组合模板中的词频;获取所述病理组合模板集中的病理组合模板数;在所述病理组合模板集中识别包含所述模板词语的相关病理组合模板,统计所述相关病理组合模板的数量;根据所述病理组合模板集中的病理组合模板数及所述相关病理组合模板的数量计算所述模板词语的逆文档频率;根据所述模板词语在所述病理组合模板中的词频及所述逆文档频率,利用预构建的逆文档频率计算公式计算所述模板词语在所述病理组合模板中的关键指数;根据所述病理组合模板中每个模板词语的关键指数对所述模板词语进行排序,得到所述关键词频序列。3.如权利要求2所述的组织病理报告的结构化处理方法,其特征在于,所述逆文档频率
计算公式,如下所示:其中,f
i
表示所述病理组合模板中第i个模板词语的关键指数,M表示所述病理组合模板中的模板词语总数,m
i
表示所述病理组合模板中第i个模板词语在所述病理组合模板中出现的次数,n
i
表示相关病理组合模板的数量,N表示病理组合模板集中的病理组合模板数,表示所述模板词语在所述病理组合模板中的词频,表示所述模板词语的逆文档频率。4.如权利要求2所述的组织病理报告的结构化处理方法,其特征在于,所述根据所述关键词频序列计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度,得到相似模板序列,包括:在所述病理组合模板集中依次提取病理组合模板,提取所述病理组合模板的关键词频序列;识别所述病理诊断词语集与所述关键词频序列中的相同词语,得到相同词语集;识别所述相同词语集中每个相同词语在所述初始病理诊断文本中的出现次数;根据所述相同词语在所述初始病理诊断文本中的出现次数及所述相同词语的在所述关键词频序列中的关键指数,利用预构建的相似度计算公式计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度根据所述病理组合模板与所述初始病理诊断文本的相似度对所述病理组合模板集中每个病理组合模板进行排序,得到所述相似模板序列。5...

【专利技术属性】
技术研发人员:陶康培车拴龙丁向东苏钜铭刘斯李映华梁小丹梁耀铭
申请(专利权)人:广州金域医学检验集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1