System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于电子文本确定患者新发时间的方法和系统技术方案_技高网

一种基于电子文本确定患者新发时间的方法和系统技术方案

技术编号:41127408 阅读:2 留言:0更新日期:2024-04-30 17:55
本发明专利技术公开一种基于电子文本确定患者新发时间的方法,其中电子文本来自病例和文字信息表,包括:基于病例和文字信息表抽取数据信息;对数据信息进行遴选以确定适于进行模式匹配的电子文本;遴选的规则包括用于进行模式匹配的电子文本的上下文不能出现时间特定文本表达;基于模式匹配规则将用于进行模式匹配的电子文本与一种或多种特定模式匹配;基于所确定的模式编号和时间确定原则,确定患者新发时间。还公开对应系统、电子设备及计算机可读存储介质,基于提取的电子文本和设定的规则进行模式划分,然后根据模式作为患者新发时间的识别和选择,清晰并高效提取患者新发时间,与疾病种类共同为后续诊疗提供可靠且关键的信息。

【技术实现步骤摘要】

本专利技术涉及医疗诊断信息化,尤其涉及一种基于电子文本确定患者新发时间的方法和系统


技术介绍

1、目前医院系统均采用电子病历的形式进行患者病情和病程管理,电子病历包含患者基本信息、诊断信息、入出院记录、病程记录、手术记录等信息,通过对电子病历的信息挖掘,可以较为精准地判断患者的新发时间,对疑似新发患者的新发时间进行验证。然而,由于电子病历数据体量较大,目前的数据挖掘只能采用人工审查的方式,无疑会浪费大量的时间和人力。借助计算机技术可大幅度提高工作效率,然而,电子病历存在大量的非结构化的文本类信息、专业名词众多、时间信息结构多样。并且,不同医疗机构和临床医生的电子病历的书写方式、语义表征均存在差别。因此,如何基于对接端口医疗机构的电子文本,快速、准确地提取出患者的新发时间是一项重要且困难的工作。


技术实现思路

1、本专利技术的目的是提供一种基于电子文本确定患者新发时间的方法和系统,基于提取的病例信息和文字信息表,首先根据设定的符合自然规律的规则进行模式划分,然后根据模式依次提取时间作为分析的计算结果的方式进行患者新发时间的识别和选择,从而清晰准确并高效的基于电子文本提取出患者的新发时间,疾病种类和确定时间为后续诊疗提供了可靠并且关键的信息,提高了治愈率。

2、本专利技术一方面提供了一种基于电子文本确定患者新发时间的方法,其中电子文本来自病例和文字信息表,包括:

3、s1,基于病例和文字信息表抽取数据信息;

4、s2,对所述数据信息进行遴选以确定适于进行模式匹配的电子文本;所述遴选的规则包括用于进行所述模式匹配的电子文本的上下文不能出现时间特定文本表达;

5、s3,基于模式匹配规则将用于进行所述模式匹配的电子文本与一种或多种特定模式匹配;

6、s4,基于所确定的模式编号和时间确定原则,确定患者新发时间。

7、优选的,所述s1包括:

8、s11,基于病例提取主诊代码和其他诊断代码;

9、s12,基于多个文字信息表抽取一个或多个特定数据信息,包括:基于入院记录表提取主诉信息,基于入院观察表提取现病史信息,基于首次病程记录表提取病例特点信息,基于日常病程记录提取病程详细记录信息,基于出院记录表提取诊疗过程信息。

10、优选的,所述时间特定文本表达包括末次、最后、最终、再次、复发、移植、根治术、缓解期、放化疗、放疗、化疗、结疗和/或输液港。

11、优选的,所述特定模式包括:

12、模式0:用于判断主诉是否匹配成功;

13、模式1:用于判断病理任意字段是否匹配成功从而确定病理结果是否匹配;

14、模式2:用于判断任意字段是否能够提取入院时间;

15、模式3:用于判断主诉是否匹配成功;

16、模式4:用于判断任意字段是否匹配成功;

17、模式5:用于判断除主诉外任意字段是否匹配成功。

18、优选的,基于第零匹配规则将用于进行所述模式匹配的电子文本与模式0匹配,所述第零匹配规则包括:

19、当用于进行所述模式匹配的电子文本中的疾病字段中出现第一特定文本表达附加时间段,且所述第一特定文本表达与所述时间段限制在一个分句中,则确定所述用于进行所述模式匹配的电子文本与模式0匹配,所述主诉匹配成功,所述时间段为患者新发时间;

20、基于第一匹配规则将用于进行所述模式匹配的电子文本与模式1匹配,所述第一匹配规则包括如下四种情况中的一种或多种:

21、(1)用于进行所述模式匹配的电子文本中的任意字段文字中出现“日期+第二特定文本表达+第三特定文本表达”,并且从第二特定文本表达到第三特定文本表达的最末端词根不超过30个字;

22、(2)用于进行所述模式匹配的电子文本中的任意字段文字中出现“第二特定文本表达+日期+第三特定文本表达”,并且从第二特定文本表达到第三特定文本表达的最末端词根不超过45个字;

23、(3)用于进行所述模式匹配的电子文本中的任意字段文字中出现“日期+第四特定文本表达+第五特定文本表达”,并且从第四特定文本表达到第五特定文本表达不超过30个字;

24、(4)用于进行所述模式匹配的电子文本中的任意字段文字中出现“第四特定文本表达+日期+第五特定文本表达”,并且从第四特定文本表达到第五特定文本表达不超过45个字;

25、符合(1)-(4)中任意一项或多项,则确定用于进行所述模式匹配的电子文本与模式1匹配;所述日期为患者新发时间;

26、优选的,基于第二匹配规则将用于进行所述模式匹配的电子文本与模式2匹配,即判断任意字段是否能够提取入院时间,所述第二匹配规则包括如下六种情况中的一种或多种:

27、(1)用于进行所述模式匹配的电子文本中的任意字段文字中出现“现/今+{0,5}+进一步+{0,5}+我院/我科/本院/本科”;

28、(2)用于进行所述模式匹配的电子文本中的任意字段文字中出现“现/今+{0,5}+我院/我科/本院/本科+{0,5}+进一步”;

29、(3)用于进行所述模式匹配的电子文本中的任意字段文字中出现“为+{0,10}+诊+{0,10}+我院/我科/本院/本科”;

30、(4)用于进行所述模式匹配的电子文本中的任意字段文字中出现“第六特定文本表达+第三特定文本表达”;并且总字数不超过50字;

31、(5)用于进行所述模式匹配的电子文本中的任意字段文字中出现“入院+检查+第四特定文本表达+第五特定文本表达”;并且总字数不超过50字;

32、(6)用于进行所述模式匹配的电子文本中的任意字段文字中出现“入院+第四特定文本表达+第五特定文本表达”;并且总字数不超过50字;

33、符合(1)-(6)中任意一项或多项,则确定用于进行所述模式匹配的电子文本与模式2匹配,其中每种情况发生的时间为患者新发时间;

34、基于第三匹配规则将用于进行所述模式匹配的电子文本与模式3匹配,即判断用于判断主诉是否匹配成功,所述第三匹配规则包括如下四种情况中的一种或多种:

35、(1)所述主诉信息中出现:诊/疗/术后+时间段;

36、(2)所述主诉信息中出现:时间段+诊/疗/术后;

37、(3)所述主诉信息中出现:时间段+首次/第一次/初次+入院/住院;

38、(4)所述主诉信息中出现:首次/第一次/初次+时间段+入院/住院;

39、符合(1)-(4)中任意一项或多项,则确定用于进行所述模式匹配的电子文本与模式3匹配,主诉匹配成功,时间段对应患者新发时间;

40、基于第四匹配规则将用于进行所述模式匹配的电子文本与模式4匹配,即判断任意字段匹配成功;所述第四匹配规则包括如下两种情况中的一种或多种:

41、(1)用于进行所述模式匹配的电子文本中的任意字段文字中出现“日期+ct+第一特定文本文档来自技高网...

【技术保护点】

1.一种基于电子文本确定患者新发时间的方法,其中电子文本来自病例和文字信息表,其特征在于,包括:

2.根据权利要求1所述的一种基于电子文本确定患者新发时间的方法,其特征在于,所述S1包括:

3.根据权利要求2所述的一种基于电子文本确定患者新发时间的方法,其特征在于,所述时间特定文本表达包括末次、最后、最终、再次、复发、移植、根治术、缓解期、放化疗、放疗、化疗、结疗和/或输液港。

4.根据权利要求3所述的一种基于电子文本确定患者新发时间的方法,其特征在于,所述特定模式包括:

5.根据权利要求4所述的一种基于电子文本确定患者新发时间的方法,其特征在于,基于第零匹配规则将用于进行所述模式匹配的电子文本与模式0匹配,所述第零匹配规则包括:

6.根据权利要求5所述的一种基于电子文本确定患者新发时间的方法,其特征在于,所述第一特定文本表达包括:霍奇金、恶性、癌、白血病、伯基特、间皮、母细胞、淋巴瘤、肉瘤或朗格;所述第二特定文本表达与病理检测方式相关,为“病理/病检/活检/石蜡切片/冰冻包埋”;所述第三特定文本表达与疾病相关,为“霍奇金、恶性、癌、白血病、伯基特、间皮、母细胞、瘤、肿物、肿块、占位或朗格”;所述第四特定文本表达与特殊病理检测方式相关,为“骨髓/骨穿/MICM”;所述第五特定文本表达与特定疾病相关,为“白血病”。

7.根据权利要求6所述的一种基于电子文本确定患者新发时间的方法,其特征在于,所述时间确定原则包括:

8.一种基于电子文本确定患者新发时间的系统,用于实施权利要求1-7任一所述的方法,其特征在于,包括:

9.一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器用于读取所述指令并执行如权利要求1-7任一所述的方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述多条指令可被处理器读取并执行如权利要求1-7任一所述的方法。

...

【技术特征摘要】

1.一种基于电子文本确定患者新发时间的方法,其中电子文本来自病例和文字信息表,其特征在于,包括:

2.根据权利要求1所述的一种基于电子文本确定患者新发时间的方法,其特征在于,所述s1包括:

3.根据权利要求2所述的一种基于电子文本确定患者新发时间的方法,其特征在于,所述时间特定文本表达包括末次、最后、最终、再次、复发、移植、根治术、缓解期、放化疗、放疗、化疗、结疗和/或输液港。

4.根据权利要求3所述的一种基于电子文本确定患者新发时间的方法,其特征在于,所述特定模式包括:

5.根据权利要求4所述的一种基于电子文本确定患者新发时间的方法,其特征在于,基于第零匹配规则将用于进行所述模式匹配的电子文本与模式0匹配,所述第零匹配规则包括:

6.根据权利要求5所述的一种基于电子文本确定患者新发时间的方法,其特征在于,所述第一特定文本表达包括:霍奇金、恶性、癌、白血病、伯基特、间皮、母细胞、淋...

【专利技术属性】
技术研发人员:张啸倪鑫李哲刘原虎白国良李新平曾跃萍段彦龙葛明徐新
申请(专利权)人:首都医科大学附属北京儿童医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1