System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及文本处理,特别是涉及一种获取病历文本对应标签的系统。
技术介绍
1、目前,随着患病人数的增加,如制定病种路径的管理模式成为热门研究方式,通过确定病种对应的操作路径能够降低监护工作的复杂程度,提高工作效率,尽可能实现“同病同住”,然而在获取病种路径前,需要从病历文本中获取到对应的操作信息,如何从病历文本中高效且准确的获取相应标签成为热门研究方向。
2、现有技术中,确定病历文本对应标签的方法为:获取病历文本,将病历文本分成若干个字符数量低于预设阈值的文本,对拆分后的文本聚类,对聚类后每一类的病历文本进行利用训练好的模型进行标注,从而获取到病历文本对应的标签,综上,未采用不同的方式获取病历文本对应的标签,未从多个角度对病历文本进行分析获取对应的标签,降低了获取到病历文本对应标签的效率,使得获取到的病历文本对应标签的准确性较低。
技术实现思路
1、针对上述技术问题,本专利技术采用的技术方案为:一种获取病历文本对应标签的系统,系统包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:
2、s100,获取目标病历文本列表l={l1,……,lg,……,lh},lg为第g个目标病历文本,g=1……h,h为目标病历文本的数量。
3、s200,对l采用第一方式进行处理,获取l对应的第一目标标签列表l1={l11,……,l1g,……,l1h},l1g为lg对应的第一目标标签。
4、s300,对l采用第二方式进行处理
5、s400,当l1g与l2g一致时,获取l1g为lg对应的目标标签。
6、s500,当l1g与l2g不一致时,获取lg对应的目标标签,其中,在s500中通过如下步骤获取lg对应的目标标签:
7、s501,获取样本病历文本集dk={dk1,……,dkε,……,dkz},dkε为第ε个样本病历文本,ε=1……z,z为样本病历文本的数量。
8、s502,对dk采用第一方式进行处理,获取dk对应的样本标签列表集,其中,所述样本标签列表集中包括若干个样本标签列表,所述样本标签列表中包括若干个样本标签,每个样本病历文本对应一个样本标签列表。
9、s503,获取lg对应的候选标签对glg=(l1g-1,l1g),其中,l1g-1为lg-1对应的第一目标标签。
10、s504,根据样本标签列表集,获取glg对应的关键优先级flg,其中,flg符合如下条件:
11、flg=gl0g/z,gl0g为样本标签列表集中包括glg的样本标签列表的数量。
12、s505,当flg≥fl0时,获取l1g为lg对应的目标标签,fl0为预设的关键优先级阈值。
13、s506,当flg<fl0时,获取l2g为lg对应的目标标签。
14、本专利技术与现有技术相比具有明显的有益效果,借由上述技术方案,本专利技术提供的一种获取病历文本对应标签的系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:
15、本专利技术为一种获取病历文本对应标签的系统,系统包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取目标病历文本列表,对目标病历文本列表采用第一方式进行处理,获取目标病历文本列表对应的第一目标标签列表,对目标病历文本列表采用第二方式进行处理,获取目标病历文本列表对应的第二目标标签列表,当第一目标标签和第二目标标签一致时,获取第一目标标签为目标标签,当第一目标标签和第二目标标签不一致时,获取样本病历文本集,对样本病历文本集采用第一方式进行处理,获取样本病历文本集对应的样本标签列表集,获取目标病历文本对应的候选标签对,根据样本标签列表集,获取候选标签对对应的关键优先级,根据关键优先级,获取目标标签,本实施例采用不同的方式获取病历文本对应的标签,利用模型和文本的特性对病历文本进行处理获取对应的标签,提高了获取到病历文本对应标签的效率,当获取到的标签不一致时,利用模型对病历文本中前后连接的文本进行处理获取到若干个标签对,基于标签对的优先级采用不同方式获取到目标标签,使得获取到的病历文本对应标签的准确性较高。
16、上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
本文档来自技高网...【技术保护点】
1.一种获取病历文本对应标签的系统,其特征在于,所述系统包括:处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:
2.根据权利要求1所述的获取病历文本对应标签的系统,其特征在于,所述目标病历文本为将待获取标签的病历文本按照预设分隔符进行拆分后获取到的病历文本。
3.根据权利要求1所述的获取病历文本对应标签的系统,其特征在于,所述系统中还包括预设标签列表,所述预设标签列表中包括若干个预设标签,所述预设标签为对产生疾病的用户身体进行处理过程中过程节点对应的词。
4.根据权利要求3所述的获取病历文本对应标签的系统,其特征在于,在S200中通过如下步骤获取L1g:
5.根据权利要求4所述的获取病历文本对应标签的系统,其特征在于,具体的,在S201中通过如下步骤获取目标模型:
6.根据权利要求5所述的获取病历文本对应标签的系统,其特征在于,η0的取值范围为0.01~0.1。
7.根据权利要求1所述的获取病历文本对应标签的系统,其特征在于,在S300中通过如下步骤获取L2g:
【技术特征摘要】
1.一种获取病历文本对应标签的系统,其特征在于,所述系统包括:处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:
2.根据权利要求1所述的获取病历文本对应标签的系统,其特征在于,所述目标病历文本为将待获取标签的病历文本按照预设分隔符进行拆分后获取到的病历文本。
3.根据权利要求1所述的获取病历文本对应标签的系统,其特征在于,所述系统中还包括预设标签列表,所述预设标签列表中包括若干个预设标签,所述预设标签为对产生疾病的用户身体进行处理...
【专利技术属性】
技术研发人员:李忠波,王军江,刘康康,陈阳,王志鹏,
申请(专利权)人:奇点智保北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。