System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于真实世界临床研究的智能化数据处理方法及系统技术方案_技高网

一种用于真实世界临床研究的智能化数据处理方法及系统技术方案

技术编号:41206775 阅读:3 留言:0更新日期:2024-05-07 22:33
本发明专利技术提供了一种用于真实世界临床研究的智能化数据处理方法及系统,涉及数据处理领域,包括:对所有临床科研记录文本进行分句,对获得的所有分句结果进行数据处理,获得每个分句结果的有效分句结果;对所有有效分句结果的字集合进行分词,基于获得的每个有效分句结果的字集合的所有分词结果,获得每个临床科研记录文本的所有特异词和非特异词,基于所有临床科研记录文本的所有特异词和非特异词获得每个临床科研记录文本的所有重点词;基于所有有效分句结果的字集合的分词结果获得所有重点词的重要度,并获得所有临床科研记录文本的核心信息。本发明专利技术根据所有真实世界临床科研记录文本进行核心信息的归纳,提高了真实世界临床科研的效率。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,特别涉及一种用于真实世界临床研究的智能化数据处理方法及系统


技术介绍

1、目前,随着社会的发展,医院对真实世界临床科研的扶持力度越来越大,真实世界临床科研产生了日益增长的真实世界临床文本,包括病理诊断、科研记录,给整个真实世界临床科研过程带来了全新挑战,如何对日益庞大的真实世界临床文本进行精炼,成为了真实世界临床科研的重中之重。

2、但是,现在未有一种对真实世界临床科研的大量记录文本进行核心信息归纳的方法,这阻碍了对大量医疗文本数据进行分析并挖掘其更深层次的价值,阻碍了对整个真实世界临床科研的进展,使得科研人员的大量精力被消耗在对大量数据的人工归纳整理上,拖慢了真实世界临床科研进度。

3、因此,本专利技术提出了一种用于真实世界临床研究的智能化数据处理方法及系统,用以根据所有真实世界临床科研记录文本进行核心信息的高效精确提取和归纳,提高了真实世界临床科研的效率。


技术实现思路

1、本专利技术提供一种用于真实世界临床研究的智能化数据处理方法及系统,用以通过对每个时刻的临床科研记录文本进行分句、数据处理、分词、词筛选获得所有特异词和所有非特异词,并根据所有时刻的临床科研记录文本的所有特异词和所有非特异词更精确地确定出对每个时刻的临床科研记录文本的所有重点词,并计算出了每个时刻的临床科研记录文本的每个重点词的重要度,根据将所有时刻的临床科研记录文本的所有重点词中排序序数小于预设序数阈值的重点词连接,实现对大量临床科研记录文本的核心信息的高效精准提取和归纳。

2、本专利技术提供一种用于真实世界临床研究的智能化数据处理方法,包括:

3、s1:获取所有时刻的临床科研记录文本,对每个时刻的临床科研记录文本进行分句,获得每个时刻的临床科研记录文本的所有分句结果,并对每个时刻的临床科研记录文本的每个分句结果进行数据处理,获得每个时刻的临床科研记录文本的每个分句结果的有效分句结果;

4、s2:对每个时刻的临床科研记录文本的所有有效分句结果的字集合进行分词,获得每个时刻的临床科研记录文本的每个有效分句结果的字集合的所有分词结果;

5、s3:基于每个时刻的临床科研记录文本的所有有效分句结果的字集合的所有分词结果,获得每个时刻的临床科研记录文本的所有特异词和所有非特异词,基于所有时刻的临床科研记录文本的所有特异词和所有非特异词获得每个时刻的临床科研记录文本的所有重点词;

6、s4:基于所有时刻的临床科研记录文本的所有有效分句结果的字集合的分词结果获得每个时刻的临床科研记录文本的每个重点词的重要度,基于所有时刻的临床科研记录文本的所有重点词的重要度获得所有时刻的临床科研记录文本的核心信息。

7、优选的,用于临床科研的智能化数据处理方法,s1:获取所有时刻的临床科研记录文本,对每个时刻的临床科研记录文本进行分句,获得每个时刻的临床科研记录文本的所有分句结果,并对每个时刻的临床科研记录文本的每个分句结果进行数据处理,获得每个时刻的临床科研记录文本的每个分句结果的有效分句结果,包括:

8、s101:获取所有时刻的临床科研记录文本,基于预设分句符号对每个时刻的临床科研记录文本进行分句,获得每个时刻的临床科研记录文本的所有分句结果;

9、s102:对每个时刻的临床科研记录文本的每个分句结果进行数据清洗处理,获得每个时刻的临床科研记录文本的每个分句结果的有效分句结果。

10、优选的,用于临床科研的智能化数据处理方法,s101:获取所有时刻的临床科研记录文本,基于预设分句符号对每个时刻的临床科研记录文本进行分句,获得每个时刻的临床科研记录文本的所有分句结果,包括:

11、s1011:获取所有时刻的临床科研记录文本,并对每个时刻的临床科研记录文本的所有语句符号进行识别,获得每个时刻的临床科研记录文本的语句符号识别结果;

12、s1012:将每个时刻的临床科研记录文本的语句符号识别结果中与预设分句符号相同的语句符号的所在位置作为对应时刻的临床科研记录文本进行分句的分句位置,基于每个时刻的临床科研的临床科研记录文本的所有分句位置获得每个时刻的临床科研记录文本的所有分句结果。

13、优选的,用于临床科研的智能化数据处理方法,s102:对每个时刻的临床科研记录文本的每个分句结果进行数据清洗处理,获得每个时刻的临床科研记录文本的每个分句结果的有效分句结果,包括:

14、s1021:基于预设筛除词库对每个时刻的临床科研记录文本的每个分句结果进行无意义词的筛除,获得每个时刻的临床科研记录文本的每个分句结果的筛除分句结果;

15、s1022:对每个时刻的临床科研记录文本的每个分句结果的筛除分句结果进行错误标识识别,将覆盖有错误标识的文字作为错误文字,将每个时刻的临床科研记录文本的每个分句结果的筛除分句结果中的所有错误文字删除,获得每个时刻的临床科研记录文本的每个分句结果的有效分句结果。

16、优选的,用于临床科研的智能化数据处理方法,s2:对每个时刻的临床科研记录文本的所有有效分句结果的字集合进行分词,获得每个时刻的临床科研记录文本的每个有效分句结果的字集合的所有分词结果,包括:

17、s201:将每个时刻的临床科研记录文本的每个有效分句结果中所有字作为集合元素构建每个时刻的临床科研记录文本的每个有效分句结果的字集合,且字集合中集合元素的相对位置与对应有效分句结果的字的相对位置一致;

18、s202:获得每个时刻的临床科研记录文本的每个有效分句结果的字集合中每个集合元素的左归属值和右归属值,基于每个时刻的临床科研记录文本的每个有效分句结果的字集合中每个集合元素的左归属值和右归属值,对每个时刻的临床科研记录文本的每个有效分句结果的字集合进行分词,获得每个时刻的临床科研记录文本的每个有效分句结果的字集合的所有分词结果。

19、优选的,用于临床科研的智能化数据处理方法,获得每个时刻的临床科研记录文本的每个有效分句结果的字集合中每个集合元素的左归属值和右归属值,包括:

20、;

21、;

22、其中,为每个有效分句结果的字集合中第个集合元素的左归属值,为每个有效分句结果的字集合中第个集合元素的右归属值,为在每个有效分句结果的字集合中第个集合元素的出现次数,为每个有效分句结果的字集合中第个集合元素在第个集合元素之前的所有集合元素中出现的次数,为每个有效分句结果的字集合中第1个集合元素,为每个有效分句结果的字集合中第个集合元素,为每个有效分句结果的字集合中第个集合元素在第个集合元素之后的所有集合元素中出现的次数,为每个有效分句结果的字集合中第个集合元素,且有效分句结果的字集合中有个集合元素,为自然对数,且自然常数e的取值为2.718。

23、优选的,用于临床科研的智能化数据处理方法,基于每个时刻的临床科研记录文本的每个有效分句结果的字集合中每个集合元素的左归属值和右归属值,对每个时刻的本文档来自技高网...

【技术保护点】

1.一种用于真实世界临床研究的智能化数据处理方法,其特征在于,包括:

2.根据权利要求1所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,S1:获取所有时刻的临床科研记录文本,对每个时刻的临床科研记录文本进行分句,获得每个时刻的临床科研记录文本的所有分句结果,并对每个时刻的临床科研记录文本的每个分句结果进行数据处理,获得每个时刻的临床科研记录文本的每个分句结果的有效分句结果,包括:

3.根据权利要求2所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,S101:获取所有时刻的临床科研记录文本,基于预设分句符号对每个时刻的临床科研记录文本进行分句,获得每个时刻的临床科研记录文本的所有分句结果,包括:

4.根据权利要求2所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,S102:对每个时刻的临床科研记录文本的每个分句结果进行数据清洗处理,获得每个时刻的临床科研记录文本的每个分句结果的有效分句结果,包括:

5.根据权利要求1所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,S2:对每个时刻的临床科研记录文本的所有有效分句结果的字集合进行分词,获得每个时刻的临床科研记录文本的每个有效分句结果的字集合的所有分词结果,包括:

6.根据权利要求5所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,获得每个时刻的临床科研记录文本的每个有效分句结果的字集合中每个集合元素的左归属值和右归属值,包括:

7.根据权利要求5所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,基于每个时刻的临床科研记录文本的每个有效分句结果的字集合中每个集合元素的左归属值和右归属值,对每个时刻的临床科研记录文本的每个有效分句结果的字集合进行分词,包括:

8.根据权利要求1所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,S3:基于每个时刻的临床科研记录文本的所有有效分句结果的字集合的所有分词结果,获得每个时刻的临床科研记录文本的所有特异词和所有非特异词,基于所有时刻的临床科研记录文本的所有特异词和所有非特异词获得每个时刻的临床科研记录文本的所有重点词,包括:

9.根据权利要求1所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,S4:基于所有时刻的临床科研记录文本的所有有效分句结果的字集合的分词结果获得每个时刻的临床科研记录文本的每个重点词的重要度,基于所有时刻的临床科研记录文本的所有重点词的重要度获得所有时刻的临床科研记录文本的核心信息,包括:

10.一种用于真实世界临床研究的智能化数据处理系统,其特征在于,用于执行权利要求1至9中任一所述的一种用于真实世界临床研究的智能化数据处理方法,包括:

...

【技术特征摘要】

1.一种用于真实世界临床研究的智能化数据处理方法,其特征在于,包括:

2.根据权利要求1所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,s1:获取所有时刻的临床科研记录文本,对每个时刻的临床科研记录文本进行分句,获得每个时刻的临床科研记录文本的所有分句结果,并对每个时刻的临床科研记录文本的每个分句结果进行数据处理,获得每个时刻的临床科研记录文本的每个分句结果的有效分句结果,包括:

3.根据权利要求2所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,s101:获取所有时刻的临床科研记录文本,基于预设分句符号对每个时刻的临床科研记录文本进行分句,获得每个时刻的临床科研记录文本的所有分句结果,包括:

4.根据权利要求2所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,s102:对每个时刻的临床科研记录文本的每个分句结果进行数据清洗处理,获得每个时刻的临床科研记录文本的每个分句结果的有效分句结果,包括:

5.根据权利要求1所述的一种用于真实世界临床研究的智能化数据处理方法,其特征在于,s2:对每个时刻的临床科研记录文本的所有有效分句结果的字集合进行分词,获得每个时刻的临床科研记录文本的每个有效分句结果的字集合的所有分词结果,包括:

6.根据权利要求5所述的一种用于真实世界临床研究的智能化数...

【专利技术属性】
技术研发人员:王耀贤王冰叶柳香
申请(专利权)人:广州源高网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1