眼科VEGF相关的多维临床试验数据处理方法和系统技术方案

技术编号:28127190 阅读:20 留言:0更新日期:2021-04-19 11:43
本发明专利技术提供一种眼科VEGF相关的多维临床试验数据处理方法和系统,涉及医疗数据处理技术领域。本发明专利技术获取眼科VEGF相关的多维临床试验的原始数据并进行预处理;将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;根据所述结果数据集,得到定向需求数据。定制化眼科VEGF相关的多维临床试验数据处理,针对性强;数据产出结构化,可应用性强。可应用性强。可应用性强。

【技术实现步骤摘要】
眼科VEGF相关的多维临床试验数据处理方法和系统


[0001]本专利技术涉及医疗数据处理
,具体涉及一种眼科VEGF相关的多维临床试验数据处理方法和系统。

技术介绍

[0002]医生对患者诊疗和治疗过程中产生的数据,包括患者的基本数据、电子病历、诊疗数据、医学影像数据、医学管理、经济数据、医疗设备和仪器数据等,以患者为中心,成为医疗数据的主要来源。
[0003]目前,针对眼科VEGF(内皮生长因子)相关的多维临床试验数据,现有的处理模型涉及文法开发,需要将文法结果和实际应用数据结合做特有化的语义表征关联,但由于当前自然语言中存在海量的文法结构,造成搜索空间巨大,避免生成歧义输出对现有产品是一大挑战。此外,医疗数据存在敏感性,需要二次脱敏处理;医疗结构化数据需求特殊,非定制化处理模型无法满足多机构需求。
[0004]然而,医疗大数据蕴藏着丰富的有用信息。如何对上述眼科VEGF相关的多维临床试验数据进行有效挖掘和提炼,从而针对性地对患者用户的病情进行监控,以便于后续的进一步信息推荐,成为当下的热点问题。

技术实现思路

[0005](一)解决的技术问题
[0006]针对现有技术的不足,本专利技术提供了一种眼科VEGF相关的多维临床试验数据处理方法和系统,解决了现有技术无法深层次利用眼科VEGF相关的多维临床试验数据的技术问题。
[0007](二)技术方案
[0008]为实现以上目的,本专利技术通过以下技术方案予以实现:
[0009]一种眼科VEGF相关的多维临床试验数据处理方法,包括:
[0010]S1、获取眼科VEGF相关的多维临床试验的原始数据并进行预处理;
[0011]S2、将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;
[0012]S3、根据所述结果数据集,得到定向需求数据。
[0013]优选的,所述原始数据包括临床试验病历数据表头和源数据,所述原始数据中设置数据识别字段用于数据查重、数据拼接或数据扩容。
[0014]优选的,所述预处理包括数据清洗、数据向量化。
[0015]优选的,所述步骤S2中的自然语言处理模型的构建过程包括:
[0016]获取多条眼科VEGF相关的多维临床试验的原始数据,并确定所述多条眼科VEGF相关的多维临床试验的原始数据对应的结果数据集,
[0017]将所述多条眼科VEGF相关的多维临床试验的原始数据作为训练样本,将对应的结果数据集作为输出标签,构建训练数据库;
[0018]基于所述训练数据库,采用深度学习算法进行模型训练,得到所述自然语言处理模型。
[0019]优选的,所述采用深度学习算法进行模型训练包括:
[0020]将所述一条原始数据进行实体识别并进行命名,结合语法进行分析、语义分析、标记和重组,重组后形成第一结果数据集。
[0021]优选的,所述步骤S3具体包括:根据所述结果数据集,并配合人工修正以后,得到结构化眼科VEGF相关的定向需求数据。
[0022]一种眼科VEGF相关的多维临床试验数据处理系统,其特征在于,包括:
[0023]获取模块,用于获取眼科VEGF相关的多维临床试验的原始数据并进行预处理;
[0024]处理模块,用于将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;
[0025]输出模块,用于根据所述结果数据集,得到定向需求数据。
[0026]优选的,所述原始数据包括临床试验病历数据表头和源数据,所述原始数据中设置数据识别字段用于数据查重、数据拼接或数据扩容。
[0027]优选的,所述预处理包括数据清洗、数据向量化。
[0028]优选的,所述处理模块中自然语言处理模型的构建过程包括:
[0029]获取多条眼科VEGF相关的多维临床试验的原始数据,并确定所述多条眼科VEGF相关的多维临床试验的原始数据对应的结果数据集,
[0030]将所述多条眼科VEGF相关的多维临床试验的原始数据作为训练样本,将对应的结果数据集作为输出标签,构建训练数据库;
[0031]基于所述训练数据库,采用深度学习算法进行模型训练,得到所述自然语言处理模型。
[0032](三)有益效果
[0033]本专利技术提供了一种眼科VEGF相关的多维临床试验数据处理方法和系统。与现有技术相比,具备以下有益效果:
[0034]本专利技术获取眼科VEGF相关的多维临床试验的原始数据并进行预处理;将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;根据所述结果数据集,得到定向需求数据。定制化眼科VEGF相关的多维临床试验数据处理,针对性强;数据产出结构化,可应用性强。
附图说明
[0035]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0036]图1为本专利技术实施例提供的一种眼科VEGF相关的多维临床试验数据处理方法流程示意图;
[0037]图2为本专利技术实施例提供的眼科VEGF相关的多维临床试验数据进行自然语言处理示例图;
[0038]图3为本专利技术实施例提供的一种眼科VEGF相关的多维临床试验数据处理系统结构框图。
具体实施方式
[0039]为使本专利技术实施例的目的、技术方案和优点更加清楚,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0040]本申请实施例通过提供一种眼科VEGF相关的多维临床试验数据处理方法,解决了现有技术无法深层次利用眼科VEGF相关的多维临床试验数据的技术问题,实现定制化眼科VEGF相关的多维临床试验数据处理,针对性强的有益效果。
[0041]本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
[0042]本专利技术实施例获取眼科VEGF相关的多维临床试验的原始数据并进行预处理;将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;根据所述结果数据集,得到定向需求数据。定制化眼科VEGF相关的多维临床试验数据处理,针对性强;数据产出结构化,可应用性强。
[0043]为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0044]如图1所示,本专利技术实施例提供了一种眼科VEGF相关的多维临床试验数据处理方法,包括:
[0045]S1、获取眼科VEGF相关的多维临床试验的原始数据并进行预处理;
[0046]S2、将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种眼科VEGF相关的多维临床试验数据处理方法,其特征在于,包括:S1、获取眼科VEGF相关的多维临床试验的原始数据并进行预处理;S2、将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;S3、根据所述结果数据集,得到定向需求数据。2.如权利要求1所述的眼科VEGF相关的多维临床试验数据处理方法,其特征在于,所述原始数据包括临床试验病历数据表头和源数据,所述原始数据中设置数据识别字段用于数据查重、数据拼接或数据扩容。3.如权利要求1所述的眼科VEGF相关的多维临床试验数据处理方法,其特征在于,所述预处理包括数据清洗、数据向量化。4.如权利要求1所述的眼科VEGF相关的多维临床试验数据处理方法,其特征在于,所述步骤S2中的自然语言处理模型的构建过程包括:获取多条眼科VEGF相关的多维临床试验的原始数据,并确定所述多条眼科VEGF相关的多维临床试验的原始数据对应的结果数据集,将所述多条眼科VEGF相关的多维临床试验的原始数据作为训练样本,将对应的结果数据集作为输出标签,构建训练数据库;基于所述训练数据库,采用深度学习算法进行模型训练,得到所述自然语言处理模型。5.如权利要求4所述的眼科VEGF相关的多维临床试验数据处理方法,其特征在于,所述采用深度学习算法进行模型训练包括:将所述一条原始数据进行实体识别并进行命名,结合语法进行分析、语义分析、标记和重组,重组后形成第一结果数据集。6....

【专利技术属性】
技术研发人员:郑志许迅徐晓寅
申请(专利权)人:上海市第一人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1