一种基于海量数据提取异常疾病数据的计算方法技术

技术编号：30441434 阅读：21 留言：0更新日期：2021-10-24 18:29

本发明专利技术提出了一种基于海量数据提取异常疾病数据的计算方法，包括如下步骤：S1，获取患者病例数据，对病例数据中的文本数据和数值数据分别进行提取，S2，将提取的文本数据和数值数据进行特征抽样。数据进行特征抽样。数据进行特征抽样。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于海量数据提取异常疾病数据的计算方法

[0001]本专利技术涉及数据分析领域，尤其涉及一种基于海量数据提取异常疾病数据的计算方法。

技术介绍

[0002]由于生活水平的提高，人们在生活中会摄入大量的碳水化合物和糖类食品，这些食品在身体内如果堆积过量，必然会导致消化系统紊乱，而且严重者会诱发糖尿病，如何在前期的数据中提炼出关键数据，并对相应数据进行归类和分析，并对分析的数据进行筛选推荐，虽然现有技术中通过神经网络学习能够简单获取提炼的糖尿病样本数据，但是无法进行实时数据与样本数据的比对，这就亟需本领域技术人员解决相应的技术问题。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题，特别创新地提出了一种基于海量数据提取异常疾病数据的计算方法。
[0004]为了实现本专利技术的上述目的，本专利技术提供了一种基于海量数据提取异常疾病数据的计算方法，其特征在于，包括如下步骤：
[0005]S1，获取患者病例数据，对病例数据中的文本数据和数值数据分别进行提取，
[0006]S2，将提取的文本数据和数值数据进行特征抽样阈值判断。
[0007]优选的，所述S1包括：
[0008]S1
‑
1，获取病例数据中患者检查项，针对文本数据和数值数据进行归一化处理，计算条件概率D
ij
，
[0009]其中，V
i
为病例数据的文本数据集，V
j
为病例数据的数值数据集，M
ij<...

【技术保护点】

【技术特征摘要】
1.一种基于海量数据提取异常疾病数据的计算方法，其特征在于，包括如下步骤：S1，获取患者病例数据，对病例数据中的文本数据和数值数据分别进行提取，S2，将提取的文本数据和数值数据进行特征抽样阈值判断。2.根据权利要求1所述的基于海量数据提取异常疾病数据的计算方法，其特征在于，所述S1包括：S1
‑
1，获取病例数据中患者检查项，针对文本数据和数值数据进行归一化处理，计算条件概率D
ij
，其中，V
i
为病例数据的文本数据集，V
j
为病例数据的数值数据集，M
ij
为病例类别权重；b是搜索文字关键词的二值化页面参数，C是调节因子，d
k
为选择的病例关键词，其中V
i
·
(b|d
k
)+V
j
·
β是获取的文本数据集V
i
和数值数据集V
j
的匹配度，β为数值有效性权重。3.根据权利要求2所述的基于海量数据提取异常疾病数据的计算方...

【专利技术属性】
技术研发人员：刘玉蓉，
申请(专利权)人：重庆真逆思维科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人