【技术实现步骤摘要】
一种基于大数据与机器学习的诊断乳腺癌病情的方法
本专利技术涉及计算机
,尤其涉及一种基于大数据与机器学习的诊断乳腺癌病情的方法。
技术介绍
随着各种新型信息发布方式的不断涌现,以及云计算、物联网等技术的兴起,以及遍布地球各个角落的各种各样的传感器,数据正以前所未有的速度在不断地增长和累积,大数据时代已经来到。如何通过机器学习、数据挖掘等方法从这些大数据中更快速、更精确地挖掘出有价值的数据,是当今学术界和工业界研究的热点。在基于云计算平台的分布式数据挖掘方向的研究,已经得到了广泛地展开并且取得了大量优秀的成果。Hadoop是目前大数据平台中应用率最高的技术,特别是针对诸如文本、社交媒体订阅以及视频等非结构化数据。MapReduce采用shared-nothing架构设计,在执Job时,各个Job之间是彼此隔离的,通过HDFS等部件进行交互,数据存储在各个结点上,即使有一个结点损坏了也能保证数据不受损。Hadoop平台的并行运算使处理大量数据成为可能。乳腺癌是导致全球女性死亡的第二大癌症类型,其中,浸润性乳腺癌是主要的乳腺癌类型。据报道,美国八分之一的女性都会被确诊为浸润性乳腺癌。在2017年,粗略预计有255180例患者被确诊为浸润性乳腺癌,有40610位患者死于乳腺癌。当癌症早期发现时,常常可以治愈。一般来说,医生都会建议健康女性一年做一次乳腺癌检查,尤其是年过50的中年妇女,她们的患病率较高。乳腺癌的检查流程一般包括乳房X射线和超声图像检测,一般得到的图像大小为300*225像素,但这是一种比较主观的诊断,经常会导致假阳性结果,导致不必要的活检和手 ...
【技术保护点】
1.一种基于大数据与机器学习的诊断乳腺癌病情的方法,其特征在于,包括如下步骤:S1:针对乳腺癌拍片的图像的不完整性,图像数据在导入大数据平台之前需进行图像数据预处理;S2:使用密码登陆到Hadoop分布式系统,通过人为把预处理好的大量乳腺癌检查中的X光和超声图像数据分类存储在Hadoop平台上,使用Hadoop大数据平台对图像信息进行处理分析,选取诊断为恶性的图像数据作为机器学习训练数据,数据平台数据采用加密传输,保证数据的安全性的同时不影响图像数据的使用;S3:导入Hadoop大数据平台的二维图像信息,通过分布式计算机运算进行大量数据的卷积神经网络训练,任意选取滤波器进行卷积训练,在此基础上,通过修改滤波器上的权重使它能识别某种特征,构建具有识别图像某一特征的高阶卷积神经元;S4:在图像经过多个卷积层后,神经元被编码成完全相关的空间特征,这些特征经过全连接神经网络学习,通过卷积神经网络的神经元反馈学习,训练出一个能分类图像的某一特征的模型,最终得到一个诊断结果模型,实现对乳腺癌病情的分类(良性或恶性)。
【技术特征摘要】
1.一种基于大数据与机器学习的诊断乳腺癌病情的方法,其特征在于,包括如下步骤:S1:针对乳腺癌拍片的图像的不完整性,图像数据在导入大数据平台之前需进行图像数据预处理;S2:使用密码登陆到Hadoop分布式系统,通过人为把预处理好的大量乳腺癌检查中的X光和超声图像数据分类存储在Hadoop平台上,使用Hadoop大数据平台对图像信息进行处理分析,选取诊断为恶性的图像数据作为机器学习训练数据,数据平台数据采用加密传输,保证数据的安全性的同时不影响图像数据的使用;S3:导入Hadoop大数据平台的二维图像信息,通过分布式计算机运算进行大量数据的卷积神经网络训练,任意选取滤波器进行卷积训练,在此基础上,通过修改滤波器上的权重使它能识别某种特征,构建具有识别图像某一特征的高阶卷积神经元;S4:在图像经过多个卷积层后,神经元被编码成完全相关的空间特征,这些特征经过全连接神经网络学习,通过卷积神经网络的神经元反馈学习,训练出一个能分类图像的某一特征的模型,最终得到一个诊断结果模型,实现对乳腺癌病情的分类(良性或恶性)。2.根据权利要求1所述的一种基于大数据与机器学习的诊断乳腺癌病情的方法,其特征在于,在S1中,图像数据预处理的具体步骤如下:A1、将图像数据分成三部分数据集,75%用于训练数据集,12.5%用于验证数据集,剩下的12.5%作为测试数据集;A2、把乳腺癌的图像采用3*3的中值滤波器来移除图像中的斑点噪音,将每个图像上的像素值标准化,使出现零均值;A3、将每张图片旋转某一角度,重复n次,控制n的次数,确保整个病变区位于图像的核心,完成图像数据的初步分类。3.根据权利要求1所述的一种基于大数据与机器学习的诊断乳腺癌病情的方法,其特征在于,在S2中,所述图像信息进行处理分析是对乳腺癌检查中的X光和超声图像数据进行提取、选择,使用卷积神经网络算法。4.根据权利要求1所述的一种基于大数据与机器学习的诊断乳腺癌病情的方法,其特征在于,在S3中,得到一个高阶卷积神经元的具体步骤如下:B1、特征选择,特征选择区域选择图像中出现病变...
【专利技术属性】
技术研发人员:李振彰,钟碧良,曹玉军,张绍安,林广松,梁运鑫,
申请(专利权)人:广州航海学院,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。