【技术实现步骤摘要】
一种基于机器学习的太赫兹物质识别方法及装置
[0001]本专利技术属于数据处理领域,涉及到一种基于机器学习的太赫兹物质识别方法及装置。
技术介绍
[0002]太赫兹(Tera Hertz,THz)是波动频率单位之一,太赫兹泛指频率在0.1~10太赫兹波段内的电磁波,处于宏观经典理论向微观量子理论、电子学向光子学的过渡区域。频率上它要高于微波,低于红外线;能量大小则在电子和光子之间。由于此交叉过渡区,既不完全适合用光学理论来处理,也不完全适合用微波的理论来研究。
[0003]数据库技术是现代计算机技术的一个重要组成部分,是处理数据的有效工具。数据挖掘是挖掘信息,发现知识,没有明确的假设,即没有事先的研究和设计,获得的信息应该具有三个特征:以前未知的,有效的和实用的。数据挖掘方法可分为两类:描述性和预测性。描述性模式表征数据的一般性质,包括关联分析和聚类分析。预测模式根据当前数据进行汇总,包括分类和回归。机器学习(Machine Learning,ML)具有处理非线性数据的能力,可以从现有数据中学习后找到新的模式并生成预 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的太赫兹物质识别方法,其特征在于,所述方法包括:获取太赫兹光谱数据;太赫兹光谱数据存入数据库;数据预处理;实施特征工程;机器学习训练预测模型;预测物质成分;优化预测模型。2.根据权利要求1所述的一种基于机器学习的太赫兹物质识别方法,其特征在于,所述获取太赫兹光谱数据包括:S10101,获取已知物质成分的太赫兹频域光谱图像;S10102,获取已知物质成分的太赫兹光谱描述数据;S10103,获取已知物质成分的太赫兹检测数据;S10104,获取未知物质成分的太赫兹频域光谱图像;S10105,获取未知物质成分的太赫兹光谱描述数据;S10106,获取未知物质成分的太赫兹检测数据。3.根据权利要求1所述的一种基于机器学习的太赫兹物质识别方法,其特征在于,太赫兹光谱数据存入数据库:S10201,选择太赫兹光谱图像;S10202,确定太赫兹图像唯一编码;S10203,太赫兹光谱图像存入图像数据库,如对象存储、图数据库或存储图像位置信息等方式;S10204,选择太赫兹光谱对应描述数据S10205,太赫兹描述数据存入关系型数据库或Nosql数据库;S10206,选择太赫兹检测数据;S10207,确定太赫兹检测数据对应唯一编码;S10208,太赫兹检测数据存入关系型数据库或NoSql数据库。4.根据权利要求1所述的一种基于机器学习的太赫兹物质识别方法,其特征在于,所述数据预处理包括:S10301,选择太赫兹频域光谱图像;S10302,太赫兹频域光谱图像去噪;S10303,太赫兹频域光谱图像倾斜校正;S10304,判断是否需要太赫兹频域光谱图像二值化;S10305,太赫兹频域光谱图像二值化;S10306,太赫兹频域光谱图像取样;S10307,太赫兹频域光谱图像量化;S10308,太赫兹频域光谱图像矩阵化表示;S10309,太赫兹频域光谱图像转为一维数组或数据库中一条记录;S10310,判断是否需要对太赫兹图像描述数据转换;
S10311,根据预设规则把太赫兹图像描述数据通过傅立叶变换或小波变换等方法转换为统一的量纲;S10312,判断是否需要对太赫兹检测数据转换;S10313,根据预设规则把太赫兹检测数据通过傅立叶变换或小波变换等方法转换为统一的量纲,例如把太赫兹检测数据的电场数据转化为频域数据;S10314,太赫兹时域光谱图像;S10315,太赫兹时域光谱图像去噪;S10316,太赫兹时域光谱图像取样;S10317,太赫兹时域光谱图像量化;S10318,太赫兹时域光谱图像矩阵化表示;S10319,太赫兹时域光谱图像转为一维数组或数据库中一条记录;S10320,按照预设规则把时域光谱图像的一维数据通过傅立叶变换或小波变换等方法转化为统一的量纲。5.根据权利要求1所述的一种基于机器学习的太赫兹物质识别方法,其特征在于,所述特征工程包括:S10401,选择全部或部分预处理后的数据...
【专利技术属性】
技术研发人员:王莹,
申请(专利权)人:深圳市第二人民医院深圳市转化医学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。