根据光谱数据和化学检测数据的映射集合设计公式的方法技术

技术编号:15389827 阅读:40 留言:0更新日期:2017-05-19 03:40
本发明专利技术涉及一种根据光谱数据和化学检测数据的映射集合设计公式的方法,该方法包括确定公式数量、确定波长数量、建立公式、公式验证和公式运算,其特征在于根据映射数据库中化学数据中检测成分的数量T确定公式的数量K,K满足的关系为:

Method for designing formulas based on mapping sets of spectral data and chemical detection data

The invention relates to a method for set design formula according to the mapping of spectral data and chemical test data, the method includes determining the formula number, determine the wavelength number, formula, formula and verify the established formula calculation, which is characterized in that the number is determined according to the number of K formula T detection chemical composition data mapping database in K, the relationship:

【技术实现步骤摘要】
根据光谱数据和化学检测数据的映射集合设计公式的方法
本专利技术属于物质检测领域,特别是涉及利用光谱检测化学成分的方法,具体是涉及根据光谱数据和化学检测数据的映射集合设计公式的方法。
技术介绍
光谱分析中的关键问题很多,包括光谱收集器的标准化,化学检测的标准化和快速化,但是还有一个非常关键的技术是建模中设计公式的技术。在分析光谱信息和组分之间建立函数关系,建立数学模型是近红外光谱分析的核心技术之一。目前现有分析建模的改进算法和新方法的应用不断出现,但每种算法各具优点的同时也存在着一定的局限性。对于不同类型待测物的数学模型,优化的方法也有所不同,所以在实际应用中将多种数学挖掘方法结合,相互取长补短,提高校正模型的预测精度和稳健性,减少建模与预测时间将成为今后研究方向之一。我国从20世纪80年代开始涉足近红外光谱技术的研究,首但是由于其硬件系统和软件技术还不够完善方便,建成的模型也未能广泛的推广应用。90年代中期,北京蔬菜研究中心在蔬菜、水果的品质分析方面做了大量的工作,研究出40多个数学模型,在大白菜和西红柿品质育种中发挥了重要作用。目前在建模方面,一方面充实完善模型数据库,另一方面开发价廉便携式的可用于现场检测的近红外光谱仪,通过现代网络技术,使建立的数学模型更广泛地与终端用户共享,并利用丰富的终端样品信息,不断修正完善现有模型。本专利技术提供了一种设计公式的方法,该方法在设计总体层面上解决多成分同时检测或单独检测所需公式的需求。
技术实现思路
为解决上述技术问题,本专利技术提供了一种根据光谱数据和化学检测数据的映射集合设计公式的方法,该方法包括确定公式数量、确定波长数量、建立公式、公式验证和公式运算,其特征在于根据映射数据库中化学数据中检测成分的数量T确定公式的数量K,K≥T,优选的,K满足的关系为:C表示组合式的含义。具体的,本专利技术提供的一种根据光谱数据和化学检测数据的映射集合设计公式的方法包括如下步骤:确定公式数量:根据映射数据库中化学数据中检测成分的数量T确定公式的数量K,则公式的数量K满足如下关系式(其中C表示组合式的含义):每一种成分建立一个公式,新的成分的组合建立新的公式,成分组合不同,则必须建立独立的公式,成分组合中的成分顺序不分先后。例如成分为检测成分T为3,其成分为蛋白质、淀粉、脂肪,则针对蛋白质的检测需要建立一个公式,针对淀粉的检测需要建立一个公式,针对蛋白质和淀粉同时检测也需要建立一个新的公式,其不能与单独检测蛋白质的公式相同,也不能与单独检测淀粉的公式相同,但是针对(蛋白质+淀粉)和(淀粉+蛋白质)的检测则公式相同,成分顺序不分先后,只要成分组成相同,则公式相同。确定波长数量:在映射数据库中选择2-100个波长,波长数量的选择根据所建公式针对的成分进行选择,波长数量要求大于等于2,当公式针对的成分为一种时,可以选择2个波长,当公式针对的成分为2种时,可以选择2个波长,也可以选择3个波长,甚至是5个波长,波长的数量一般不大于100。建立公式:确定完波长数量后,采用数学运算方法选择波长,根据选择的波长及吸光度、成分及含量建立公式(也可称函数关系)。选择波长的方法包括但不限于相关系数法、方差分析法、逐步回归分析方法、无信息变量消除方法和连续投影算法、遗传算法、模拟退火算法和区间偏最小二乘法等。公式验证:建立完公式后进行R个新光谱数据的输入运算,根据光波运算结果与实际化学检测数据的误差要求确定光波波长和数量选择的可行性,不可行则重新选择波长和波长数量,重复建立公式步骤;当根据已有映射数据库建立的公式进行R个新光谱数据运算后,满足误差要求,则确定公式可行。该步骤中,R≥5,优选R≥10,其中新光谱数据的输入和化学检测数据的校正可以是与原系统不同的实现系统,例如检测器不同等,验证不同的检测器在应用相同的数据模型的时候是否会产生预料不到的差异。公式运算:当所有公式建立完成后,将公式编写为运算服务器可运行的语言,并嵌入运算服务器中,运算服务器根据待检测成分要求自动匹配公式,同时自动选择运行公式所需要的波长,实现根据新光谱数据运算出所代表的成分及含量。上述方法中,映射数据库的建立方法优选为如下方法:将物体的光谱数据输入光谱数据库,将相同物体的化学检测数据输入化学数据库,然后将光谱数据库中的光谱数据和化学数据库中的化学检测数据进行映射,形成该物体的映射数据库,其特征在于:光谱数据按照纳米级光谱波长及吸光度分别作为单一光谱数据条,化学检测数据按照成分名称和成分含量分别作为单一成分数据条,通过单一光谱数据条与所有成分数据条对应形成映射数据组,将所有光谱数据条分别与所有成分数据条对应形成映射数据集,n次检测形成光谱数据和化学检测数据形成的n个映射数据集,将该映射数据集统一输入数据库中形成该物体的映射数据库。具体的,将光谱数据和化学检测数据映射的方法包括将物体的光谱数据输入光谱数据库,将相同物体的化学检测数据输入化学数据库,然后将光谱数据库中的光谱数据和化学数据库中的化学检测数据进行映射,形成该物体的映射数据库,具体步骤如下:光谱数据输入光谱数据库中,按照纳米级建立数据条,每个纳米级波长定义为一个数据条,将每个纳米级波长数据和波长吸光度数据录入数据库中,形成光谱数据库中的光谱数据条,光谱范围中的纳米波长数量z对应形成相应数量的光谱数据条z;例如波长范围为1000-1500纳米,则有501条光谱数据条,z为501,每个光谱数据条包括波长和吸光度;化学检测数据输入化学数据库中,将化学检测数据按所检测成分的数量建立数据条,照成分建立数据条,每个成分定义为一条数据条,将每个成分名称及成分含量录入数据库中,形成化学数据库中的成分数据条,成分的数量r对应形成相应数量的成分数据条r;例如某物体的化学检测数据中有5种成分,则有5条数据条,r为5,分别为Y1、Y2……Y5,每个数据条包括成分名称和成分含量;将光谱表中的一条光谱数据条对应化学数据表中的所有成分数据条,形成映射数据组,对应原则是一条光谱数据条分别对应各成分数据条,形成单光谱和多成分对应的映射数据组;例如光谱数据条为X1000,成分数据条为Y1、Y2、Y3、Y4、Y5,则针对1000纳米的单光谱和多成分对应的映射数据组为{X1000Y1,X1000Y2,X1000Y3,X1000Y4,X1000Y5};按照上述建立映射数据组的方法,将光谱表中的所有光谱数据条与化学数据表中所有成分数据条进行分别对应,形成所有映射数据组的集合,即为映射数据集合;例如光谱数据条为501条,成分数据条为5条,则一次检测所形成的光谱数据和化学检测数据的映射数据集合中包含501×5=2505条数据,该2505条数据即为物体该次检测的映射数据集合,即映射数据集合中的映射数据条为z*R条。对该物体的不同样品进行n次检测,则形成n个映射数据集合,将n个映射数据集合统一输入一个单独的数据库中,则形成该物体映射数据库。映射数据库中的数据条数为n*z*r。上述方法中,n大于30,优选大于50,尤其优选大于100。上述方法中,物体为食物、农产品、土壤、植物的植株或其部分等,农产品包括但不限于粮食、蔬菜、水果等,粮食包括但不限于小麦、水稻、马铃薯、红薯、玉米等,水果包括但不限于苹果、本文档来自技高网...

【技术保护点】
一种根据光谱数据和化学检测数据的映射集合设计公式的方法,该方法包括确定公式数量、确定波长数量、建立公式、公式验证和公式运算,其特征在于根据映射数据库中化学数据中检测成分的数量T确定公式的数量K,K满足的关系为:K≥T。

【技术特征摘要】
1.一种根据光谱数据和化学检测数据的映射集合设计公式的方法,该方法包括确定公式数量、确定波长数量、建立公式、公式验证和公式运算,其特征在于根据映射数据库中化学数据中检测成分的数量T确定公式的数量K,K满足的关系为:K≥T。2.根据权利要求1所述的方法,其特征在于K满足的关系为:C表示组合式的含义。3.一种根据光谱数据和化学检测数据的映射集合设计公式的方法,包括如下步骤:确定公式数量:根据映射数据库中化学数据中检测成分的数量T确定公式的数量K,则公式的数量K≥T;确定波长数量:在映射数据库中选择2-100个波长,波长数量的选择根据所建公式针对的成分进行选择;建立公式:确定完波长数量后,采用数学运算方法选择波长,根据选择的波长及吸光度、成分及含量建立公式;公式验证:建立完公式后进行R个新光谱数据的输入运算,根据光波运算结果与实际化学检测数据的误差要求确定光波波长和数量选择的可行性,不可行则重新选择波长和波长数量,重复建立公式步骤;当根据已有映射数据库建立的公式进行R个新光谱数据运算后,满足误差要求,则确定公式可行,R≥5;公式运算:当所有公式建立完成后,将公式编写为运算服务器可运行的语言,并嵌入运算服务器中,运算服务器根据待检测成分要求自动匹配公式,同时自动选择运行公式所需要的波...

【专利技术属性】
技术研发人员:刘法安刘毅谭占鳌陈剑朱朝霞
申请(专利权)人:深圳市芭田生态工程股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1