System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种浓香型酿酒大曲香味成分的数据处理方法技术_技高网

一种浓香型酿酒大曲香味成分的数据处理方法技术

技术编号:40876492 阅读:3 留言:0更新日期:2024-04-08 16:45
本发明专利技术公开了一种浓香型白酒酿酒大曲香味成分数据处理的方法,包括:1、获取大曲香味成分原始数据并数据清洗,提取物质唯一识别码、匹配度和峰面积数据;2、根据中文名数据库找到物质唯一识别码对应的中文名,并找到内标物质对应的质谱峰面积,计算该物质的含量;3、筛选出匹配度大于一定阈值的数据,并删除检测中残留物质的数据,根据中文名中的最后一个字符将物质分为酯类,酸类,醇类,醛类,吡嗪类,酮类和其他类,对类别排序,输出包含类别、中文名、物质唯一识别码和香味物质含量的数据。本发明专利技术能实现任意大曲样品之间不同发酵阶段、不同月份、不同曲块位置、不同曲房号之间的比较分析,且方法简单、易于实现,准确性高,易于推广。

【技术实现步骤摘要】

本专利技术涉及酿酒大曲数据处理领域,具体涉及一种酿酒大曲香味成分的数据处理方法。


技术介绍

1、大曲是酿酒过程中必不可少的一部分,其主要作用是糖化发酵剂生香。大曲品质的好坏与其香味密切相关,因此在大曲生产过程中需要对大曲中的香味成分进行检测分析,从而评价大曲的品质,而香味成分数据分类对比对大曲中香味成分的分析也至关重要。

2、通过顶空固相微萃取气相色谱-质谱法对大曲样品进行检测,通过检测的数据分析香味成分数据。对色谱图积分后解析到的化合物基本信息显示,包含该化合物英文信息、物质唯一识别码、峰面积、匹配度以及一些其他信息,且每种样品鉴定出的化合物数量不等,种类多样,数据处理过程有一定的难度。

3、在人工处理数据中,需要对原始数据进行简化,保留一些有用的信息,在简化数据过程中会使用一些删除或清除操作,对多个大曲香味数据处理时较为繁琐、易于出错;在获取物质唯一识别码对应的中文名时,需要到网站上进行输入搜索,获取中文名,再将填入到对应物质唯一识别码位置处,此过程也较为复杂、耗时。对于浓香型酿酒大曲香味成分数据的分类暂时还没有一种省时省力、简单有效的数据处理方法。


技术实现思路

1、本专利技术是为了解决上述现有技术存在的不足之处,提出一种浓香型酿酒大曲香味成分的数据处理方法,以期能简单有效的处理浓香型大曲香味成分数据,实现任意大曲样品之间不同发酵阶段、不同月份、不同曲块位置、不同曲房号之间的比较分析,从而能提高数据处理的效率和效果。

2、本专利技术为达到上述专利技术目的,采用如下技术方案:

3、本专利技术一种浓香型白酒酿酒大曲香味成分数据处理的方法的特点在于,包括如下步骤:

4、步骤1、构建由物质唯一识别码与中文名一一对应的数据库db;

5、步骤2、定义任意第i个大曲样品的发酵阶段为ji,第i个大曲样品的月份为mi,第i个大曲样品的曲块位置为si,第i个大曲样品的曲房号为ni,第i个曲样样品的重量gi;

6、步骤3、对第i个大曲样品进行前处理,得到前处理后的第i个大曲样品;

7、步骤4、通过顶空固相微萃取气相色谱-质谱法检测前处理后的第i个大曲样品,获得前处理后的第i个大曲样品的香味成分数据,并对所述香味成分数据进行清洗后,得到清洗后的第i个大曲样品的香味成分数据;定义清洗后的第i个大曲样品的香味成分数据的任意第j行第j列数据记为coli,j;

8、步骤5、提取所述清洗后的第i个大曲样品的香味成分数据中所有的物质唯一识别码、匹配度和峰面积,其中,物质唯一识别码、匹配度和峰面积是一一对应的;对于物质唯一识别码、匹配度的提取是确定coli,j中包含关键字符的行数rowj,并提取从第rowj+1行开始直到最后第rowend行的数据;对于峰面积的提取,先确定数据coli,j中包含关键字符的行数组rows,从第rows组的数据中取最小值所对应的行数rowsf,再根据物质唯一识别码数据的总行数|rowj-rowend|,确定从第rowsf+1行开始到总行数之间的数据;

9、步骤6、定义任意提取到的第i个大曲样品的香味成分数据中任意第j个香味物质的唯一识别码为ci,j、任意一个匹配度为ti,j、任意一个峰面积为pi,j;

10、步骤7、在数据库db中查询ci,j是否存在,若存在,则输出与ci,j对应的中文名chi,j,并保存至数据库db中“中文名”对应的一列中;否则,输出字符串“null”,也作为chi,j并保存至“中文名”一列中;

11、步骤8、从所述中文名chi,j中删除所述顶空固相微萃取气相色谱-质谱法检测过程中残留物质的数据,所述残留物质的数据为中文名中含有硅氧烷的数据;

12、从删除后的中文名chi,j中找到内标物质对应的质谱峰面积pnb,所述内标物质是名称为指薄荷醇,薄荷脑,l-薄荷醇,menthol的物质;

13、利用式(1)计算第j个物质的唯一识别码ci,j所对应的香味物质的含量hi,j,并输出包含物质唯一识别码ci,j、匹配度ti,j、中文名chi,j和香味物质含量hi,j的数据,从而得到第i个大曲样品的香味成分数据中所有物质的数据;

14、

15、步骤9、从第i个大曲样品的香味成分数据的所有物质的数据中筛选出匹配度大于等于阈值δf的数据,并得到第i个大曲样品筛选后的香味成分数据,并删除匹配度和峰面积数据,获得仅包含物质唯一识别码、中文名和香味物质含量的数据;

16、步骤10、对第i个大曲样品筛选后的香味成分数据进行分类:

17、根据第i个大曲样品筛选后的香味成分数据的中文名chi,j的最后一个字符判断第j个香味物质的类别;如果中文名chi,j的最后一个字符是酯,酸,醇,醛,嗪或酮,则将第j个香味物质定义为酯类,酸类,醇类,醛类,吡嗪类,酮类,否则,将第j个香味物质定义为其他类,从而对第i个大曲样品筛选后的香味成分数据中所有香味物质的类别进行判断,并输出包含类别、物质唯一识别码、中文名和香味物质含量的分类数据;

18、步骤11、按照步骤2-步骤10的过程对多个大曲样品筛选后的香味成分数据进行分类,并将任意第i个大曲样品的分类数据与第i+1大曲样品的分类数据进行按列合并,得到数据集data,对所述数据集data中所有中文名进行去冗余操作,并获得中文名唯一的数据库unq_db:

19、步骤12、根据数据库unq_db中任意第k个中文名,找到与数据集data中第i个大曲样品的分类数据的中文名相对应的类别、中文名、物质唯一识别码和香味物质含量的数据,从而得到所有大曲样品的分类数据中,与第k个中文名相匹配的类别、中文名、物质唯一识别码和香味物质含量的数据;

20、步骤13、根据类别,对所有大曲样品的分类数据中,与第k个中文名相匹配的类别、中文名、物质唯一识别码和香味物质含量的数据进行排序,从而获得所有大曲样品的香味成分的中文名分类数据,用于实现任意第i个大曲样品和任意第i+1个大曲样品之间不同发酵阶段、不同月份、不同曲块位置、不同曲房号之间的比较和分析。

21、本专利技术一种电子设备,包括存储器以及处理器的特点在于,所述存储器用于存储支持处理器执行所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

22、本专利技术一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序的特点在于,所述计算机程序被处理器运行时执行所述方法的步骤。

23、与现有技术相比,本专利技术的有益效果在于:

24、1、本专利技术通过对数据清洗,并对物质唯一识别码、匹配度和峰面积数据进行提取,提取过程是确定特定列数中包含特定的关键字符的行数,并提取数据,这种提取方式较为简单,且对于多个大曲香味数据处理时也不易于出错;

25、2、本专利技术通过对物质唯一识别码与中文名建立一一对应的数据库,可以批量获取物质唯一识别码对应的中文名,此过程简单、高效且易于实现;

2本文档来自技高网...

【技术保护点】

1.一种浓香型白酒酿酒大曲香味成分数据处理的方法,其特征在于,包括如下步骤:

2.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

3.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1所述方法的步骤。

【技术特征摘要】

1.一种浓香型白酒酿酒大曲香味成分数据处理的方法,其特征在于,包括如下步骤:

2.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1所述方法的程序,...

【专利技术属性】
技术研发人员:丁中强秦黎明刘晓静王冕李伟曹润洁马金同何宏魁李安军
申请(专利权)人:安徽古井贡酒股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1