System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 针对病毒变异毒株的影响因素的评估方法技术_技高网

针对病毒变异毒株的影响因素的评估方法技术

技术编号:40524846 阅读:7 留言:0更新日期:2024-03-01 13:44
本发明专利技术公开了针对病毒变异毒株的影响因素的评估方法,包括:收集病毒变异毒株传播影响因素特征共同组成数据集。对多因素数据集中的数据进行清洗和归一化预处理,统一数据尺度。通过提取各数据集的特征,对多元数据进行聚集和综合。将多因素数据集通过9:1比例划分为训练集和测试集。构建影响病毒变异毒株传播的多因素定量分析模型,并带入得到的数据集,得出变异毒株传播的多因素影响系数。构建多特征主成分评估模型,根据多因素影响系数,使用模糊搜索和SVM分类器进行主成分选取与因子分类,对不同多因素赋予权重,最终得到影响变异毒株的主成分的综合得分。本发明专利技术具有显著的创新性。

【技术实现步骤摘要】

本专利技术属于数据采集与数据分析领域,涉及病毒变异毒株与多因素的定量分析模型与评估模型,具体运用以高斯-牛顿迭代法优化的多元回归模型对影响变异毒株传播的多因素进行定量分析,并以主成分评估模型判定影响变异毒株传播的因素的相关性。


技术介绍

1、随着时间推移,病毒表现出免疫性增强和毒性减弱的特点,导致人们对其传播的警惕性有所降低,实际上,病毒对人类免疫系统造成的损害不容忽视,其传染性亦有所增加。因此,对影响病毒变异毒株传播的多种因素进行定量分析,有助于人类更深入地理解病毒变异毒株的传播特性,为各国政府在制定病毒防控策略时提供重要理论依据。本专利技术使用开源网站数据集,统计人文、经济、交通、天气、气候相关方面的多因素数据,提出使用高斯牛顿迭代法优化的多元回归模型对病毒扩散与各特征因素之间的关系进行定量分析,并利用主成分分析评估模型探究各特征与病毒传播之间的关系。

2、目前针对病毒的特性及变异毒株传播的广泛研究吸引了全球各地的数据科学家们的注意。lin等人在全球范围内研究气候与病毒传播速度之间的关系,得到了病毒的传播速度与气温、相对湿度具有较高相关性的结论。后又通过分析不同因素对于病毒传播产生的影响,得到病毒与人口密度和航班之间存在较大的关联关系。ertugrul karacuha等人通过分数阶微积分和最小二乘法对每例新发covid-19病例的每日死亡人数进行建模,评估各国病毒传播的的应对强度,du hongru等人使用多阶段深度学习模型依赖于流行病学、流动性、调查、气候、人口统计以及sars-cov-2变异频率数据探究病毒的预计感染人数与死亡人数,并强调了变异频率数据的潜在价值,可用于短期预测,以确定由新变异毒珠驱动的即将到来的激增。

3、基于以上研究与结论,人们从本身擅长的领域探究变异毒株的相关特性的可能,并说明变异毒株产生的频率存在潜在的价值。gupta等人从人类基因变异角度看待病毒变异的历程和自然发展方向,认为易感性和强免疫性是其变异的预发状态。kass等人通过多元线性回归模型分析病毒确诊人数中身体质量指数(bmi)与年龄之间的关系,得出肥胖症可能增加病毒感染率的结论。

4、上述研究普遍存在以下问题:1)数据集所涉及区域的仅限于局部区域,无法从全球范围内分析病毒变异毒株的传播特性;2)结论仅针对病毒整体或病毒某单一变异毒株进行特异性分析,没有从变异毒株种类开展泛化研究。

5、因此,本专利技术旨在提供一种针对病毒变异毒珠的影响因素的评估模型,通过结合数据处理和分析技术,探究实现计算病毒变异毒珠感染数据的可能,实现对病毒变异毒珠的影响因素的快速、准确评估,以提高病毒变异毒珠研究的效率和准确性。


技术实现思路

1、基于上述分析,本专利技术构建了分析病毒变异毒株(α、β、γ……)传播与各特征因素之间定量关系的模型。该模型首先在全球范围内搜集所需数据,然后通过构建以高斯-牛顿迭代法优化的多元回归模型定量分析不同因素对感染不同病毒变异毒株的每日新增病例数的影响,并建立主成分分析法评估模型评估各个因素所属范畴对于变异毒株新增病例数的影响。本专利技术提出的方法有助于分析全球范围内的病毒变异毒株的传播趋势,有助于把握病毒定量特性,分析变异毒株的趋向性,探究变异毒株的发展的态势,为后续各国政府针对不同变异毒株制定特性化的防疫政策提供更加明确的理论支撑。

2、为了实现上述目的,本专利技术采用以下技术方案:为了更好地实现整个方法,选择python作为方法编写语言。在数据处理环节,我们采用pandas完成数据集的清洗和划分。针对数据集中存在的缺失数据,我们采用三次样条插值法进行补充;对于部分存在尺度差异的数据,我们进行线性归一化处理;而对于所有数据,我们实施特征级融合策略。评估模型主要分为两部分,一部分是通过多元回归模型对影响病毒变异毒株传播的影响因素进行定量分析,探究不同影响因素对变异毒株传播的影响系数;另一部分是建立通过模糊搜索方法定义多因素中的主成分,利用主成分分析方法建立评估模型以确定不同因素在所属成分内的权重,从而确定不同成分的最终得分。通过评估模型,得到不同成分影响新冠变异毒株传播的程度,从而最终得到各个变异毒株对于不同成分的亲和系数。

3、针对病毒变异毒株的影响因素的评估方法,主要包括:

4、步骤1、本专利技术病毒数据来源于开源网站,共收集35个国家的39维度病毒变异毒株传播影响因素特征共同组成数据集。

5、步骤2、对多因素数据集中的数据进行清洗和归一化预处理,统一数据尺度。

6、步骤3、通过提取各数据集的特征,对多元数据进行聚集和综合。

7、步骤4、将多因素数据集通过9:1比例划分为训练集和测试集。

8、步骤5、构建影响病毒变异毒株传播的多因素定量分析模型,并带入步骤4得到的数据集,得出变异毒株传播的多因素影响系数。

9、步骤6、构建多特征主成分评估模型,根据步骤5生成的多因素影响系数,使用模糊搜索和svm分类器进行主成分选取与因子分类,对不同多因素赋予权重,最终得到影响变异毒株的主成分的综合得分。

10、本专利技术的创造性主要体现在:

11、1、创新性的技术方案:本专利技术提出了一种针对病毒变异毒株的影响因素的评估方法,该方法从病毒的变异毒株方面入手,对病毒变异毒株的影响因素进行深入研究,为评估病毒变异毒株的传播能力、病原性及疫苗研发提供了新的技术手段。与现有技术相比,本专利技术提供的方法更加全面、系统地分析了影响病毒变异毒株的影响因素,具有显著的创新性。

12、2、技术原理的创新:本专利技术采用数据挖掘和数据分析等技术手段,对病毒传播及感染病例数据进行深入分析,挖掘病毒变异毒株的影响因素。与现有技术相比,本专利技术创新性地将数据挖掘技术应用于病毒变异毒株评估,提高了评估的准确性和可靠性。

13、3、应用价值的提升:本专利技术在疫苗研究、病毒防控、临床诊断等方面具有广泛的应用价值。通过本专利技术,研究人员可以更好地评估病毒变异毒株的传播风险和病原性,为疫苗设计和临床治疗提供重要依据。与现有技术相比,本专利技术在实际应用中具有更高的价值和实用性。

14、4、技术效果的优化:本专利技术在实际操作中表现出较高的准确性和稳定性,为病毒变异毒株的评估提供了可靠的技术支持。与现有技术相比,本专利技术在技术效果上的优化有助于提高病毒防控工作的效率和准确性。

15、5、技术方案的难以重现:本专利技术所采用的技术方案涉及多个关键步骤,包括病毒序列数据处理、影响因素挖掘等,这些步骤相互关联、复杂度高,使得本专利技术技术方案难以被其他技术方案所重现。

16、基于该方法,结果表明病毒的不同变异毒株对于环境因素的相关性不同,大多数地区中传播的变异毒株ο表现出与航班次数更高的亲和性,该国家或地区的交通频次越高,ο传播速度越快;而早前传播的δ型变异毒株与人口密度有更高的依赖性,在人口密度更高的国家和地区,δ的传播速率越高。

本文档来自技高网...

【技术保护点】

1.针对病毒变异毒株的影响因素的评估方法,其特征在于,包括:

2.根据权利要求1所述的针对病毒变异毒株的影响因素的评估方法,其特征在于,步骤2中,对于多源数据产生的相同数据特征产生的不同数据值,选取特征数据;对于缺失数据,采用前后两天数据取均值进行填充;连续日期缺失的多因素数据采取三次样条插值法进行补充插入,防止影响实验结果。

3.根据权利要求1所述的针对病毒变异毒株的影响因素的评估方法,其特征在于,步骤3中,采用特征级数据融合方法,提取各个数据集的特征值,根据特征信息对多元数据进行融合和降维聚集,并通过线性归一化的方法对尺度不一致的数据进行归一化,得到统一单位尺度的数据集;归一化方法使用线性归一化,允许数据获取集合中最大x值和最小x值之间的差值,并建立一个基数;

4.根据权利要求1所述的针对病毒变异毒株的影响因素的评估方法,其特征在于,

5.根据权利要求1所述的针对病毒变异毒株的影响因素的评估方法,其特征在于,步骤6中,搭建主成分分析评估模型,由多因素影响系数构成原始变量,基于SVM分类器g=w(x)+b和模糊搜索方法定义主成分和次要因子,并得到不同因子的权重特征值,通过代入多因素的影响系数,得到基于主成分的综合得分,最终确定各地区变异毒株与主成分之间存在的依赖程度;根据评估模型计算,得到主成分为人为因素、交通、经济、气候、空气质量、地理和医疗条件七个。

6.根据权利要求1所述的针对病毒变异毒株的影响因素的评估方法,其特征在于,步骤7中,得到各个国家各地区变异毒株与主成分之间的依赖程度后,采用“max-min”归一化方法,所有结果数值均是基于在合理范围内取得的结果,采用均值法计算各变异毒株与主成分之间的依赖程度。

...

【技术特征摘要】

1.针对病毒变异毒株的影响因素的评估方法,其特征在于,包括:

2.根据权利要求1所述的针对病毒变异毒株的影响因素的评估方法,其特征在于,步骤2中,对于多源数据产生的相同数据特征产生的不同数据值,选取特征数据;对于缺失数据,采用前后两天数据取均值进行填充;连续日期缺失的多因素数据采取三次样条插值法进行补充插入,防止影响实验结果。

3.根据权利要求1所述的针对病毒变异毒株的影响因素的评估方法,其特征在于,步骤3中,采用特征级数据融合方法,提取各个数据集的特征值,根据特征信息对多元数据进行融合和降维聚集,并通过线性归一化的方法对尺度不一致的数据进行归一化,得到统一单位尺度的数据集;归一化方法使用线性归一化,允许数据获取集合中最大x值和最小x值之间的差值,并建立一个基数;

4.根据权利要求1所述的针对病毒变异毒株...

【专利技术属性】
技术研发人员:林绍福徐振凯
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1