System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于Hansen描述符分类的药物溶解度的预测方法技术_技高网

一种基于Hansen描述符分类的药物溶解度的预测方法技术

技术编号:41311086 阅读:4 留言:0更新日期:2024-05-13 14:54
本发明专利技术公开了一种Hansen描述符分类的药物溶解度的预测方法,包括以下步骤:数据收集和处理、组分划分、相关性和特征重要性计算、建立模型和预测。本发明专利技术拟通过Hansen溶解参数描述多种药物和复杂微环境中不同配比的混合溶剂,利用不同机器学习方法,分别对药物溶解度进行建模预测并分析不同特征变量对目标变量的具体影响,以提高预测准确性和精确度。本发明专利技术通过Hansen溶解参数预测多种药物和不同配比的混合溶剂中药物溶解度,有望减少新药设计研发耗费的成本和面临风险。

【技术实现步骤摘要】

本专利技术涉及一种药物溶解度的预测方法,尤其涉及一种基于hansen描述符分类的药物溶解度的预测方法。


技术介绍

1、大多数药物都存在水溶性差,溶解度低,导致生物利用度低、患者依从性差和生理相容性弱的问题,严重阻碍并限制了药物研究和开发过程。与此同时,溶解度的测定在化学工业的化工过程、工艺制备和化学物质迁移等方面也有重要作用。已有研究人员为克服药物溶解度低所引起的系列问题做了大量相关研究并取得突破性进展。然而,通过文献调研发现不同溶剂对于药物溶解度的调配过程至关重要。比如药剂制剂过程中需要将药物溶解在某种溶剂或混合溶剂中,以提高制剂后的药物载药量。同时药物需要考虑在人体微环境中溶解度,以达到最高的生物利用度。

2、但由于上述药物微环境复杂,其制备工艺繁杂,需经历多道程序和步骤,故影响因素众多且溶解介质种类繁多。即使是同一药物在同等操作条件和相同制备工艺中制备,由于微环境包含多种配比不同的混合溶解介质,其药物溶解度仍存在显著性差距。所以,若想得到或者鉴定具有所需溶解度的不同混合溶剂的类型和配比标准时,在实际操作过程中,可能难以重复用于检测不同溶质和不同配比的混合溶剂中多种组合所对应的每一种溶解度实验。此外,鉴于实验操作条件复杂多样(温度、压力和ph值),通过实验方法对所有化合物溶解度测定不切实际。那么怎样精准预测混合溶剂复配条件下药物溶解度尤为重要,也是难点问题。

3、大量研究表明,通过机器学习(machine learning,ml)方法可建立基于已有数据准确、可靠并具有普适性的溶解度预测方法。然而,现有研究仅有关于水、有机溶剂和超临界溶剂中溶解度建模预测的方法(nat.commun.,2020,11(1),5753;j.mol.liq.,2022,349,118120),并没有关于复杂溶剂环境中溶解度变化的相关研究。究其原因,主要是由于宏观条件无法评估复杂微环境中药物溶解度的变化。

4、据报道,hansen溶解参数作为微观描述符可以通过极性、色散、氢键等三个关键词来表示每种药物,并区分和评估不同溶剂的溶解性,以帮助研究人员更好地控制溶液系统中的溶解物。huang等人证明采用hansen溶解参数可以很好的解释药物溶解度的变化趋势(j.chem.thermodyn.,2021,152,106285)。考虑到不同混合溶剂和溶质的复杂程度,选择更为合理的hansen溶解参数分别表示不同溶剂和溶质,以不同配比(0.1,...,0.9)表示混合溶剂环境。其中,据文献记载,绝大多数药物实验都在气液平衡条件下进行实验,且拉乌尔定律通过摩尔分数定义。因此,绝大多数研究均以摩尔分数溶解度作为衡量药物溶解度变化的标准。


技术实现思路

1、专利技术目的:本专利技术旨在提供一种能预测多种药物和不同配比的混合溶剂中药物溶解度的基于hansen描述符分类的药物溶解度的预测方法。

2、技术方案:本专利技术所述的基于hansen描述符分类的药物溶解度的预测方法,包括如下步骤:

3、(1)数据收集处理:收集不同药物和配比的混合溶剂条件下溶解度的数据值进行处理,去除所有理想状态下(忽略客观条件影响和挥发等损失)计算得到的溶解度数据值;

4、(2)等级划分:根据步骤(1)得到的药物溶解度数据值,划分为是否含有hansen微观描述符的情况,并将数据集划分为训练集和测试集;

5、(3)相关性和特征重要性计算:针对于多种药物和不同配比的混合溶剂条件下的特征变量,分别在两种情况下进行相关性计算和特征重要性排序;

6、(4)建立模型:采用多种不同的机器学习算法,分别建立不同配比的混合溶液中,是否含有hansen微观描述符的药物溶解度的定量预测模型;

7、(5)预测:用于将不同配比的混合溶剂条件下多种药物组成、复杂操作条件带入没有hansen微观描述符条件下建立的定量预测模型中进行预测,将所有特征变量带入含有hansen微观描述符条件下建立的模型中进行预测。

8、优选地,步骤(1)中具体包括如下步骤:

9、(i)对不同药物和配比的混合溶剂环境中收集的多种溶质和溶剂的hansen溶解参数、药物组成和复杂操作条件的数据值换算至相同单位;

10、(ii)对统一过的数据进行核实验证确保数据真实有效;

11、(iii)在不同配比的混合溶剂条件下对上述所有数据值进行逐一排查,去除所有理想状态下计算得到的溶解度数据值;若收集的数据值中某一具体药物的特征变量值超出绝大多数数据值存在范围过高或过低等问题,则选择去除该异常值和缺失值;

12、(iv)对于数据量庞大的数据集为避免其过拟合问题,须通过多次计算方差检验并排除过拟合现象产生。

13、优选地,步骤(2)中,所述数据集按6~8:2~4划分为训练集和测试集。

14、优选地,步骤(2)中,所述药物组成,包括药物分子量(molar weight,mw)和药物分子体积(molar volume,mv)。

15、优选地,步骤(2)中,所述复杂操作条件,包括温度(temperature,tem),压力(pressure,p)和ph值。

16、优选地,步骤(2)中,所述hansen溶解参数包括不同溶质和混合溶剂的极性、色散、氢键(δp1、δd1、δh1、δp2、δd2和δh2)和混合溶剂的配比(w=0,0.1...0.9,1)值。

17、优选地,所述步骤(3)具体为,采用python软件分别计算在不同配比的混合溶剂条件下,各个特征变量与药物溶解度(mole fraction solubility,mfs)数据集之间的相关系数r和p假设检验值验证相关性,并同时计算他们的特征重要性。

18、

19、其中,和表示变量x和y的平均值,r是两个输入变量之间的相关系数值。其取值在[-1,1]之间时确定数据之间的线性相关性相对容易。此外,当相关系数值在[0,1]之间时两变量呈正相关,在[-1,0]之间呈负相关。这意味着任意两个不同变量之间的线性关系随着绝对值的增大而增大。

20、

21、式中,n为样本量;p为任意两个变量之间的假设检验值,通过n-2个自由度的双截断分布得到。p假设检验值仅反映二者之间是否存在显著统计学差异,一般情况下,p<0.05为有统计学差异,p<0.01为有显著统计学差异,p<0.001为有极其显著的统计学差异。

22、优选地,步骤(4)中,所述机器学习方法,包括随机森林(rf)、k折交叉验证、人工神经网络(ann)和支持向量机(svm)。

23、优选地,步骤(4)中,用于评估所述定量预测模型预测能力的参数为:可决策系数r2和均方根误差rmse;其中,rmse是误差指标,值越小说明预测误差越小,模型稳定性越高;r2为相关性指标,值越接近于1,模型拟合性越好;

24、r2:提供有关模型拟合优度,在回归中,是回归预测与实际数据本文档来自技高网...

【技术保护点】

1.一种基于Hansen描述符分类的药物溶解度的预测方法,其特征在于,所述预测方法包括如下步骤:

2.根据权利要求1所述基于Hansen描述符分类的药物溶解度的预测方法,其特征在于,步骤(1)包括如下步骤:

3.根据权利要求1所述基于Hansen描述符分类的药物溶解度的预测方法,其特征在于,步骤(2)中,宏观条件包括药物组成和操作条件,微观条件包括不同溶质和溶剂的配比的Hansen溶解参数。

4.根据权利要求3所述基于Hansen描述符分类的药物溶解度的预测方法,其特征在于,所述药物组成包括药物分子量和药物分子体积。

5.根据权利要求1所述基于Hansen描述符分类的药物溶解度的预测方法,其特征在于,所述操作条件包括温度Tem,压力P和pH值。

6.根据权利要求2所述基于Hansen描述符分类的药物溶解度的预测方法,其特征在于,Hansen溶解参数包括不同溶质和混合溶剂的极性、色散、氢键和混合溶剂的配比值。

7.根据权利要求1所述基于Hansen描述符分类的药物溶解度的预测方法,其特征在于,步骤(3)包括:采用Python软件分别计算在不同配比的混合溶剂中,各个特征变量与药物溶解度数据集之间的相关系数r和p假设检验值验证相关性,并同时计算他们的特征重要性:

8.根据权利要求1所述基于Hansen描述符分类的药物溶解度的预测方法,其特征在于,步骤(4)中,所述机器学习算法包括随机森林、K折交叉验证、人工神经网络和支持向量机。

9.根据权利要求1所述基于Hansen描述符分类的药物溶解度的预测方法,其特征在于,步骤(5)中,用以评估所述定量预测模型的预测能力的参数为:可决策系数R2和均方根误差RMSE;其中R2为相关性指标,提供有关模型拟合优度;RMSE是误差指标,用于量化模型质量;

10.根据权利要求1所述基于Hansen描述符分类的药物溶解度的预测方法,其特征在于,步骤(5)包括:根据本专利技术提供的基于不同配比的混合溶剂条件下药物溶解度的预测方法,同时对特征变量:药物分子量、药物分子体积、温度、压力、pH值、不同溶质和溶剂的极性、色散、氢键和混合配比,与目标变量药物溶解度的数据集进行平均数、中位数和方差的计算;在防止过拟合问题的同时,分别根据是否含有Hansen微观描述符的条件下对影响药物溶解度的特征进行重要性排序和分析。

...

【技术特征摘要】

1.一种基于hansen描述符分类的药物溶解度的预测方法,其特征在于,所述预测方法包括如下步骤:

2.根据权利要求1所述基于hansen描述符分类的药物溶解度的预测方法,其特征在于,步骤(1)包括如下步骤:

3.根据权利要求1所述基于hansen描述符分类的药物溶解度的预测方法,其特征在于,步骤(2)中,宏观条件包括药物组成和操作条件,微观条件包括不同溶质和溶剂的配比的hansen溶解参数。

4.根据权利要求3所述基于hansen描述符分类的药物溶解度的预测方法,其特征在于,所述药物组成包括药物分子量和药物分子体积。

5.根据权利要求1所述基于hansen描述符分类的药物溶解度的预测方法,其特征在于,所述操作条件包括温度tem,压力p和ph值。

6.根据权利要求2所述基于hansen描述符分类的药物溶解度的预测方法,其特征在于,hansen溶解参数包括不同溶质和混合溶剂的极性、色散、氢键和混合溶剂的配比值。

7.根据权利要求1所述基于hansen描述符分类的药物溶解度的预测方法,其特征在于,步骤(3)包括:采用python软件分别计算在不同配比的...

【专利技术属性】
技术研发人员:钱红亮王聪黎婷高慧敏黄德春陈维钟伊南
申请(专利权)人:中国药科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1