【技术实现步骤摘要】
本专利技术涉及计算化学,并且更具体地涉及用于预测分子的物理化学特性的机器学习技术。
技术介绍
1、机器学习已用于从大量原始数据中获得有用的见解。最近,其已被应用于化合物,特别是用于分析如新药等生物医学应用的化合物。物理化学特性的评估在药物发现研究中发挥关键作用。
2、从基本理念到最终产物的药物开发是一个复杂且昂贵的过程。在早期阶段,必须筛选大量化学分子以识别表现出某种化学活性的潜在化合物。然而,通过传统方法在这些潜在化合物中寻找药物候选物是不可行的。多年来,将单一药物从最初的筛选带到临床试验的成本平均为数亿美元;因此,需要用于识别最好候选药物分子的改进技术。本专利技术解决了此需要。
技术实现思路
1、亲油性logp、辛醇-水分配系数是评估目标分子作为药物使用的指标之一,因为其指示目标分子作为药物的吸收、分布、代谢、排泄、毒性和效力。本专利技术旨在准确预测分子的亲油性和其它物理化学特性,以便识别候选药物以进行进一步测试。
2、一方面,本专利技术提供了一种用于预测药物的
...【技术保护点】
1.一种用于预测药物的候选小分子的物理化学特性的机器学习系统,其特征在于,包括:
2.根据权利要求1所述的机器学习系统,其特征在于,所述小分子物理化学特性的数据库是小分子保留时间(SMRT)数据集,所述小分子保留时间数据集包含国际化合物标识(InChI)代码,并且提取的数据被转换为简化分子线性输入规范(SMILES)符号以提取物理化学特性作为对ChEMBL数据库的查询。
3.根据权利要求1所述的机器学习系统,其特征在于,所述物理化学特性为亲油性。
4.根据权利要求3所述的机器学习系统,其特征在于,所述目标亲油性在大约1与大约3之间。
5.根...
【技术特征摘要】
1.一种用于预测药物的候选小分子的物理化学特性的机器学习系统,其特征在于,包括:
2.根据权利要求1所述的机器学习系统,其特征在于,所述小分子物理化学特性的数据库是小分子保留时间(smrt)数据集,所述小分子保留时间数据集包含国际化合物标识(inchi)代码,并且提取的数据被转换为简化分子线性输入规范(smiles)符号以提取物理化学特性作为对chembl数据库的查询。
3.根据权利要求1所述的机器学习系统,其特征在于,所述物理化学特性为亲油性。
4.根据权利要求3所述的机器学习系统,其特征在于,所述目标亲油性在大约1与大约3之间。
5.根据权利要求1所述的机器学习系统,其特征在于,所述小分子物理化学特性的数据库包含酸解离常数(pka)和极性表面积。
6.根据权利要求1所述的机器学习系统,其特征在于,所述机器学习模型包括随机森林回归算法。
7.根据权利要求1所述的机器学习系统,其特征在于...
【专利技术属性】
技术研发人员:梅奥·温·扎乌,威廉·斯科特·霍普金,张铭恩,
申请(专利权)人:眼视觉研究中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。