当前位置: 首页 > 专利查询>厦门大学专利>正文

一种应用于药物分析的决策规则自动生成方法及系统技术方案

技术编号:34608434 阅读:26 留言:0更新日期:2022-08-20 09:13
本发明专利技术提供了机器学习技术领域的一种应用于药物分析的决策规则自动生成方法及系统,方法包括:步骤S10、获取药物数据,提取药物数据的药物特征并构建数据集;步骤S20、计算数据集中各药物特征的方差、数据复杂度以及排列重要性,基于方差、数据复杂度以及排列重要性筛选重要特征;步骤S30、从重要特征中筛选包含n(n=1,2,3,

【技术实现步骤摘要】
一种应用于药物分析的决策规则自动生成方法及系统


[0001]本专利技术涉及机器学习
,特别指一种应用于药物分析的决策规则自动生成方法及系统。

技术介绍

[0002]目前,机器学习的理论和技术已经广泛用于药物分析,如预测药物是否具有肝毒性,预测药物是否具有急性毒性。以药物肝毒性的预测为例,基于现有药物数据拟合机器学习模型,便可预测新药物是否对人具有肝毒性,这不仅节约了生物医学实验所需的大量人力物力,也在一定程度上避免了实验风险和伦理问题。
[0003]药物分析要求机器学习模型在给出预测结果的同时,提供决策规则(决策依据)。然而,传统机器学习模型的结构简单,性能很快达到上限,预测准确性较低;集成学习和深度学习方法虽然具有较好的性能,但可解释性较差。
[0004]因此,如何提供一种应用于药物分析的决策规则自动生成方法及系统,为不可解释的机器学习模型生成易于理解的决策规则,成为一个亟待解决的技术问题。

技术实现思路

[0005]本专利技术要解决的技术问题,在于提供一种应用于药物分析的决策规则自动生成方法及系统,为不本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种应用于药物分析的决策规则自动生成方法,其特征在于:包括如下步骤:步骤S10、获取药物数据,提取所述药物数据的药物特征并构建数据集;步骤S20、计算所述数据集中各药物特征的方差、数据复杂度以及排列重要性,基于所述方差、数据复杂度以及排列重要性筛选重要特征;步骤S30、从所述重要特征中筛选包含n(n=1,2,3,

)个特征的特征子集,并计算各所述特征子集的排列重要性;步骤S40、按所述排列重要性的顺序在各特征子集上搜索使预测结果发生翻转时,各所述特征子集所需的最小特征变化量,进而生成类别边界;步骤S50、通过贝叶斯公式将所述类别边界描述成决策规则。2.如权利要求1所述的一种应用于药物分析的决策规则自动生成方法,其特征在于:所述步骤S10中,所述药物数据至少包括分子指纹以及物理化学性质;所述物理化学性质至少包括分子量、疏水参数以及溶解度。3.如权利要求1所述的一种应用于药物分析的决策规则自动生成方法,其特征在于:所述步骤S20具体为:计算所述数据集中各药物特征的方差、数据复杂度以及排列重要性,将各所述药物特征的方差、数据复杂度以及排列重要性进行求和并排序,进而筛选重要特征。4.如权利要求1所述的一种应用于药物分析的决策规则自动生成方法,其特征在于:所述步骤S30中,所述排列重要性的计算过程如下:在所述特征子集的特征值不打乱时,计算机器学习模型的第一预测性能;将所述特征子集包含的几个特征的特征值同时进行随机打乱,计算机器学习模型的第二预测性能;将所述第一预测性能减去第二预测性能即为特征子集的排列重要性。5.如权利要求1所述的一种应用于药物分析的决策规则自动生成方法,其特征在于:所述步骤S40具体包括:步骤S41、基于各所述特征子集的优先级依次选取一特征子集;n的取值越小优先级越高;步骤S42、基于反事实理论,按所述排列重要性的顺序在各特征子集上搜索使预测结果发生翻转时,各所述特征子集所需的最小特征变化量,进而生成类别边界。6.一种应用于药物分析的决策规则自动生成系统,其特征在于:包括如...

【专利技术属性】
技术研发人员:林伟平王备战姚俊峰刘昆宏何松武连莲洪清启陈俐燕
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1