基于制造技术

技术编号：39673091 阅读：13 留言：0更新日期：2023-12-11 18:39

本发明专利技术公开了一种基于

全部详细技术资料下载

【技术实现步骤摘要】
基于Squared
‑
chord距离的生物信息标签分布学习方法

[0001]本专利技术属于数据挖掘方法
，涉及一种基于
Squared
‑
chord
距离的生物信息标签分布学习方法
。

技术介绍

[0002]单标签学习
(SLL)
与多标签学习
(MLL)
是解决分类问题的两个成熟范例，两者都可以看作建立从样本空间到标签空间的映射关系
。
单标签学习假设每个样本只有一个确定的标签或类别，这种情况在许多分类任务中都很常见，例如图像分类
、
文本分类等
。
然而，在实际处理问题的过程中，标签与标签之间往往并不冲突，甚至许多标签是存在关联性
。
如果在这种分类情况下只考虑单标签学习，那么就会丢失许多重要的样本标签，导致分类的结果失去精确性和完整性
。
为了更好地解决单标签学习无法解决的这些涉及多个标签的问题，有关研究人员提出了多标签学习这一概念和相关算法，目的是有效解决多标签分类问题，提高分类的精确性和完整性
。
多标签学习假设样本可能与一组标签或类别相关，最初采用基于规则的方法或启发式算法
。
大量研究表明，多标签学习是一种有效且广泛使用的学习范式，在文本分类
、
图像标注等方面得到了应用，能够解决更多的分类问题
。
[0003]然而多标签学习也存在局限性，通过多标签学习能够获得一组...

【技术保护点】

【技术特征摘要】
1.
基于
Squared
‑
chord
距离的生物信息标签分布学习方法，其特征在于该方法包括以下步骤：步骤1：获取生物信息样本数据，包含生物信息特征和相对应的通过自然衡量标准获取的一组生物信息表达水平；对生物信息表达水平归一化后得到与生物信息相关的不同描述程度，作为标签分布；步骤2：对获取的生物信息数据进行划分，将原始生物信息样本数据分为训练样本数据和待预测样本数据；步骤3：初始化参数矩阵和迭代更新矩阵，利用
Squared
‑
chord
距离和最大熵模型构造目标函数；所述的迭代更新矩阵用于优化所述参数矩阵；步骤4：根据步骤3中初始化的参数矩阵和迭代更新矩阵，以及目标函数的一阶梯度，利用
BFGS
优化方法优化参数矩阵，直到目标函数的一阶梯度小于预先设定的收敛条件值，得到最佳参数矩阵；步骤5：通过优化后获得生物信息标签分布学习模型，将步骤2中划分得到的待预测生物样本数据输入至生物信息标签分布学习模型中，由...

【专利技术属性】
技术研发人员：杨柏林，纪国强，傅晨浩，马希骜，
申请(专利权)人：浙江工商大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人