【技术实现步骤摘要】
一种基于公共和私有信息挖掘的众包测试报告融合方法
[0001]本专利技术涉及数据处理的
,尤其涉及一种基于公共和私有信息挖掘的众包测试报告融合方法。
技术介绍
[0002]软件众测是一种新型的软件测试模式,其基于众包技术将原本由公司内部专业的测试人员的测试任务,通过众测平台分发给活跃在众测平台的众测工作者,众测工作者通过提交测试报告的形式反馈结果。随着数据采集技术的迅速发展,信息来源或者形式呈现多样性,因此数据从传统的单一模态演变为多模态或多视图的形式。例如:一个测试报告可以由文本和图像构成。如果仅仅使用其中某一个模态,则会缺乏全面性;如果直接将所有的模态拼接,则会引发维度灾难,而且意义不明确。与单模态学习不同的是,多模态学习主要通过挖掘模态间的一致性和互补性,从而提升学习性能。一致性原则要求尽可能最大化不同模态数据输出的一致性;互补性原则说明每个模态都包含一些其他模态没有的信息,不同的信息之间相互补充,从而克服单个模态信息表示不充分的缺陷。多模态学习旨在模拟每个模态学习一个函数,并通过联合优化所有函数来提升泛化性能, ...
【技术保护点】
【技术特征摘要】
1.一种基于公共和私有信息挖掘的众包测试报告融合方法,其特征在于:包括以下步骤,步骤1,进行特征映射,每个模态中包括所有模态共享的公共信息,以及该模态的私有信息,将原始特征空间中抽取的模态映射为同一维度的公共向量和私有向量;步骤2,对不同模态所包含的所有模态共享的公共信息和每个模态的私有信息进行获取;步骤3,进行模态关系挖掘,将得到d维公共信息C
i
和私有信息依次输入到LSTM中进行处理;步骤4,进行标签预测,在多标签学习中,每种模态都有其对多标签预测的特定贡献,利用储存在LSTM记忆单元中的不同模态的信息获取标签之间的关系。2.如权利要求1所述的基于公共和私有信息挖掘的众包测试报告融合方法,其特征在于:所述步骤1还包括以下步骤,步骤1
‑
1,进行公共模态映射,为探索所有模态的公共子空间,将X
i
中所有的模态串联起来,形成一个新的模态且:其中,d
all
=d1+d2+
…
+d
P
,d
m
为第m个模态的维度。得到新的模态后,加入一个全连接层,将全连接层的输出加入新的模态,并根据以下计算式将原始公共模态转换为d维公共向量C
i
:其中,为权重向量,b
O
∈R1×
d
为偏差向量;步骤1
‑
2,进行私有模态映射,原始特征向量X
i
中的每个模态都可以用来抽取私有信息,再分别为每个模态加入一个全连接层,并根据如下的计算式将原始私有模态转换为d维向量量其中,为权重向量,b
m
∈R1×
d
为偏差向量。3.如权利要求2所述的基于公共和私有信息挖掘的众包测试报告融合方法,其特征在于:所述步骤2中的获取公共信息和私有信息还包括以下步骤,步骤2
‑
1,获取公共信息,从串联模态中寻求公共信息,公共信息与多个标签之间对应的预测模型f(C
i
)可用如下的公式表示:f(C
i
)=σ(C
i
W
C
+b
C
...
【专利技术属性】
技术研发人员:王崇骏,张怡,陈明猜,陈明远,李宁,
申请(专利权)人:南京大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。