一种用于语音情感计算的无监督主动学习方法技术

技术编号:23316772 阅读:23 留言:0更新日期:2020-02-11 18:24
本发明专利技术公开了一种用于语音情感计算的无监督主动学习方法,属于情感计算领域。相比于现有的用于语音情感计算的有监督主动学习方法需要已知少量真实标签并需要和人工专家多次交互,本发明专利技术通过多步迭代优化,每轮迭代依次优化待打标样本集S

An unsupervised active learning method for speech emotion computing

【技术实现步骤摘要】
一种用于语音情感计算的无监督主动学习方法
本专利技术属于情感计算领域,更具体地,涉及一种用于语音情感计算的无监督主动学习方法。
技术介绍
情感计算是一种通过计算机来自动识别人类情感的人工智能技术,语音情感计算是指,给计算机输入人们说的话,然后计算机对原始语音信号进行特征提取后,输入机器学习模型获得预测输出,再通过情感解码获取这句话中的情感。语音情感的编码一般是使用连续值来对情感的程度进行编码(例如用0-1表示平静到很愤怒),因此所用的机器学习模型是回归模型。这项技术能够让计算机理解人类语音中蕴藏的情感,从而扩展人机交互的功能。目前,语音情感计算技术遇到的主要挑战之一是,训练一个语音情感计算的机器学习模型需要大量带标签的语音数据,这导致人工专家的打标劳动量很大。因为,虽然原始语音数据很容易采集,但是要获取这些语音数据中的真实情感,则十分困难,需要多名专家仔细聆听多次,才能给出相对可靠的结果。所以,减少人工专家的打标劳动量能使得语音情感计算模型的训练成本大大降低。主动学习是常用的减少打标劳动的机器学习算法,将其运用到回归问题中,便是主动学习本文档来自技高网...

【技术保护点】
1.一种用于语音情感计算的无监督主动学习方法,其特征在于,该方法包括以下步骤:/nS1.获取提取特征后语音样本的特征维度d,设定交给专家打标的语音样本个数M、迭代次数c的最大值c

【技术特征摘要】
1.一种用于语音情感计算的无监督主动学习方法,其特征在于,该方法包括以下步骤:
S1.获取提取特征后语音样本的特征维度d,设定交给专家打标的语音样本个数M、迭代次数c的最大值cmax、步数索引i的最大值S、第i步需要获取的待打标样本数目Mi、第i步使用的优化方法,要求初始化步数索引i为1;
S2.初始化迭代次数c为1,从语音样本集中选取Mi个样本初始化待打标样本集Sic,将Sic存入待打标样本集库SLi中,其中,Sic表示第i步的第c轮迭代对应的待打标样本集;
S3.从待打标样本集Sic中选择一个第c轮迭代中未被优化的待打标样本,固定其余(Mi-1)个样本和之前所有步选出的样本,通过第i步使用的优化方法,从排除固定样本后的语音样本集中选择一个最有价值的样本替换待优化的待打标样本,更新Sic;
S4.如果第c轮迭代中,待打标样本集Sic中的所有样本都被优化了一次,则进入步骤S5,否则,返回步骤S3;
S5.如果第c轮迭代的待打标样本集Sic已经存在于待打标样本集库SLi中,或者已经达到最大迭代次数cmax,则进入步骤S6;否则,将当前迭代的待打标样本集Sic存入待打标样本集库SLi中,下一轮迭代的待打标样本集Si(c+1)初始化为Sic,c=c+1,返回步骤S3;
S6.如果i=S,则输出这i步选出的共计M个待打标样本给专家,结束;否则,i=i+1,返回步骤S2。


2.如权利要求1所述的方法,其特征在于,根据打标成本预算与回归模型的期望精度,设定交给专家打标的语音样本个数M;根据期望的运算代价,设定最大迭代次数cmax;根据待打标的语音样本个数M和语音样本的特征向量的维度d,设定步数索引i的最大值S。


3.如权利要求2所述的方法,其特征在于,当M≤d+1时,使用一步优化,当M>d+1时,使用两步优化。

<...

【专利技术属性】
技术研发人员:伍冬睿刘子昂
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1