用于虚拟声乐教学的面部图像分析方法技术

技术编号:38316305 阅读:11 留言:0更新日期:2023-07-29 08:58
本发明专利技术提供一种用于虚拟声乐教学的面部图像分析方法。本发明专利技术应用于图像处理领域,该方法,包括:采集使用者使用虚拟声乐教学辅助系统练习的实时图像;接着,根据实时图像中像素点的运动速度与运动方向,确定实时图像的重点区域;再接着根据重点区域中各条线段中像素点的数量以及运动速度,确定每条线段中的特征点;然后根据特征点,以及对实时图像进行拉普拉斯Laplacian处理的结果进行加权处理,获得增强后的实时图像。通过根据特征点对实时图像进行拉普拉斯Laplacian处理的结果进行加权处理,实现了对实时图像中重点区域进行图像加强,从而提高了虚拟声乐教学的面部图像分析的准确性。准确性。准确性。

【技术实现步骤摘要】
用于虚拟声乐教学的面部图像分析方法


[0001]本专利技术涉及图像处理领域,具体为一种用于虚拟声乐教学的面部图像分析方法。

技术介绍

[0002]虚拟声乐教学辅助系统是一种基于人工智能技术开发的教学辅助工具,它可以通过模拟人类声音和运动的方式来帮助学生学习唱歌技巧。该系统通常使用计算机图形学和模拟技术,以创建一个虚拟现实环境,让学生可以在虚拟环境中练习唱歌。该系统可以提供实时反馈,分析学生的声音、喉部运动等数据,并给出相应的建议,帮助学生不断提升自己的唱歌技巧。
[0003]在使用虚拟声乐教学辅助系统时,系统通常会采集学生练习的实时图像,通过分析学生面部、喉部等动作表情来获取学生哪些地方需要进行改进,哪些地方表现优秀。在这一过程中,学生的面部特征提取精度直接影响了学生的学习效果的判断与系统提出建议的精度。故往往需要对采集的图像进行图像增强处理,以提高学生练习过程中的面部特征提取精度。
[0004]在使用Laplacian算子对图像进行增强时,需要原图像与Laplacian图像进行加权求和,通过图像叠加完成图像的增强。其中需要获取相应的权重因子,由于Laplacian图像中一些像素点的Laplacian值可能为负,在叠加时,容易出现对比度下降,噪声加强等现象,从而导致用于虚拟声乐教学的面部图像分析的准确率不高。

技术实现思路

[0005]针对现有技术中存在的问题,本专利技术提供一种用于虚拟声乐教学的面部图像分析方法。
[0006]本专利技术是通过以下技术方案来实现:本专利技术提供一种用于虚拟声乐教学的面部图像分析方法,包括:采集使用者使用虚拟声乐教学辅助系统练习的实时图像;根据所述实时图像中像素点的运动速度与运动方向,确定所述实时图像的重点区域;根据所述重点区域中各条线段中像素点的数量以及运动速度,确定每条线段中的特征点;根据所述特征点,以及对所述实时图像进行拉普拉斯Laplacian处理的结果进行加权处理,获得增强后的实时图像。
[0007]进一步的,所述根据所述实时图像中像素点的运动速度与运动方向,确定所述实时图像的重点区域,包括:根据所述实时图像中两个像素点分别对应的运动速度与运动方向,确定在所述运动方向上所述两个像素点对应的运动速度的差值与第一像素点对应的运动速度之间的比值,获得第一运动速度差异,所述两个像素点包括第一像素点和第二像素点;
在所述第一运动速度差异小于预设运动速度差异时,则执行根据第三像素点与所述第一像素点确定的第二运动速度差异,依此类推,直至第N运动速度差异大于或等于预设运动速度差异时,则确认第一像素点、第二像素点至第N像素点属于所述实时图像中人脸区域中的运动区域,所述N为大于2的整数,所述第N运动速度差异包括根据第N像素点与所述第一像素点分别对应的运动速度与运动方向,确定在所述运动方向上所述第N像素点与所述第一像素点对应的运动速度的差值与第一像素点对应的运动速度之间的比值。
[0008]进一步的,所述确认第一像素点、第二像素点至第N像素点属于所述实时图像中人脸区域中的运动区域之后,还包括:对所述运动区域中各像素点对应的灰度值进行平均计算,确定平均灰度值;根据所述平均灰度值,通过聚类方法将所述运动区域进行聚类,获得第一运动区域。
[0009]进一步的,所述根据所述平均灰度值,通过聚类方法将所述运动区域进行聚类,获得第一运动区域之后,还包括:将所述第一运动区域中第i像素点和第i+1像素点分别对应的灰度值进行相减处理,获得第一灰度差异值,i为大于0的整数;若所述灰度差异值小于预设灰度差异值时,执行根据第i+2像素点与所述第i像素点确定的第二灰度差异值,依此类推,直至第i+N运动速度差异大于或等于预设运动速度差异时,则确认第i像素点、第i+1像素点至第i+N像素点属于所述实时图像中人脸区域中的重点区域,所述N为大于2的整数,所述第i+N运动速度差异包括将所述第一运动区域中第i像素点和第i+N像素点分别对应的灰度值进行相减处理,获得的差值。
[0010]进一步的,所述根据所述重点区域中各条线段中像素点的数量以及运动速度,确定每条线段中的特征点,包括:根据所述重点区域中一线段上的像素点Z,将所述线段分为第一部分和第二部分;将所述第一部分上各像素点的灰度值、所述第二部分上各像素点的灰度值、所述第一部分上像素点的各运动速度和所述第二部分上像素点的各运动速度,确定第一函数值A;将第一像素点个数、第二像素点个数和预设正数,确定第二函数值B,所述第一像素点个数包括所述第一部分上各像素点的个数,所述第二像素点个数包括所述第二部分上各像素点的个数;将所述第一函数值A和所述第二函数值B的乘积,确定为特征点优选值YX;根据所述线段上各像素点Z点对应的特征点优选值YX,确定最大的特征点优选值YX为所述条线段中的特征点。
[0011]进一步的,所述将所述第一部分上各像素点的灰度值、所述第二部分上各像素点的灰度值、所述第一部分上像素点的各运动速度和所述第二部分上像素点的各运动速度,确定第一函数值A,包括:将所述第一部分上各像素点的灰度值和所述第二部分上各像素点的灰度值相减,获得第一灰度差值;将所述第一部分上像素点的各运动速度和所述第二部分上像素点的各运动速度相减,获得第一运动速度差值;
将所述第一灰度差值与所述第一运动速度差值通过指数函数处理,确定第一函数值A。
[0012]进一步的,所述将所述第一灰度差值与所述第一运动速度差值通过指数函数处理,确定第一函数值A,包括:根据第一函数值,确定第一函数值A,其中,中为所述线段的第一部分中第i个像素点的灰度值,中为第i个像素点在第二部分中的灰度值,为第一部分中第i个像素点的运动速度,为第i个像素点在第二部分中对应像素点的运动速度,为像素点z点将水平线段分割成两部分后第一部分的像素点个数,为第二部分的像素点个数。
[0013]进一步的,所述将第一像素点个数、第二像素点个数和预设正数,确定第二函数值B,包括:根据第二函数值,确定第二函数值B,其中,为像素点z点将水平线段分割成两部分后第一部分的像素点个数,为第二部分的像素点个数,为预设正数。
[0014]进一步的,所述根据所述特征点,以及对所述实时图像进行拉普拉斯Laplacian处理的结果进行加权处理,获得增强后的实时图像,包括:根据第q像素点的邻域中第i个像素点的灰度值,和像素点q点的灰度值,确定q点为噪声点的概率P,所述第q像素点为所述特征点;根据第q像素点所对应的信息丰富度Y、拉普拉斯Laplacian值L、概率P,和/或最大值,确定权重因子C,所述概率P包括第q像素点为噪声的概率,所述最大值包括所述实时图像中各像素值进行拉普拉斯Laplacian处理后最大的拉普拉斯Laplacian值,所述第q像素点所对应的信息丰富度Y包括根据第q像素点的运动速度、第q像素点与所述特征点之间的距离及第q像素点所在第一运动区域的像素点数量确定的;根据所述权重因子C以及所述第q像素点所对应的Laplacian值,确定像素点q增强后的像素点灰度值。
[0015]进一步的,所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于虚拟声乐教学的面部图像分析方法,其特征在于,包括:采集使用者使用虚拟声乐教学辅助系统练习的实时图像;根据所述实时图像中像素点的运动速度与运动方向,确定所述实时图像的重点区域;根据所述重点区域中各条线段中像素点的数量以及运动速度,确定重点区域中每条线段的特征点;根据所述特征点,以及对所述实时图像进行拉普拉斯Laplacian处理的结果进行加权处理,获得增强后的实时图像。2.根据权利要求1所述的用于虚拟声乐教学的面部图像分析方法,其特征在于,所述根据所述实时图像中像素点的运动速度与运动方向,确定所述实时图像的重点区域,包括:根据所述实时图像中两个像素点分别对应的运动速度与运动方向,确定在所述运动方向上所述两个像素点对应的运动速度的差值与第一像素点对应的运动速度之间的比值,获得第一运动速度差异,所述两个像素点包括第一像素点和第二像素点;在所述第一运动速度差异小于预设运动速度差异时,则执行根据第三像素点与所述第一像素点确定的第二运动速度差异,依此类推,直至第N运动速度差异大于或等于预设运动速度差异时,则确认第一像素点、第二像素点至第N像素点属于所述实时图像中人脸区域中的运动区域,所述N为大于2的整数,所述第N运动速度差异包括根据第N像素点与所述第一像素点分别对应的运动速度与运动方向,确定在所述运动方向上所述第N像素点与所述第一像素点对应的运动速度的差值与第一像素点对应的运动速度之间的比值。3.根据权利要求2所述的用于虚拟声乐教学的面部图像分析方法,其特征在于,所述确认第一像素点、第二像素点至第N像素点属于所述实时图像中人脸区域中的运动区域之后,还包括:对所述运动区域中各像素点对应的灰度值进行平均计算,确定平均灰度值;根据所述平均灰度值,通过聚类方法将所述运动区域进行聚类,获得第一运动区域。4.根据权利要求3所述的用于虚拟声乐教学的面部图像分析方法,其特征在于,所述根据所述平均灰度值,通过聚类方法将所述运动区域进行聚类,获得第一运动区域之后,还包括:将所述第一运动区域中第i像素点和第i+1像素点分别对应的灰度值进行相减处理,获得第一灰度差异值,i为大于0的整数;若所述灰度差异值小于预设灰度差异值时,执行根据第i+2像素点与所述第i像素点确定的第二灰度差异值,依此类推,直至第i+N运动速度差异大于或等于预设运动速度差异时,则确认第i像素点、第i+1像素点至第i+N像素点属于所述实时图像中人脸区域中的重点区域,所述N为大于2的整数,所述第i+N运动速度差异包括将所述第一运动区域中第i像素点和第i+N像素点分别对应的灰度值进行相减处理,获得的差值。5.根据权利要求4所述的用于虚拟声乐教学的面部图像分析方法,其特征在于,所述根据所述重点区域中各条线段中像素点的数量以及运动速度,确定重点区域中每条线段的特征点,包括:根据所述重点区域中一线段上的像素点Z,将所述线段分为第一部分和第二部分;将所述第一部分上各像素点的灰度值、所述第二部分上各像素点的灰度值、所述第一部分上像素点的各运动速度和所述第二部分上像素点的各运动速度,确定第一函数值A;
将第一像素点个数、第二像素点个数和预设正数,确定第...

【专利技术属性】
技术研发人员:时霞张时骏
申请(专利权)人:济南幼儿师范高等专科学校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1