咽喉定位模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：40491494 阅读：5 留言：0更新日期：2024-02-26 19:21

本发明专利技术涉及图像处理技术领域，具体公开了一种咽喉定位模型训练方法、装置、电子设备及存储介质，其中，咽喉定位模型训练方法包括步骤：S1、基于公共数据集获取人脸数据集；S2、基于喉结识别模型对人脸数据集进行分类以获取有喉结数据集和无喉结数据集；S3、基于有喉结数据集和无喉结数据集分别训练两个咽喉定位模型，并获取两个咽喉定位模型的输出数据集；S4、获取修正处理后的输出数据集以作为新的人脸数据集；S5、重复执行步骤S2‑步骤S4以获取训练后的咽喉定位模型；该咽喉定位模型训练方法有效减少了人工标注标签的时间，提高了咽喉定位模型的训练效率，且训练获取的咽喉定位模型能准确地进行咽喉定位。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像处理，具体而言，涉及一种咽喉定位模型训练方法、装置、电子设备及存储介质。

技术介绍

1、当前面部特征点检测技术以及数据库已经比较完善，对于面部不同特征点的定位已经发展了很长时间并且有较好的效果，但现有的定位技术缺少针对咽喉位置定位的处理手段，而咽喉定位有利于监视检测对象是否存在吞咽动作等；若采用传统的人脸特征点定位方法来训练一个咽喉定位模型，则需要人工进行大量的标签标注，且喉结的存在与否也影响了咽喉定位模型的训练效果。

2、针对上述问题，目前尚未有有效的技术解决方案。

技术实现思路

1、本申请的目的在于提供一种咽喉定位模型训练方法、装置、电子设备及存储介质，以训练出能进行咽喉准确定位的咽喉定位模型，并减少人工标注标签的时间。

2、第一方面，本申请提供了一种咽喉定位模型训练方法，用于获取咽喉定位模型，所述方法包括以下步骤：

3、s1、基于公共数据集获取人脸数据集；

4、s2、基于喉结识别模型对人脸数据集进行分类以获取有喉结数据集和无喉结数据集，所述喉结识别模型用于分析图像中是否存在喉结；

5、s3、基于有喉结数据集和无喉结数据集分别训练两个咽喉定位模型，并获取两个咽喉定位模型的输出数据集；

6、s4、获取修正处理后的输出数据集以作为新的人脸数据集；

7、s5、重复执行步骤s2-步骤s4以获取训练后的咽喉定位模型。

8、本申请的咽喉定位模型训练方法基于公共数据集获取了足够多的训

9、所述的咽喉定位模型训练方法，其中，所述公共数据集为fadid数据集。

10、该数据集中的视频或图像均包含下至肩膀、上至完全人脸的部分，其内具有众多有效数据（即具有外露咽喉和完整人脸的图像），故尤其适用于本申请的咽喉定位模型训练方法训练咽喉定位模型使用。

11、所述的咽喉定位模型训练方法，其中，所述人脸数据集中元素基于fadid的人脸关键点和咽喉特征点作为训练标签。

12、本申请的咽喉定位模型训练方法结合人脸关键点和咽喉特征点作为训练标签来对咽喉定位模型进行训练，以使咽喉定位模型能利用特征点之间的关系来进行咽喉定位训练，使得咽喉定位模型能考虑人脸五官和咽喉之间的几何关系来进行咽喉定位，进而提高咽喉定位模型的定位精度并减少训练轮次。

13、所述的咽喉定位模型训练方法，其中，所述喉结识别模型为二分类模型，且具有一个用于输出存在喉结的概率的全连接层，所述人脸数据集中元素基于比较所述存在喉结的概率和预设阈值的大小进行分类。

14、所述的咽喉定位模型训练方法，其中，所述咽喉定位模型为hrnet v2模型。

15、所述的咽喉定位模型训练方法，其中，所述hrnet v2模型的输入层分辨率为384*512。

16、所述的咽喉定位模型训练方法，其中，所述咽喉定位模型基于热力图进行输出。

17、第二方面，本申请还提供了一种咽喉定位模型训练装置，用于获取咽喉定位模型，所述装置包括：

18、第一获取模块，用于基于公共数据集获取人脸数据集；

19、分类模块，用于基于喉结识别模型对人脸数据集进行分类以获取有喉结数据集和无喉结数据集，所述喉结识别模型用于分析图像中是否存在喉结；

20、训练模块，用于基于有喉结数据集和无喉结数据集分别训练两个咽喉定位模型，并获取两个咽喉定位模型的输出数据集；

21、第二获取模块，用于获取修正处理后的输出数据集以作为新的人脸数据集；

22、循环模块，用于重复触发控制分类模块、训练模块及第二获取模块运行以获取训练后的咽喉定位模型。

23、本申请的咽喉定位模型训练装置基于公共数据集获取了足够多的训练数据来对咽喉定位模型进行训练，同时，训练过程先基于喉结识别模型对人脸数据集进行分类，以训练两个分别用于针对有喉结的人脸图像和无喉结的人脸图像进行咽喉定位的咽喉定位模型，有效提高了咽喉定位的准确率；另外，本申请的咽喉定位模型训练装置基于修正处理后的、源自咽喉定位模型的输出数据集制作的新的人脸数据集来继续对咽喉定位模型进行训练，有效减少了人工标注标签的时间，提高了咽喉定位模型的训练效率。

24、第三方面，本申请还提供了一种电子设备，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如上述第一方面提供的所述方法中的步骤。

25、第四方面，本申请还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。

26、由上可知，本申请提供了一种咽喉定位模型训练方法、装置、电子设备及存储介质，其中，本申请的咽喉定位模型训练方法基于公共数据集获取了足够多的训练数据来对咽喉定位模型进行训练，同时，训练过程先基于喉结识别模型对人脸数据集进行分类，以训练两个分别用于针对有喉结的人脸图像和无喉结的人脸图像进行咽喉定位的咽喉定位模型，有效提高了咽喉定位的准确率；另外，本申请的咽喉定位模型训练方法基于修正处理后的、源自咽喉定位模型的输出数据集制作的新的人脸数据集来继续对咽喉定位模型进行训练，有效减少了人工标注标签的时间，提高了咽喉定位模型的训练效率。

本文档来自技高网...

【技术保护点】

1.一种咽喉定位模型训练方法，其特征在于，用于获取咽喉定位模型，所述方法包括以下步骤：

2.根据权利要求1所述的咽喉定位模型训练方法，其特征在于，所述公共数据集为FADID数据集。

3.根据权利要求2所述的咽喉定位模型训练方法，其特征在于，所述人脸数据集中元素基于FADID的人脸关键点和咽喉特征点作为训练标签。

4.根据权利要求1所述的咽喉定位模型训练方法，其特征在于，所述喉结识别模型为二分类模型，且具有一个用于输出存在喉结的概率的全连接层，所述人脸数据集中元素基于比较所述存在喉结的概率和预设阈值的大小进行分类。

5.根据权利要求1所述的咽喉定位模型训练方法，其特征在于，所述咽喉定位模型为HRNet V2模型。

6.根据权利要求5所述的咽喉定位模型训练方法，其特征在于，所述HRNet V2模型的输入层分辨率为384*512。

7.根据权利要求1所述的咽喉定位模型训练方法，其特征在于，所述咽喉定位模型基于热力图进行输出。

8.一种咽喉定位模型训练装置，其特征在于，用于获取咽喉定位模型，所述装置包括：

9.一种电子设备，其特征在于，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如权利要求1-7任一项所述方法中的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时运行如权利要求1-7任一项所述方法中的步骤。

...

【技术特征摘要】

1.一种咽喉定位模型训练方法，其特征在于，用于获取咽喉定位模型，所述方法包括以下步骤：

2.根据权利要求1所述的咽喉定位模型训练方法，其特征在于，所述公共数据集为fadid数据集。

3.根据权利要求2所述的咽喉定位模型训练方法，其特征在于，所述人脸数据集中元素基于fadid的人脸关键点和咽喉特征点作为训练标签。

5.根据权利要求1所述的咽喉定位模型训练方法，其特征在于，所述咽喉定位模型为hrnet v2模型。...

【专利技术属性】
技术研发人员：祝兴，杨嘉成，罗静静，黄羽霖，苗春龙，
申请(专利权)人：季华实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人