孤立手语词特征提取器、提取方法、识别模型及方法技术

技术编号：32529867 阅读：16 留言：0更新日期：2022-03-05 11:23

本发明专利技术公开了一种孤立手语词特征向量提取方法、提取器、识别方法及模型，通过2DCNN

全部详细技术资料下载

【技术实现步骤摘要】
孤立手语词特征提取器、提取方法、识别模型及方法

[0001]本专利技术属于手语词识别领域，特别涉及一种孤立手语词特征提取器、提取方法、识别模型及方法。

技术介绍

[0002]手语是聋哑人的主要表达方式，它作为一种语言，已逐渐为人们所接受。然而大多数健听人并不懂手语，造成了聋哑人与健听人之间的沟通困难，以至于聋哑人融入正常社会生活存在着诸多不便。
[0003]鉴于经济社会为了对聋哑群体更加悉心关照而产生了对实用化手语识别系统的迫切需求，若能充分利用现有的先进技术，结合手语识别最新研究成果，设计一款手语识别系统，将一定程度上促进手语识别技术的发展，加快手语识别从实验室研究走向实地应用的进程，进而促进聋哑公益事业的发展。
[0004]孤立手语词识别是连续手语词识别的基础，良好的孤立手语词识别算法能够提高连续手语词识别的精度与鲁棒性，因此孤立手语词识别成为手语识别领域的一个重点。孤立词识别的输入数据是一段视频，根据手语者速度的不同通常包含若干帧，但关键帧通常不超过6帧。
[0005]目前孤立词手语识别常用的技术方案包括使用3DCNN作为特征提取器，将输入的图像序列转化成特征向量形式，这种特征提取器能够捕捉帧间的快速移动尤其是手部运动，但参数量巨大，计算耗时，对硬件平台要求较高。而对于特征向量如何转化成词汇的问题，有研究者将特征向量序列输入HMM或RNN，最终生成词汇，这种方式能够进一步提取图像序列特征，但缺点是模型复杂且计算耗时。
[0006]也有研究者直接使用2DCNN作为特征提取器，生成特...

【技术保护点】

【技术特征摘要】
1.一种孤立手语词特征提取器，其特征在于，包括：输入层(1)，用于获取待识别的孤立手语视频中的多帧图像；N个依次堆叠的融合块(2、2'、2”、2”')，其中，各融合块(2、2'、2”、2”')包括一第一2DCNN(201)、一第一3DCNN(202)、一融合层(203)、一第二2DCNN(204)；第一2DCNN(201)用于通过输入层(1)接收连续3帧图像中的首帧图像并对其进行2D卷积处理，第一3DCNN(202)用于通过输入层(1)接收连续3帧图像并对其进行3D卷积处理；融合层(203)用于对第一2DCNN(201)和第一3DCNN(202)输出的图像帧相加处理；第二2DCNN(204)用于对相加处理后的图像做2D卷积处理；全局平均池化层(4)，用于对第二2DCNN(204)输出的图像进行全局平均池化处理，并输出特征向量。2.如权利要求1所述的孤立手语词特征提取器，其特征在于，还包括预处理模块，用于从原始待识别的孤立手语视频中获取图像帧并预处理后再送至输入层(1)。3.如权利要求2所述的孤立手语词特征提取器，其特征在于，所述预处理模块包括关键点识别模块和截取模块；关键点识别模块：用于识别原始获取的第一帧图像中人体上半身关键点并获得人体中心；截取模块：用于以人体中心为中心向外周截取设定大小的图像并作为最终...

【专利技术属性】
技术研发人员：徐强，辜嘉，吴宗正，李凌，宋凯旋，
申请(专利权)人：苏州中科先进技术研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人