一种文字显示方法、装置、机顶盒及介质制造方法及图纸

技术编号：34440555 阅读：18 留言：0更新日期：2022-08-06 16:29

本发明专利技术公开了一种文字显示方法、装置、机顶盒及介质，所述方法应用于机顶盒，包括：获取视频数据流中至少一帧视频图像；对各所述视频图像进行处理，得到目标手势集合；根据生成式对抗网络模型对目标手势集合进行识别，得到目标手势集合所对应的文字；将目标手势集合所对应的文字进行显示。利用该方法，通过对获取的各视频图像进行处理得到了目标手势集合，继而基于生成式对抗网络模型对目标手势集合进行识别，能够准确得到目标手势集合所对应的文字，提高文字显示的准确率，从而提升了交互体验。验。验。

全部详细技术资料下载

【技术实现步骤摘要】
一种文字显示方法、装置、机顶盒及介质

[0001]本专利技术涉及图像识别
，尤其涉及一种文字显示方法、装置、机顶盒及介质。

技术介绍

[0002]近年来，通过问诊APP进行远程直播互动交流的问诊方式应运而生。在问诊APP中可以包括智能手势辅助，即将对手势进行识别得到的文字在屏幕上进行显示，以辅助问诊过程中的互动交流。
[0003]对于智能手势辅助，现有的技术方案主要包括两种方式，第一种方式需要将特定手套戴在手上以进行手势所对应文字的识别，第二种方式则通过信息熵算法从背景图像中分割出手部、提取目标图像并应用到视频数据流中以识别手势对应的文字。但是在现有的技术方案中，只有较少数量的手势能被识别到，且对汉字手势笔划的识别准确率较低，从而影响了用户交互体验。

技术实现思路

[0004]本专利技术提供了一种文字显示方法、装置、机顶盒及介质，以提高文字显示的准确率，进而提升交互体验。
[0005]根据本专利技术的一方面，提供了一种文字显示方法包括：
[0006]获取视频数据流中至少一帧视频图像；
[0007]对各所述视频图像进行处理，得到目标手势集合；
[0008]根据生成式对抗网络模型对目标手势集合进行识别，得到目标手势集合所对应的文字；
[0009]将目标手势集合所对应的文字进行显示。
[0010]根据本专利技术的另一方面，提供了一种文字显示装置，包括：
[0011]获取模块，用于获取视频数据流中至少一帧视频图像；
[0012]处理...

【技术保护点】

【技术特征摘要】
1.一种文字显示方法，其特征在于，应用于机顶盒，所述方法包括：获取视频数据流中至少一帧视频图像；对各所述视频图像进行处理，得到目标手势集合；根据生成式对抗网络模型对目标手势集合进行识别，得到目标手势集合所对应的文字；将目标手势集合所对应的文字进行显示。2.根据权利要求1所述的方法，其特征在于，所述对各所述视频图像进行处理，得到目标手势集合，包括：针对每帧视频图像，提取视频图像所对应的手势图像，所述手势图像包含边界框；根据手势分割算法和动态时间规划算法对各所述手势图像进行处理，得到目标手势集合，所述目标手势集合包括开始状态集合和结束状态集合。3.根据权利要求2所述的方法，其特征在于，所述针对每帧视频图像，提取视频图像所对应的手势图像，包括：针对每帧视频图像，利用HSV空间边缘算法对所述视频图像进行预处理；利用预处理后的视频图像所对应手势识别概率推测所述预处理后的视频图像中手势的具体范围；利用HSV空间边缘算法，根据所述具体范围提取所述预处理后的视频图像中的手势图像；基于最小边界框算法对所述手势图像绘制边界框。4.根据权利要求3所述的方法，其特征在于，所述手势识别概率是根据参考手势库对坐标对进行评估得到，所述坐标对由所述视频图像中同一手臂上两个关节点的坐标形成。5.根据权利要求1所述的方法，其特征在于，所述根据生成式对抗网络模型对目标手势集合进行识别，得到目标手势集合所对应的文字，包括：利用生成式对抗网络模型对目标手势集合进行识别，输出动态手势图片；基于预设神经网络模型对所述动态手...

【专利技术属性】
技术研发人员：周未，程明，谢培莹，
申请(专利权)人：日晷科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人