基于注意力机制的视频眼震图眼震类型识别方法及系统技术方案

技术编号：36432228 阅读：21 留言：0更新日期：2023-01-20 22:44

本发明专利技术涉及一种基于注意力机制的视频眼震图眼震类型识别方法及系统，所述的方法包括：所述的方法包括以下步骤：步骤S1、读取输入的视频眼震图；步骤S2、对步骤S1得到的视频眼震图进行预处理，得到预处后的视频眼震图数据；步骤S3、根据引入了结合注意力机制的改进的MoblieNetV2算法对步骤S2中预处理后的视频眼震图数据进行特征提取；步骤S4、根据步骤S3提取的特征预测出眼震类型。与现有技术相比，本发明专利技术具有提升特征提取能力、提升眼震类型分类准确率、医学临床应用上价值高等优点。医学临床应用上价值高等优点。医学临床应用上价值高等优点。

全部详细技术资料下载

【技术实现步骤摘要】
基于注意力机制的视频眼震图眼震类型识别方法及系统

[0001]本专利技术涉及医疗诊断
，尤其是涉及一种基于注意力机制的视频眼震图眼震类型识别方法及系统。

技术介绍

[0002]良性阵发性位置性眩晕(BPPV)是眩晕症的一种，在临床上比较常见。BPPV是指在头部运动中，到某一个或者某几个特定位置时，会出现短暂的、阵发性的眩晕，严重时候可能会导致恶心呕吐。长期的未经控制的BPPV会对患者的日常生活造成严重的影响，同时BPPV也是引发老年人摔倒的原因之一。大量研究表明，BPPV的发生与前庭系统的变化有关，而眼球运动和前庭有着紧密的联系，因此，通过观察眼球的运动，就可以对BPPV做出诊断。根据眼球的不同的动作轨迹和方向，可以划分出不同的眼震模式，基础的有水平、垂直、对角、旋转等。在实际的临床诊断中，眼震模型可能是多种复合，例如水平和旋转等。
[0003]对于眼球运动的观察，可以直接在肉眼下完成，也可以借助各种仪器。常见的辅助检查技术是眼震电图(elector
‑
nystagmography，ENG)和视频眼震图(Video Nystagmography，VNG)。由于ENG对人体影响较大且容易受到干扰，在临床应用上，VNG逐渐成为主流。医生通过分析VNG视频分析视频中的眼震的方向，频率，强度以及持续时间，就可以判断出患者的BPPV所属的类型。
[0004]随着人工智能的发展，对比人工诊断方式，利用计算机对VNG视频进行诊断，效率更高且更加准确，不容易受到外界的干扰。近年来，深度学习算法...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的视频眼震图眼震类型识别方法，其特征在于，所述的方法包括以下步骤：步骤S1、读取输入的视频眼震图；步骤S2、对步骤S1得到的视频眼震图进行预处理，得到预处后的视频眼震图数据；步骤S3、采用改进的MoblieNetV2算法对步骤S2中预处理后的视频眼震图数据进行特征提取，其中改进的MoblieNetV2算法引入了结合注意力机制；步骤S4、根据步骤S3提取的特征预测出眼震类型。2.根据权利要求1所述的一种基于注意力机制的视频眼震图眼震类型识别方法，其特征在于，所述的视频眼震图为标准音频视频交错格式或动态图像专家组格式。3.根据权利要求1所述的一种基于注意力机制的视频眼震图眼震类型识别方法，其特征在于，所述的预处理方法具体为：将视频眼震图转换为灰度，利用霍夫圆变换算法获取视频眼震图中的瞳孔中心位置，若瞳孔半径大于35px，则将视频裁剪为六倍瞳孔半径的大小；若瞳孔半径小于35px，则将视频裁剪为224px*224px的大小，之后将视频按顺序解帧。4.根据权利要求1所述的一种基于注意力机制的视频眼震图眼震类型识别方法，其特征在于，所述的结合注意力包括：时空特征注意力机制，用于激励时空特征；通道注意力机制，用于表征时间信息上的通道特征；运动注意力机制，用于利用相邻帧间的特征差异构建运动特征。5.根据权利要求1所述的一种基于注意力机制的视频眼震图眼震类型识别方法，其特征在于，所述的改进的MoblieNetV2算法具体为：卷积层采用3D卷积的方法，在瓶颈层加入通道混洗机制，在后续单元加入BN层，激活函数为Mish函数。6.一种实现如权利要求1所述的基于注意力机制的视频眼...

【专利技术属性】
技术研发人员：邱禧荷，史少杰，王海玲，高永彬，方志军，李文妍，吴沛霞，
申请(专利权)人：上海工程技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人