一种视频识别方法和装置制造方法及图纸

技术编号：20825542 阅读：13 留言：0更新日期：2019-04-10 07:26

本申请提供了一种视频识别方法和装置，该方法包括：将包含第一内容的第一视频的第一特征信息输入到第一模型，计算得到第三特征信息，以及将包含第二内容的第二视频的第二特征信息输入到第二模型，计算得到第四特征信息，其中，所述第一内容与所述第二内容属于同一类别；基于第三特征信息和/或第四特征信息，计算或更新所述第一模型中的第一参数；基于所述第一参数，确定所述第一内容在所述第一视频中的位置。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频识别方法和装置
本申请涉及数据处理
，具体而言，涉及一种视频识别方法和装置。
技术介绍
目前，随着视频数据的爆炸性增长，针对海量视频数据进行处理并提取视频内容中的有效信息成为目前的研究热点。视频识别能够利用视频信息(如:视觉信息、听觉信息、动作信息等)对视频进行处理和分析，判断、识别或定位出视频中出现的内容(如：动作、事件等)，进而在海量视频数据中获取有效信息。视频识别的应用非常广泛，例如：进行智能监控、视频数据管理等。视频内容的定位属于视频识别的范畴，能够识别视频所包含的内容所处的位置(即时间点或时间段)。由于视频中的内容(如：体育运动等)往往比较复杂，定位视频中不同内容所出的位置更为复杂，现有的处理模型的准确度难以满足应用的需要，为了满足准确度，通常需要人工查看视频，将视频中包含动作的视频片段进行标注，以完成视频内容的定位。但是，在实际应用中，无论是现有处理模型的训练、识别定位，还是通过手动标注的方式，都存在效率比较低，消耗时间长的问题，导致付出的代价比较大，难以满足大规模视频数据识别的需要。
技术实现思路
有鉴于此，本申请的目的在于提供一种视频识别方法和装置，用于解决现有技术中对视频中内容定位的准确率低、效率低的问题。第一方面，本申请实施例提供了一种视频识别方法，该方法包括：将包含第一内容的第一视频的第一特征信息输入到第一模型，计算得到第三特征信息，以及将包含第二内容的第二视频的第二特征信息输入到第二模型，计算得到第四特征信息，其中，所述第一内容与所述第二内容属于同一类别；基于第三特征信息和/或第四特征信息，计算或更新所述第一模型中的第一参...

【技术保护点】
1.一种视频识别方法，其特征在于，该方法包括：将包含第一内容的第一视频的第一特征信息输入到第一模型，计算得到第三特征信息，以及将包含第二内容的第二视频的第二特征信息输入到第二模型，计算得到第四特征信息，其中，所述第一内容与所述第二内容属于同一类别；基于第三特征信息和/或第四特征信息，计算或更新所述第一模型中的第一参数；基于所述第一参数，确定所述第一内容在所述第一视频中的位置。

【技术特征摘要】
1.一种视频识别方法，其特征在于，该方法包括：将包含第一内容的第一视频的第一特征信息输入到第一模型，计算得到第三特征信息，以及将包含第二内容的第二视频的第二特征信息输入到第二模型，计算得到第四特征信息，其中，所述第一内容与所述第二内容属于同一类别；基于第三特征信息和/或第四特征信息，计算或更新所述第一模型中的第一参数；基于所述第一参数，确定所述第一内容在所述第一视频中的位置。2.如权利要求1所述的方法，其特征在于，所述第一特征信息由所述第一视频的视频帧特征信息和视频光流特征信息计算得到。3.如权利要求1所述的方法，其特征在于，所述第一模型包括第一神经网络模型以及第一自注意力机制模型，以及所述第一参数为所述第一自注意力机制模型的权重向量；和/或，所述第二模型包括第二神经网络模型以及第二自注意力机制模型。4.如权利要求3所述的方法，其特征在于，所述方法还包括：基于第三特征信息和/或第四特征信息，计算或更新所述第一模型中的第二参数，所述第二参数为所述第一神经网络模型中的模型参数。5.如权利要求3所述的方法，其特征在于，所述将包含第一内容的第一视频的第一特征信息输入到第一模型，计算得到第三特征信息，包括：由所述第一神经网络模型对所述第一特征信息进行连接处理后，基于所述第一自注意力机制模型，计算得到所述第三特征信息；和/或所述将包含第二内容的第二视频的第二特征信息输入到第二模型，计算得到第四特征信息，包括：由所述第二神经网络模型对所述第二特征信息进行连接处理后，基于所述第二自注意力机制模型，计算得到所述第四特征信息。...

【专利技术属性】
技术研发人员：石海超，李长升，段立新，栾琛琳，夏虎，
申请(专利权)人：国信优易数据有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人