一种通话动作识别方法、装置、设备以及存储介质制造方法及图纸

技术编号：35062202 阅读：20 留言：0更新日期：2022-09-28 11:17

本公开提供了一种通话动作识别方法、装置、设备以及存储介质，涉及人工智能技术领域，尤其涉及图像处理、深度学习和计算机视觉等技术领域。具体实现方案为：对待检测图像进行区域检测，得到人物所在的目标图像区域；将所述目标图像区域与运动轨迹信息进行匹配，得到与所述目标图像区域相匹配的目标运动轨迹，其中，运动轨迹的信息为：根据同一人物在图像中的区域确定的描述该人物运动轨迹的信息；对所述目标图像区域进行通话动作识别，得到识别结果；在所述识别结果表征识别到通话动作的情况下，更新所述目标运动轨迹对应的识别到通话动作的次数；根据更新后的次数确定是否真实存在通话动作。应用上述方案能够提高通话动作识别的准确性。的准确性。的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种通话动作识别方法、装置、设备以及存储介质

[0001]本公开涉及人工智能
，尤其涉及图像处理、深度学习和计算机视觉等

技术介绍

[0002]在生化企业等工作场景中，若存在人物使用手机通话的情况，可能会导致发生火灾、影响工作场景内的电子正常运行等。因此，需要对工作场景中人物的通话动作进行识别，以便及时发现工作场景中人物的通话行为，并进行制止。

技术实现思路

[0003]本公开提供了一种通话动作识别方法、装置、设备以及存储介质。
[0004]本公开的一方面，提供了一种通话动作识别方法，包括：
[0005]对待检测图像进行区域检测，得到人物所在的目标图像区域；
[0006]将所述目标图像区域与运动轨迹信息进行匹配，得到与所述目标图像区域相匹配的目标运动轨迹，其中，运动轨迹信息为：根据同一人物在图像中的区域确定的描述该人物运动轨迹的信息；
[0007]对所述目标图像区域进行通话动作识别，得到识别结果；
[0008]在所述识别结果表征识别到通话动作的情况下，更新所述目标运动轨迹对应的识别到通话动作的次数；
[0009]根据更新后的次数确定是否真实存在通话动作。
[0010]本公开的另一方面，提供了一种通话动作识别装置，包括：
[0011]图像区域获得模块，用于对待检测图像进行区域检测，得到人物所在的目标图像区域；
[0012]运动轨迹获得模块，用于将所述目标图像区域与运动轨迹的信息进行匹配，得到与所述目标图像区域相匹配的...

【技术保护点】

【技术特征摘要】
1.一种通话动作识别方法，包括：对待检测图像进行区域检测，得到人物所在的目标图像区域；将所述目标图像区域与运动轨迹信息进行匹配，得到与所述目标图像区域相匹配的目标运动轨迹，其中，运动轨迹信息为：根据同一人物在图像中的区域确定的描述该人物运动轨迹的信息；对所述目标图像区域进行通话动作识别，得到识别结果；在所述识别结果表征识别到通话动作的情况下，更新所述目标运动轨迹对应的识别到通话动作的次数；根据更新后的次数确定是否真实存在通话动作。2.根据权利要求1所述的方法，其中，所述在所述识别结果表征识别到通话动作的情况下，更新所述目标运动轨迹对应的识别到通话动作的次数，包括：在所述识别结果表征识别到通话动作的情况下，对所述待检测图像进行图像质量检测，得到用于描述所述待检测图像质量的质量表征值；若所述质量表征值大于预设的表征阈值，更新所述目标运动轨迹对应的识别到通话动作的次数。3.根据权利要求1或2所述的方法，其中，所述将所述目标图像区域与运动轨迹信息进行匹配，得到与所述目标图像区域相匹配的目标运动轨迹，包括：按照以下方式将所述目标图像区域分别与各条运动轨迹信息进行匹配：根据运动轨迹对应的状态预测参数，预测运动轨迹所对应人物的运动状态参数；根据所述运动状态参数，确定运动轨迹所对应人物在所述待检测图像中出现的候选图像区域；提取所述目标图像区域的区域特征；若所述区域特征与运动轨迹所对应人物的人物特征相匹配、且所述目标图像区域的位置与所确定候选图像区域的位置相匹配，则确定运动轨迹为与所述目标图像区域相匹配的目标运动轨迹。4.根据权利要求3所述的方法，在确定所述目标运动轨迹失败的情况下，还包括：根据所述目标图像区域与各运动轨迹对应的候选图像区域之间的交并比，从运动轨迹中确定与所述目标运动轨迹。5.根据权利要求3所述的方法，在得到所述目标运动轨迹之后，还包括：根据所述目标图像区域更新所述目标运动轨迹对应的状态预测参数。6.根据权利要求1或2所述的方法，其中，所述将所述目标图像区域与运动轨迹的信息进行匹配，得到与所述目标图像区域相匹配的目标运动轨迹，包括：从运动轨迹中，确定连续最近预设数量次与图像区域匹配成功的可用运动轨迹；将所述目标图像区域与可用运动轨迹的信息进行匹配，得到与所述目标图像区域相匹配的目标运动轨迹。7.根据权利要求1或2所述的方法，其中，所述根据更新后的次数确定是否真实存在通话动作，包括：根据更新后的次数判断最近连续采集的第一数量帧图像中被识别到通话动作的次数是否得到了预设次数；
若为是，判定真实存在通话动作；否则，判定不真实存在通话动作。8.一种通话动作识别装置，包括：图像区域获得模块，用于对待检测图像进行区域检测，得到人物所在的目标图像区域；运动轨迹获得模块，用于将所述目标图像区域与运动轨迹的信息进行匹配，得到与所述目标图像区域相匹配的目标运动轨迹，其中，运动轨迹的信息为：根据同一人物在图像中的区域确...

【专利技术属性】
技术研发人员：姜楠，聂磊，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人