【技术实现步骤摘要】
一种语义分析方法及装置、电子设备和存储介质
本公开涉及人工智能
,尤其涉及一种语义分析方法及装置、电子设备和存储介质。
技术介绍
在商务洽谈、技术讨论、主题演讲等用户沟通场景中,为了提高沟通效率,可以对用户脸部表情及谈话内容等信息进行分析。然而,目前的分析是基于用户的主观判断依据来进行分析,无法得到精确的分析结果,分析结果不精确会增加用户沟通的障碍和歧义。
技术实现思路
本公开提出了一种语义分析处理的技术方案。根据本公开的一方面,提供了一种语义分析方法,所述方法包括:获取图像帧及与所述图像帧对应的语音帧;从所述图像帧中识别出人脸区域;根据用于识别分析的神经网络,对所述人脸区域及所述语音帧中提取的语音信息进行识别分析,得到分析结果。采用本公开,由于识别分析的过程可以基于神经网络,而应用神经网络予以分析可以根据大量先验结论和大量的训练样本得到客观的分析结果,因此,基于识别分析的神经网络对人脸区域及语音帧中提取的语音信息进行识别分析,可以提高分析结果的精确度。可能的实现方式 ...
【技术保护点】
1.一种语义分析方法,其特征在于,所述方法包括:/n获取图像帧及与所述图像帧对应的语音帧;/n从所述图像帧中识别出人脸区域;/n根据用于识别分析的神经网络,对所述人脸区域及所述语音帧中提取的语音信息进行识别分析,得到分析结果。/n
【技术特征摘要】
1.一种语义分析方法,其特征在于,所述方法包括:
获取图像帧及与所述图像帧对应的语音帧;
从所述图像帧中识别出人脸区域;
根据用于识别分析的神经网络,对所述人脸区域及所述语音帧中提取的语音信息进行识别分析,得到分析结果。
2.根据权利要求1所述的方法,其特征在于,所述获取图像帧及与所述图像帧对应的语音帧之前,所述方法还包括:
采集多个视频帧;
从所述多个视频帧的同一待处理视频帧中,分离出所述图像帧和所述语音帧。
3.根据权利要求2所述的方法,其特征在于,所述多个视频帧为实时采集的视频帧的情况下,所述从所述多个视频帧的同一视频帧中,分离出所述图像帧和所述语音帧之前,所述方法还包括:
对所述实时采集的视频帧进行降噪处理,将降噪处理后的视频帧作为所述待处理视频帧。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述从所述图像帧中识别出人脸区域,包括:
根据所述图像帧中多个特征向量的聚类处理,得到聚类结果;
根据所述聚类结果,识别出所述人脸区域。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据用于识别分析的神经网络包括:用于人脸表情识别的第一识别网络、用于语音识别的第二识别网络及用于语义分析的分析网络;
所述第一识别网络、所述第二识别网络及所述分析网络,分别经过各自训练样本的神经网络训练所得到。
6.根据权利要求5所述的方法,其特征在于,所述根据...
【专利技术属性】
技术研发人员:王志豪,
申请(专利权)人:上海商汤智能科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。