The invention discloses a merchant collection system and method based on audio-video combination, which displays randomly extracted words to users, collects face information when users read the extracted words aloud, recognizes lip movement information of the face information, and collects voice information when users read the extracted words aloud, and integrates the voice information and the extracted words. The lip movement information is used for voiceprint recognition, and the audio-video fusion voiceprint information is obtained; then, the user is authenticated according to the face information and the audio-video fusion voiceprint information; and the voice information is compared with the extracted words displayed to determine whether it matches or not; finally, the user deducts money after completing the authentication and matching of extracted words; In the system, only the extracted words displayed randomly by the reading system can be paid according to the face information and audio-video fusion voiceprint information extracted during the reading process. Users do not need to operate other devices, and have a better experience.
【技术实现步骤摘要】
一种基于音视频结合的商户收款系统及方法
本专利技术涉及支付验证
,特别是一种基于音视频结合的商户收款系统及对应的方法。
技术介绍
目前,在人脸支付的时候,为了排除用户在消费时用他人的照片进行支付,有两种辅助检测方式:第一种是需要人体配合进行活体检测,这时,会需要用户配合眨眨眼、摇摇头之类的,用户体验不好;第二种情况是硬件支持活体检测,不需要用户配合,但是这样做的问题是,用户稍微看一眼支付镜头,可能就完成支付了,没有和用户互动,可能会在用户不知情的情况下完成支付。
技术实现思路
本专利技术为解决上述问题,提供了一种基于音视频结合的商户收款系统及方法,用户只需朗读系统随机展示的提取词,即可根据用户朗读过程中提取的人脸信息和音视频融合声纹信息进行支付验证,用户无需操作其他设备,体验度更好。为实现上述目的,本专利技术采用的技术方案为:一种基于音视频结合的商户收款系统,其包括:提取词展示模块,用于向用户展示随机抽取的提取词;摄像模块,用于采集用户在朗读所述提取词时的人脸信息;图像识别模块,用于对所述人脸信息进行唇部运动信息的识别;语音采集模块,用于采集用户在朗读所述提取词时的语音信息;音视频融合声纹识别模块,其通过融合所述语音信息和所述唇部运动信息以提取用户的增强语音,并对所述增强语音进行声纹识别,得到音视频融合声纹信息;身份验证模块,用于根据所述人脸信息和所述音视频融合声纹信息对用户进行身份验证;提取词验证模块,用于将所述语音信息与所展示的提取词进行对照,判断是否匹配;支付模块,用于在完成身份验证和提取词匹配后进行扣款。优选的,所述提取词展示模块中,所述提取词采 ...
【技术保护点】
1.一种基于音视频结合的商户收款系统,其特征在于,包括:提取词展示模块,用于向用户展示随机抽取的提取词;摄像模块,用于采集用户在朗读所述提取词时的人脸信息;图像识别模块,用于对所述人脸信息进行唇部运动信息的识别;语音采集模块,用于采集用户在朗读所述提取词时的语音信息;音视频融合声纹识别模块,其通过融合所述语音信息和所述唇部运动信息以提取用户的增强语音,并对所述增强语音进行声纹识别,得到音视频融合声纹信息;身份验证模块,用于根据所述人脸信息和所述音视频融合声纹信息对用户进行身份验证;提取词验证模块,用于将所述语音信息与所展示的提取词进行对照,判断是否匹配;支付模块,用于在完成身份验证和提取词匹配后进行扣款。
【技术特征摘要】
1.一种基于音视频结合的商户收款系统,其特征在于,包括:提取词展示模块,用于向用户展示随机抽取的提取词;摄像模块,用于采集用户在朗读所述提取词时的人脸信息;图像识别模块,用于对所述人脸信息进行唇部运动信息的识别;语音采集模块,用于采集用户在朗读所述提取词时的语音信息;音视频融合声纹识别模块,其通过融合所述语音信息和所述唇部运动信息以提取用户的增强语音,并对所述增强语音进行声纹识别,得到音视频融合声纹信息;身份验证模块,用于根据所述人脸信息和所述音视频融合声纹信息对用户进行身份验证;提取词验证模块,用于将所述语音信息与所展示的提取词进行对照,判断是否匹配;支付模块,用于在完成身份验证和提取词匹配后进行扣款。2.根据权利要求1所述的一种基于音视频结合的商户收款系统,其特征在于:所述提取词展示模块中,所述提取词采用一串动态数字或者一组字母。3.根据权利要求1所述的一种基于音视频结合的商户收款系统,其特征在于:所述摄像模块采用三维摄像头,并采集用户的三维人脸信息,所述身份验证模块将用户的三维人脸信息与服务器的预存身份验证信息进行匹配。4.根据权利要求1所述的一种基于音视频结合的商户收款系统,其特征在于:还包括音质评估模块,用于对所述语音信息进行语音质量的评估;当所述语音信息的信噪比大于预设阈值时,则评估结果为语音质量好;当所述语音信息的信噪比小于或等于预设阈值时,则评估结果为语音质量差;并且,当语音质量好时,直接根据所述语音信息进行声纹识别;当语音质量差时,则通过所述音视频融合声纹识别模块对所述语音信息和所述唇部运动信息进行音视频融合声纹识别,得到音视频融合声纹信息。5.根据权利要求1所述的一种基于音视频结合的商户收款系统,其特征在于:所述的音视频融合声纹识别模块进行获取音视频融合声纹信息,进一步包括:提取所述语音信息的声学特征;使用卷积神经网络从所述声学特征中提取语音特征;使用卷积神经网络从所...
【专利技术属性】
技术研发人员:叶志坚,李稀敏,肖龙源,蔡振华,刘晓葳,谭玉坤,
申请(专利权)人:厦门快商通信息技术有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。