智能化用户识别方法、装置及计算机可读存储介质制造方法及图纸

技术编号：24799897 阅读：20 留言：0更新日期：2020-07-07 21:06

本发明专利技术涉及人工智能技术，揭露了一种智能化用户识别方法，包括：获取用户的视频数据，从所述视频数据中提取出图像数据和声音数据，根据所述图像数据获取第一身份信息，根据所述声音数据获取第二身份信息，将所述第一身份信息和所述第二身份信息进行比较，当所述第一身份信息与所述第二身份信息一致时，确定所述用户的身份信息，并将所述用户的视频数据与所述用户的身份信息进行关联存储，实现用户识别。本发明专利技术还提出一种智能化用户识别装置以及一种计算机可读存储介质。本发明专利技术可以准确高效的用户识别功能。

全部详细技术资料下载

【技术实现步骤摘要】
智能化用户识别方法、装置及计算机可读存储介质
本专利技术涉及人工智能
，尤其涉及一种基于人脸识别和声纹识别的智能化用户识别方法、装置及计算机可读存储介质。
技术介绍
随着经济水平的提高和网络时代的发展，通过一个手机、电脑、平板等移动设备或电脑终端，即可将心仪的物品、美食等送到身边，甚至还可以随时随地叫车或者叫代驾。这种网络订单给商家以及用户都带来了方便，但是也会存在一些隐患，如订单的双方彼此不相识，无法识别对方身份。例如，快递在投递的过程中，快递员通常不能对收件人的身份信息进行识别。即使通过查看证件等方式进行了身份信息的识别，在快递签收成功后，如果出现客户投诉未收到快递的情况，此时没有有力的影像资料证明快递签收环节的情况，快递公司还是可能需要承担责任。
技术实现思路
本专利技术提供一种智能化用户识别方法、装置及计算机可读存储介质，其主要目的对用户身份进行智能识别。为实现上述目的，本专利技术提供的一种智能化用户识别方法，包括：步骤A：获取用户的视频数据，从所述视频数据中提取出图像数据和...

【技术保护点】
1.一种智能化用户识别方法，其特征在于，所述方法包括：/n步骤A：获取用户的视频数据，从所述视频数据中提取出图像数据和声音数据；/n步骤B：对所述图像数据进行人脸面部特征检测，得到人脸面部特征数据，并将所述人脸面部特征数据进行关键特征点提取，得到人脸面部关键点特征数据；/n步骤C：将所述人脸面部关键点特征数据与预先构建的用户人脸数据库进行人脸识别，得到所述人脸面部关键点特征数据对应的第一身份信息；/n步骤D：将所述声音数据与预先构建的用户声音数据库进行声音匹配，得到所述声音数据对应的第二身份信息；/n步骤E：将所述第一身份信息和所述第二身份信息进行比较，若所述第一身份信息与所述第二身份信息不一...

【技术特征摘要】
1.一种智能化用户识别方法，其特征在于，所述方法包括：
步骤A：获取用户的视频数据，从所述视频数据中提取出图像数据和声音数据；
步骤B：对所述图像数据进行人脸面部特征检测，得到人脸面部特征数据，并将所述人脸面部特征数据进行关键特征点提取，得到人脸面部关键点特征数据；
步骤C：将所述人脸面部关键点特征数据与预先构建的用户人脸数据库进行人脸识别，得到所述人脸面部关键点特征数据对应的第一身份信息；
步骤D：将所述声音数据与预先构建的用户声音数据库进行声音匹配，得到所述声音数据对应的第二身份信息；
步骤E：将所述第一身份信息和所述第二身份信息进行比较，若所述第一身份信息与所述第二身份信息不一致，则返回上述步骤A，若所述第一身份信息和所述第二身份信息一致，则确定所述用户的身份信息，并将所述用户的视频数据与所述用户的身份信息进行关联存储，实现用户识别。

2.如权利要求1所述的智能化用户识别方法，其特征在于，所述对所述图像数据进行人脸面部特征检测，得到人脸面部特征数据，包括：
预构建平面直角坐标系，将所述图像数据映射到所述平面直角坐标系中得到与所述图像数据对应的平面像素坐标集；
遍历所述平面像素坐标集内的每个平面像素坐标，将横坐标相同的平面像素坐标汇集得到横坐标像素坐标集；
将竖坐标相同的平面像素坐标汇集得到竖坐标像素坐标集；
分别计算所述横坐标像素坐标集内每个横坐标像素坐标的像素差值，及所述竖坐标像素坐标集内每个竖坐标像素坐标的像素差值；
判断所述像素差值与预设差值的大小，保留所述像素差值大于所述预设差值的平面像素坐标，得到所述人脸面部特征数据。

3.如权利要求1所述的智能化用户识别方法，其特征在于，所述将所述人脸面部特征数据进行关键特征点提取，得到人脸面部关键点特征数据，包括：
利用如下关键特征点提取公式计算所述人脸面部关键点特征数据：

其中，J表示所述人脸面部关键点特征数据，i表示所述图像数据中图像的数量，Ai表示所述图像数据，k表示所述图像数据的像素点数量，w表示像素点的近邻区域相关特征向量，wt表示近邻区域相关特征向量的转换向量，tr(.)表示矩阵求迹运算符，β表示预设参数，Xip表示人脸面部特征数据，Xi表示像素点的像素值，表示Xi的转置矩阵。

4.如权利要求1所述的智能化用户识别方法，其特征在于，所述将所述声音数据与预先构建的用户声音数据库进行声音匹配，包括：
将所述声音数据作为条件值构建得到似然概率；
根据所述似然概率和所述用户声音数据库内的声音数据构建得到最大化似然函数；
求解所述最大化似然函数得到所述最大化似然函数的函数值，根据所述函数值得到所述声音数据对应的第二身份信息。

5.如权利要求4所述的智能化用户识别方法，其特征在于，所述将所述声音数据作为条件值，构建得到似然概率的方法如下：

其中，P(w)为所述似然概率，s为所述声音数据的波长，w1，wn-2，wn表示所述声音数据的频度与响度的结合值；
所述最大化似然函数为：
Wbest＝argmax{P(w|Y)P(w)/P(Y)}
其中，Wbest为所述最大化似然函数的函数值，Y为所述用户声音数据库内的声音数据，P(Y)表示所述用户声音数据库内声音数据的频度与响度的结合值的概率值，P(...

【专利技术属性】
技术研发人员：熊玮，
申请(专利权)人：深圳壹账通智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人