基于距离值的通话通道构建方法、装置和计算机设备制造方法及图纸

技术编号:24093314 阅读:24 留言:0更新日期:2020-05-09 09:04
本申请揭示了一种基于距离值的通话通道构建方法、装置、计算机设备和存储介质,所述方法包括:获取谈话视频;从所述谈话视频中提取出所述第一对象的面部图像为有兴趣表情的多个视频片段,并将所述多个视频片段组成视频片段集;采集所述视频片段集中所述谈话对象的语音内容与语音特征,并映射为第一向量;采集视频片段集中所述谈话对象的形体特征,并映射为第二向量;将第一向量与所述第二向量组合为综合向量;计算综合向量与预设的参照向量之间的距离值;若所述距离值大于距离阈值,则构建通话通道,所述通话通道一端连接所述第一对象对应的终端,另一端连接所述第二对象对应的终端。从而提高了对象匹配并构建通话通道的准确性。

Construction method, device and computer equipment of call channel based on distance value

【技术实现步骤摘要】
基于距离值的通话通道构建方法、装置和计算机设备
本申请涉及到计算机领域,特别是涉及到一种基于距离值的通话通道构建方法、装置、计算机设备和存储介质。
技术介绍
对象匹配的判断方法可用于当今社会中的各个领域,例如社交领域中,若能准确判断出两个对象之间是否匹配,就能提高人们的互动交流效率;在研发领域中,若能准确判断两个工程师之间是否匹配,就能有效构建强有力的研发小组,提高研发效率减少磨合成本;在保险领域中,若能准确判断出续保客户与工作人员是否匹配,就能提高续保率同时减少成本浪费。但是,传统技术一般是基于人的主观意识来认定两个对象是否匹配,但没有自动地有效识别对象间是否匹配,并在匹配后为匹配的对象构建通话通道的技术方案。因此传统技术的基于对象匹配并构建通话通道的方案准确性不足。
技术实现思路
本申请的主要目的为提供一种基于距离值的通话通道构建方法、装置、计算机设备和存储介质,旨在提高对象匹配的准确度。为了实现上述专利技术目的,本申请提出一种基于距离值的通话通道构建方法,包括以下步骤:获取谈话视频,所述谈话视频为第一对象与谈话对象的交谈视频;采集所述谈话视频中所述第一对象的面部图像,并将所述面部图像输入基于神经网络模型的表情识别模型中进行处理,从而将所述面部图像识别为不同的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情;从所述谈话视频中提取出所述第一对象的面部图像为有兴趣表情的多个视频片段,并将所述多个视频片段组成视频片段集;采集所述视频片段集中所述谈话对象的语音内容与语音特征,并根据预设的第一向量映射方法,将所述语音内容与语音特征映射为高维虚拟空间中的第一向量;采集所述视频片段集中所述谈话对象的形体特征,并根据预设的第二向量映射方法,将所述形体特征映射为高维虚拟空间中的第二向量;根据预设的向量组合方法,将所述第一向量与所述第二向量组合为综合向量;根据预设的距离计算方法,计算所述综合向量与预设的参照向量之间的距离值,并判断所述距离值是否大于预设的距离阈值,其中所述预设的参照向量与预设的第二对象对应;若所述距离值大于预设的距离阈值,则构建通话通道,所述通话通道一端连接所述第一对象对应的终端,另一端连接所述第二对象对应的终端。进一步地,所述第一对象的面部图像为侧脸图像,所述将所述面部图像输入基于神经网络模型的表情识别模型中进行处理,从而将所述面部图像识别为不同的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情的步骤之前,包括:获取预设数量的样本数据,并将所述样本数据划分成训练集和测试集;其中,所述样本数据包括人类的侧脸图像,以及与所述侧脸图像对应的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情;将训练集的样本数据输入到预设的神经网络模型中进行训练;其中,训练的过程中采用随机梯度下降法,从而得到初始模型;利用所述测试集的样本数据验证所述初始模型,并判断所述初始模型是否验证通过;若所述初始模型验证通过,则将所述初始模型记为表情识别模型。进一步地,所述谈话视频是通过全景镜头获得的视频,所述第一对象的面部图像为正脸图像,所述将所述面部图像输入基于神经网络模型的表情识别模型中进行处理,从而将所述面部图像识别为不同的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情的步骤之前,包括:获取预设数量的样本数据,并将所述样本数据划分成训练集和测试集;其中,所述样本数据包括通过全景镜头采集的人类的正脸图像,以及与所述正脸图像对应的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情;将训练集的样本数据输入到预设的神经网络模型中进行训练;其中,训练的过程中采用随机梯度下降法,从而得到初始模型;利用所述测试集的样本数据验证所述初始模型,并判断所述初始模型是否验证通过;若所述初始模型验证通过,则将所述初始模型记为表情识别模型。进一步地,所述语音特征至少包括语速、语调和重音位置,所述根据预设的第一向量映射方法,将所述语音内容与语音特征映射为高维虚拟空间中的第一向量的步骤,包括:根据预设的语音识别技术,将所述语音内容识别为语音文本;对所述语音文本进行同义词替换处理,从而得到中间文本,并获取所述中间文本中词频数值大于预设词频阈值的多个指定关键词;根据预设的关键词与分向量数值的对应关系,获取与所述指定关键词对应的分向量数值,从而将所述语音内容映射为关键词向量,其中所述关键词向量的分向量的数值为所述指定关键词对应的分向量数值;根据预设的语速、语调和重音位置与分向量数值的对应关系,获取所述语速、语调和重音位置对应的分向量数值,从而将所述语音特征映射为语音向量,其中所述语音向量的分向量的数值为所述语速、语调和重音位置对应的分向量数值;生成高维虚拟空间中的第一向量,其中所述第一向量由所述关键词向量和所述语音向量顺序连接而构成。进一步地,所述根据预设的距离计算方法,计算所述综合向量与预设的参照向量之间的距离值,并判断所述距离值是否大于预设的距离阈值,其中所述预设的参照向量与预设的第二对象对应的步骤之前,包括:获取所述第二对象的常用词汇和语音特征,并将所述第二对象的常用词汇和语音特征映射为高维虚拟空间中的第三向量;获取所述第二对象的形体特征,并将所述第二对象的形体特征映射为高维虚拟空间中的第四向量;将所述第三向量与第四向量组合为所述参照向量。进一步地,所述根据预设的距离计算方法,计算所述综合向量与预设的参照向量之间的距离值的步骤,包括:根据公式:计算所述综合向量与预设的参照向量之间的距离值DIS,其中A为所述综合向量,B为所述参照向量,Ai为所述综合向量中第i个分向量的数值,Bi为所述参照向量中第i个分向量的数值,所述综合向量和所述参照向量均具有n个分向量。进一步地,所述参照向量有多个,所述根据预设的距离计算方法,计算所述综合向量与预设的参照向量之间的距离值的步骤,包括:根据公式:计算出参照向量X在所述高维虚拟空间中的长度值DX,其中Xi为所述参照向量X中第i个分向量的数值,所述参照向量X具有n个分向量;根据公式:计算出综合向量A在所述高维虚拟空间中的长度值DA,其中Ai为所述综合向量A中第i个分向量的数值,所述综合向量A具有n个分向量;获取符合公式:|DA-DX|<p的参照向量,并记为最终参照向量B,其中p为预设的误差参数;根据公式:计算所述综合向量A与所述最终参照向量B之间的距离值DIS,其中Ai为所述综合向量A中第i个分向量的数值,Bi为所述最终参照向量B中第i个分向量的数值。本申请提供一种基于距离值的通话通道构建装置,包括:谈话视频获取单元,用于获取谈话视频,所述谈话视频为第一对象与谈话对象的交谈视频;面部图像识别单元,用于采集所述谈话视频中所述第一对象的面部图像,并将所述面部图像输入基于神经网络模本文档来自技高网...

【技术保护点】
1.一种基于距离值的通话通道构建方法,其特征在于,包括:/n获取谈话视频,所述谈话视频为第一对象与谈话对象的交谈视频;/n采集所述谈话视频中所述第一对象的面部图像,并将所述面部图像输入基于神经网络模型的表情识别模型中进行处理,从而将所述面部图像识别为不同的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情;/n从所述谈话视频中提取出所述第一对象的面部图像为有兴趣表情的多个视频片段,并将所述多个视频片段组成视频片段集;/n采集所述视频片段集中所述谈话对象的语音内容与语音特征,并根据预设的第一向量映射方法,将所述语音内容与语音特征映射为高维虚拟空间中的第一向量;/n采集所述视频片段集中所述谈话对象的形体特征,并根据预设的第二向量映射方法,将所述形体特征映射为高维虚拟空间中的第二向量;/n根据预设的向量组合方法,将所述第一向量与所述第二向量组合为综合向量;/n根据预设的距离计算方法,计算所述综合向量与预设的参照向量之间的距离值,并判断所述距离值是否大于预设的距离阈值,其中所述预设的参照向量与预设的第二对象对应;/n若所述距离值大于预设的距离阈值,则构建通话通道,所述通话通道一端连接所述第一对象对应的终端,另一端连接所述第二对象对应的终端。/n...

【技术特征摘要】
1.一种基于距离值的通话通道构建方法,其特征在于,包括:
获取谈话视频,所述谈话视频为第一对象与谈话对象的交谈视频;
采集所述谈话视频中所述第一对象的面部图像,并将所述面部图像输入基于神经网络模型的表情识别模型中进行处理,从而将所述面部图像识别为不同的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情;
从所述谈话视频中提取出所述第一对象的面部图像为有兴趣表情的多个视频片段,并将所述多个视频片段组成视频片段集;
采集所述视频片段集中所述谈话对象的语音内容与语音特征,并根据预设的第一向量映射方法,将所述语音内容与语音特征映射为高维虚拟空间中的第一向量;
采集所述视频片段集中所述谈话对象的形体特征,并根据预设的第二向量映射方法,将所述形体特征映射为高维虚拟空间中的第二向量;
根据预设的向量组合方法,将所述第一向量与所述第二向量组合为综合向量;
根据预设的距离计算方法,计算所述综合向量与预设的参照向量之间的距离值,并判断所述距离值是否大于预设的距离阈值,其中所述预设的参照向量与预设的第二对象对应;
若所述距离值大于预设的距离阈值,则构建通话通道,所述通话通道一端连接所述第一对象对应的终端,另一端连接所述第二对象对应的终端。


2.根据权利要求1所述的基于距离值的通话通道构建方法,其特征在于,所述第一对象的面部图像为侧脸图像,所述将所述面部图像输入基于神经网络模型的表情识别模型中进行处理,从而将所述面部图像识别为不同的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情的步骤之前,包括:
获取预设数量的样本数据,并将所述样本数据划分成训练集和测试集;其中,所述样本数据包括人类的侧脸图像,以及与所述侧脸图像对应的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情;
将训练集的样本数据输入到预设的神经网络模型中进行训练;其中,训练的过程中采用随机梯度下降法,从而得到初始模型;
利用所述测试集的样本数据验证所述初始模型,并判断所述初始模型是否验证通过;
若所述初始模型验证通过,则将所述初始模型记为表情识别模型。


3.根据权利要求1所述的基于距离值的通话通道构建方法,其特征在于,所述谈话视频是通过全景镜头获得的视频,所述第一对象的面部图像为正脸图像,所述将所述面部图像输入基于神经网络模型的表情识别模型中进行处理,从而将所述面部图像识别为不同的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情的步骤之前,包括:
获取预设数量的样本数据,并将所述样本数据划分成训练集和测试集;其中,所述样本数据包括通过全景镜头采集的人类的正脸图像,以及与所述正脸图像对应的面部表情类别,其中所述面部表情类别包括有兴趣表情和无兴趣表情;
将训练集的样本数据输入到预设的神经网络模型中进行训练;其中,训练的过程中采用随机梯度下降法,从而得到初始模型;
利用所述测试集的样本数据验证所述初始模型,并判断所述初始模型是否验证通过;
若所述初始模型验证通过,则将所述初始模型记为表情识别模型。


4.根据权利要求1所述的基于距离值的通话通道构建方法,其特征在于,所述语音特征至少包括语速、语调和重音位置,所述根据预设的第一向量映射方法,将所述语音内容与语音特征映射为高维虚拟空间中的第一向量的步骤,包括:
根据预设的语音识别技术,将所述语音内容识别为语音文本;
对所述语音文本进行同义词替换处理,从而得到中间文本,并获取所述中间文本中词频数值大于预设词频阈值的多个指定关键词;
根据预设的关键词与分向量数值的对应关系,获取与所述指定关键词对应的分向量数值,从而将所述语音内容映射为关键词向量,其中所述关键词向量的分向量的数值为所述指定关键词对应的分向量数值;
根据预设的语速、语调和重音位置与分向量数值的对应关系,获取所述语速、语调和重音位置对应的分向量数值,从而将所述语音特征映射为语音向量,其中所述语音向量的分向量的数值为所述语速、语调和重音位置对...

【专利技术属性】
技术研发人员:卢显锋
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1