【技术实现步骤摘要】
柜台语音监控方法、装置、计算机设备及存储介质
本专利技术涉及计算机领域,尤其涉及一种柜台语音监控方法、装置、计算机设备及存储介质。
技术介绍
目前,柜台人员主要负责对外业务处理,当前通过人工柜台办理业务时通常对柜台人员进行视频监控。当柜台人员出现语言粗鲁、业务处理不及时或态度恶劣等问题时,通过视频监控无法了解发生的事情,可能会给公司带来损失,影响公司形象。从而未对柜台人员进行实时语音监控且未对语音数据中敏感词进行监控,会导致对意外事件处理不及时的问题。
技术实现思路
本专利技术实施例提供一种柜台语音监控方法、装置、计算机设备及存储介质,以解决对柜台人员不能实时语音监控而导致处理不及时的问题。一种柜台语音监控方法,包括:通过麦克风阵列采集原始语音数据,每一所述原始语音数据对应一麦克风阵列标识和采集时间;对所述原始语音数据进行数据预处理,获取目标语音数据;采用MFCC算法对所述目标语音数据进行声纹特征提取,获取目标声纹特征;采用预先训练的语音识别模型对所述目标声纹特征进行识别,获取与所述目标声纹特征对应的目标文字数据;采用敏感词识别模型对所述目标文字数据进行识别,获取识别 ...
【技术保护点】
1.一种柜台语音监控方法,其特征在于,包括:通过麦克风阵列采集原始语音数据,每一所述原始语音数据对应一麦克风阵列标识和采集时间;对所述原始语音数据进行数据预处理,获取目标语音数据;采用MFCC算法对所述目标语音数据进行声纹特征提取,获取目标声纹特征;采用预先训练的语音识别模型对所述目标声纹特征进行识别,获取与所述目标声纹特征对应的目标文字数据;采用敏感词识别模型对所述目标文字数据进行识别,获取识别结果;若所述识别结果为所述目标文字数据包含敏感词,则在所述目标文字数据中对所述敏感词进行突出处理,获取敏感文字数据;基于所述麦克风阵列标识和所述采集时间查询值班安排表,获取对应的柜 ...
【技术特征摘要】
1.一种柜台语音监控方法,其特征在于,包括:通过麦克风阵列采集原始语音数据,每一所述原始语音数据对应一麦克风阵列标识和采集时间;对所述原始语音数据进行数据预处理,获取目标语音数据;采用MFCC算法对所述目标语音数据进行声纹特征提取,获取目标声纹特征;采用预先训练的语音识别模型对所述目标声纹特征进行识别,获取与所述目标声纹特征对应的目标文字数据;采用敏感词识别模型对所述目标文字数据进行识别,获取识别结果;若所述识别结果为所述目标文字数据包含敏感词,则在所述目标文字数据中对所述敏感词进行突出处理,获取敏感文字数据;基于所述麦克风阵列标识和所述采集时间查询值班安排表,获取对应的柜台人员信息;将所述敏感文字数据和所述柜台人员信息关联存储在数据库中。2.如权利要求1所述的柜台语音监控方法,其特征在于,在所述采用敏感词识别模型对所述目标文字数据进行识别,获取识别结果的步骤之前,所述柜台语音监控方法还包括:获取敏感词表,所述敏感词表包括至少两个原始敏感词;根据所述原始敏感词的首字是否相同,将所述原始敏感词划分成不同的敏感词子集;采用DFA算法对每一敏感词子集中的原始敏感词进行处理,获取与所述敏感词子集相对应的DFA树,将所述DFA树作为所述敏感词子集对应的敏感词识别模型。3.如权利要求2所述的柜台语音监控方法,其特征在于,所述采用DFA算法对每一敏感词子集中的原始敏感词进行处理,获取与所述敏感词子集相对应的DFA树,将所述DFA树作为所述敏感词子集对应的敏感词识别模型,包括:将所述敏感词子集中相同的首字作为根节点;判断所述原始敏感词中根节点的下一文字是否相同,若相同,则将所述根节点的下一文字作为所述根节点的中间节点;若不相同,则判断所述根节点的下一文字是否为所述原始敏感词的尾字,若是,则将所述根节点的下一文字作为所述根节点的叶子节点;若否,迭代判断所述原始敏感词中中间节点的下一文字是否相同,若相同,则将所述中间节点的下一文字更新为新的中间节点,若不相同,则将中间节点的下一文字作为叶子节点,直至不存在新的中间节点。4.如权利要求1所述的柜台语音监控方法,其特征在于,所述麦克风阵列包括至少三个麦克风;所述对所述原始语音数据进行数据预处理,获取目标语音数据,包括:采用GCC估计算法估计所述原始语音数据到达第一麦克风和第二麦克风的时延差;基于所述原始语音数据到达所述第一麦克风和所述第二麦克风的时延差,采用几何定位法获取所述原始语音数据的空间坐标;基于所述原始语音数据的空间坐标,确定每一麦克风对应的权重,采用加权公式对所述原始语音数据进行加权处理,获取待滤波语音数据;其中,所述加权公式为y(t)为待滤波语音数据,n为麦克风数量,i为第i个麦克风的标识,wi为第i个麦克风对应的权重,xi(t)为第i个麦克风接收到的原始语音数据;采用维纳滤波算法对所述待滤波语音数据进行滤波处理,获取目标语音数据。5.如权利要求4所述的柜台语音监控方法,其特征在于,采用GCC估计算法估计所述原始语音数据到达第一麦克风和...
【专利技术属性】
技术研发人员:黄锦伦,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。