语音信号的处理方法、装置、设备及存储介质制造方法及图纸

技术编号:28298117 阅读:35 留言:0更新日期:2021-04-30 16:24
本发明专利技术涉及人工智能技术领域,提供一种语音信号的处理方法、装置、设备及存储介质,用于提高对有效短语音的识别准确性。语音信号的处理方法包括:获取待处理语音信号的目标短语音片段,并提取目标短语音片段的目标音频特征;根据目标短语音片段从预置短语音片段中获取目标分类标签,目标分类标签包括疑问语气、正常陈述语气和/或虚警噪声;通过目标神经网络模型和目标分类标签,对目标音频特征进行分类得到初始识别类型以及目标置信度;将目标置信度大于预设阈值的初始识别类型确定为目标识别类型;根据目标识别类型对待处理语音信号进行过滤得到目标语音信号。此外,本发明专利技术还涉及区块链技术,待处理语音信号可存储于区块链中。

【技术实现步骤摘要】
语音信号的处理方法、装置、设备及存储介质
本专利技术涉及人工智能的语音信号处理领域,尤其涉及一种语音信号的处理方法、装置、设备及存储介质。
技术介绍
近些年来,随着深度学习和强化学习的蓬勃发展,智能对话系统作为人工智能领域的核心技术,得到了广泛的应用。自然语言理解是智能对话系统中的重要环节。现有的自然语言理解处理方式基本都集中于文本处理,并且为了提升人机交互的流畅性和效率,智能对话系统引入了文本情绪处理。但是,现有的自然语言理解处理方式中,对于一些短语音,极少或者没有其相关的文本信息,因此,无法有效地判断说话人的情绪和表达内容,从而,导致了对有效短语音的识别准确性较低。
技术实现思路
本专利技术提供一种语音信号的处理方法、装置、设备及存储介质,用于提高对有效短语音的识别准确性。本专利技术第一方面提供了一种语音信号的处理方法,包括:获取待处理语音信号,对所述待处理语音信号进行短语音片段识别,得到目标短语音片段,并对所述目标短语音片段进行帧音频特征提取,得到目标音频特征;将所述目标短语音片段与预置本文档来自技高网...

【技术保护点】
1.一种语音信号的处理方法,其特征在于,所述语音信号的处理方法包括:/n获取待处理语音信号,对所述待处理语音信号进行短语音片段识别,得到目标短语音片段,并对所述目标短语音片段进行帧音频特征提取,得到目标音频特征;/n将所述目标短语音片段与预置短语音片段依次进行匹配和分类标签提取,得到目标分类标签,所述目标分类标签包括疑问语气、正常陈述语气和/或虚警噪声;/n通过预置的目标神经网络模型和所述目标分类标签,对所述目标音频特征进行分类,得到初始识别类型,以及所述初始识别类型对应的目标置信度;/n判断所述目标置信度是否大于预设阈值,若所述目标置信度大于所述预设阈值,则将所述初始识别类型确定为目标识别类...

【技术特征摘要】
1.一种语音信号的处理方法,其特征在于,所述语音信号的处理方法包括:
获取待处理语音信号,对所述待处理语音信号进行短语音片段识别,得到目标短语音片段,并对所述目标短语音片段进行帧音频特征提取,得到目标音频特征;
将所述目标短语音片段与预置短语音片段依次进行匹配和分类标签提取,得到目标分类标签,所述目标分类标签包括疑问语气、正常陈述语气和/或虚警噪声;
通过预置的目标神经网络模型和所述目标分类标签,对所述目标音频特征进行分类,得到初始识别类型,以及所述初始识别类型对应的目标置信度;
判断所述目标置信度是否大于预设阈值,若所述目标置信度大于所述预设阈值,则将所述初始识别类型确定为目标识别类型;
根据所述目标识别类型,对所述待处理语音信号进行过滤,得到目标语音信号。


2.根据权利要求1所述的语音信号的处理方法,其特征在于,所述获取待处理语音信号,对所述待处理语音信号进行短语音片段识别,得到目标短语音片段,并对所述目标短语音片段进行帧音频特征提取,得到目标音频特征,包括:
通过预置语音采集器采集待处理语音信号,对所述待处理语音信号依次进行预处理、语音片段识别分割和语音文本转换,得到语音片段和所述语音片段对应的初始文本信息;
对所述初始文本信息中的单音节词进行识别,得到目标文本信息,并将所述目标文本信息对应的语音片段确定为目标短语音片段;
根据预置的帧长和帧间重叠度,对所述目标短语音片段进行帧语音提取,得到帧语音片段,并对所述帧语音片段进行音频特征提取,得到目标音频特征。


3.根据权利要求1所述的语音信号的处理方法,其特征在于,所述将所述目标短语音片段与预置短语音片段依次进行匹配和分类标签提取,得到目标分类标签,包括:
计算所述目标语音片段与预置短语音片段之间的短时能量相似度,以及音频特征相似度;
将所述短时能量相似度和所述音频特征相似度进行加权求和处理,得到目标相似度;
从所述预置短语音片段中,获取所述目标相似度大于预设相似度的目标短语音片段,并通过预置的标签提取算法,提取所述目标短语音片段的分类标签,得到目标分类标签。


4.根据权利要求1所述的语音信号的处理方法,其特征在于,所述通过预置的目标神经网络模型和所述目标分类标签,对所述目标音频特征进行分类,得到初始识别类型,以及所述初始识别类型对应的目标置信度,包括:
通过预置的目标神经网络模型中的注意力机制层,对所述目标音频特征依次进行音频偏重特征矩阵计算和特征融合,得到融合特征矩阵,所述目标神经网络模型包括注意力机制层和多层的全连接层;
通过所述多层的全连接层和所述目标分类标签,对所述融合特征矩阵进行多层级分类和概率值计算,得到初始识别类型,以及所述初始识别类型对应的目标置信度。


5.根据权利要求1所述的语音信号的处理方法,其特征在于,所述获取待处理语音信号,对所述待处理语音信号进行短语音片段识别,得到目标短语音片段,并对所述目标短语音片段进行帧音频特征提取,得到目标...

【专利技术属性】
技术研发人员:赵沁徐国强
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1