基于深度学习的语音关键信息分离方法技术

技术编号：26224690 阅读：66 留言：0更新日期：2020-11-04 10:59

本发明专利技术公开的是基于深度学习的语音关键信息分离方法，包括以下步骤：CNN训练→语音信息标定→语音信息特征聚类→语音信息分离。本发明专利技术基于深度学习和聚类的人工智能方法，可以在尽可能减少人工干预的情况下，自动分离语音信号中关键语音信号。在此过程中，并不涉及语义分析，可避免传统语音分离处理流程中的累积误差，也可将本方法作为传统方法预处理手段，进一步提升语音分离效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的语音关键信息分离方法
本专利技术涉及语音处理技术，具体的说是指基于深度学习的语音关键信息分离方法。
技术介绍
语音作为关键的多媒体数据，在信息表达、存储、人机交互中有着重要作用，语音信号中包含着丰富的信息，语音信息检索是目前的重要研究热点。目前的语音智能检索，常用手段为关键词检索、句子检索、文档检索。现有的检索手段大多依赖语音中的语义分析，检索方法步骤繁多，流程复杂，导致误差累积，准确率下降。
技术实现思路
本专利技术提供的是基于深度学习的语音关键信息分离方法，其主要目的在于克服现有语音检索方法步骤繁多、流程复杂，导致误差累积，准确率下降的问题。为了解决上述的技术问题，本专利技术采用如下的技术方案：基于深度学习的语音关键信息分离方法，包括以下步骤：S1、CNN训练：将语音信号样本集作为训练数据，以待测关键信息为标签，利用CNN卷积神经网络对语音信号样本集进行训练，以获取一个语音信息分类模型，训练后获取的语音信息分类模型可以区分出不同语音信号中是否包含需要关注的关键信息；S2、语音信息标定：基于训练好的语音信息分类模型，将待测语音信号经过语音信息分类模型，采用反向梯度激活平均算法及特征加权激活映射算法，在语音信号中自动标定所关注的信息；S3、语音信息特征聚类：将待测的同类语音信号均通过语音信息标定算法分别生成语音信息标定向量，从而形成语音信息标定向量集；然后对语音信息标定向量集采用密度聚类方法，计算出聚类质心向量，即该类别语音信息典型特征...

【技术保护点】
1.基于深度学习的语音关键信息分离方法，其特征在于：包括以下步骤：/nS1、CNN训练：将语音信号样本集作为训练数据，以待测关键信息为标签，利用CNN卷积神经网络对语音信号样本集进行训练，以获取一个语音信息分类模型，训练后获取的语音信息分类模型可以区分出不同语音信号中是否包含需要关注的关键信息；/nS2、语音信息标定：基于训练好的语音信息分类模型，将待测语音信号经过语音信息分类模型，采用反向梯度激活平均算法及特征加权激活映射算法，在语音信号中自动标定所关注的信息；/nS3、语音信息特征聚类：将待测的同类语音信号均通过语音信息标定算法分别生成语音信息标定向量，从而形成语音信息标定向量集；然后对语音信息标定向量集采用密度聚类方法，计算出聚类质心向量，即该类别语音信息典型特征分布向量；最后利用统计分析方法，计算语音信息典型特征分布向量中相邻峰值跃迁幅度，找出峰值跃迁幅度最大的两个峰值，计算语音信息分离阈值；/nS4、语音信息分离：将目标语音信号序列与语音信息标定序列对齐，基于深度学习进行语音信号标定的过程中，生成语音信息标定序列时，采用插值填充的方法将语音信息标定序列拉伸至与原目标语音信号的...

【技术特征摘要】
1.基于深度学习的语音关键信息分离方法，其特征在于：包括以下步骤：
S1、CNN训练：将语音信号样本集作为训练数据，以待测关键信息为标签，利用CNN卷积神经网络对语音信号样本集进行训练，以获取一个语音信息分类模型，训练后获取的语音信息分类模型可以区分出不同语音信号中是否包含需要关注的关键信息；
S2、语音信息标定：基于训练好的语音信息分类模型，将待测语音信号经过语音信息分类模型，采用反向梯度激活平均算法及特征加权激活映射算法，在语音信号中自动标定所关注的信息；
S3、语音信息特征聚类：将待测的同类语音信号均通过语音信息标定算法分别生成语音信息标定向量，从而形成语音信息标定向量集；然后对语音信息标定向量集采用密度聚类方法，计算出聚类质心向量，即该类别语音信息典型特征分布向量；最后利用统计分析方法，计算语音信息典型特征分布向量中相邻峰值跃迁幅度，找出峰值跃迁幅度最大的两个峰值，计算语音信息分离阈值；
S4、语音信息分离：将目标语音信号序列与语音信息标定序列对齐，基于深度学习进行语音信号标定的过程中，生成语音信息标定序列时，采用插值填充的方法将语音信息标定序列拉伸至与原目标语音信号的相同长度，并将二者对齐；然后根据语音信息典型特征聚类计算得到的分离阈值，结合语音信息标定序列，设计滤波器，对目标语音信号逐点进行分离，将语音信号分离为包含所检索关键信息的关键语音信号和背景信号。

2.如权利要求1所述的基于深度学习的语音关键信息分离...

【专利技术属性】
技术研发人员：张建国，叶家艺，茅剑，
申请(专利权)人：厦门熙重电子科技有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人