【技术实现步骤摘要】
本专利技术属于语音通信领域,具体涉及。
技术介绍
未来人机交互最基本、最重要的手段是语音,而语音识别与合成是促使其普及发展的最关键技术。因此对语音识别的关键技术研究变的尤为重要。语音识别主要包括:语言特征提取、模式匹配和语言模型处理,其研究的对象分别是:语言特征序列、识别算法和语法语义分析。其中的关键技术有:端点检测,动态时间规整(DTW),隐形马尔科夫模型(HMM),人工神经网络(ANN)等。端点检测通常依据的语音特征有短时能量、过零率、LPC距离、频谱熵、倒谱特征、TF参数、分形特征以及几种参数相结合,例如能零积、能零比、频能比、对数能量谱熵、子带谱熵、能频值等,但是这些参数性能过于单一,在低信噪比的条件下很难满足实际的需求。传统的端点检测特征参数LPC距离、倒谱特征、TF参数和分形特征等参数计算量太大,对硬件要求很高,阻碍了人机交互技术在日常生活中的普及适用。
技术实现思路
本专利技术提出,通过对语音信号波形的图像,或语音信号的频谱图像,包括时域的包络图像进行图像处理,运用图像处理中对图像轮廓边缘的检测,进行端点检测。本专利技术的技术方案是:,包括以下步骤:将 ...
【技术保护点】
一种病人虚弱语音端点检测方法,其特征在于,包括以下步骤:将语音信号转换为图像,对此图像进行拉伸和放大,将拉伸和放大后的图像转换成二值图像;对语音信号的波形包络所在区域进行开操作,即其中Θ为腐蚀,为膨胀,再取边界β(A);β(A)=A?A(AΘB)进一步取波形轮廓,其中取边界β(A)为一个像素点;使用平滑滤波器h(x)对信号进行滤波,得到其中为卷积;对g(x)求两阶导数以检测边缘点;找到音频最高点,搜索最高点两边的店,将前点和后点比较,若前点小于后点,则认为此最高点两边的两个点分别为词或音节的起始和结束点。FDA00002696890100011.jpg,FDA0000269 ...
【技术特征摘要】
1.一种病人虚弱语音端点检测方法,其特征在于,包括以下步骤: 将语音信号转换为图像,对此图像进行拉伸和放大,将拉伸和放大后的图像转换成二值图像; 对语音信号的波形包络所在区域进行开操作,即』。Β = 十/ ,其中Θ为腐蚀,Φ为膨胀,再取边界β (A); β (A) =A-A(AOB)进一步取波形轮廓...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。