一种合成语音的识别方法、系统、智能设备和存储介质技术方案

技术编号:31832525 阅读:34 留言:0更新日期:2022-01-12 13:09
本发明专利技术实施例公开了一种合成语音的识别方法、系统、智能设备和存储介质。合成语音的识别方法包括:获取目标待识别语音数据,根据目标待识别语音获取目标待识别文字数据;获取目标待识别语音数据中每个发音音素的语音情感数据和目标待识别文字数据中每个单词的文字情感数据;判断语音情感数据和文字情感数据是否匹配,若语音情感数据和文字情感数据匹配,则判定目标待识别语音数据为非合成语音数据。本发明专利技术可以有效提升合成语音识别的准确性和可靠性。可靠性。可靠性。

【技术实现步骤摘要】
一种合成语音的识别方法、系统、智能设备和存储介质


[0001]本专利技术涉及语音识别
,尤其涉及一种合成语音的识别方法、系统、智能设备和存储介质。

技术介绍

[0002]语音合成,又称文语转换(Text to Speech,TTS)技术,是利用电子计算机和一些专门装置模拟人,制造语音的技术。还有的语音合成技术是采集说话人的多个语音片段,根据目标文字对语音片段进行截取、拼接,生成新的合成语音。
[0003]对语音数据是否为合成语音的判断,采用的是判断语句的连续性、停顿是否正常等方式。随着合成语音与真实语音越来越接近,如何鉴别哪些声音是真实的,哪些是伪造的是当前研究的一项重要课题,关系着诸如声纹识别、语音解锁等识别技术的安全性。

技术实现思路

[0004]基于此,有必要针对上述问题,提出了一种合成语音的识别方法、系统、智能设备和存储介质。
[0005]本专利技术解决其技术问题所采用的技术方案是:提供一种合成语音的识别方法,包括:获取目标待识别语音数据,根据所述目标待识别语音获取目标待识别文字数据;获取所述目标待本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种合成语音的识别方法,其特征在于,包括:获取目标待识别语音数据,根据所述目标待识别语音获取目标待识别文字数据;获取所述目标待识别语音数据中每个发音音素的语音情感数据和所述目标待识别文字数据中每个单词的文字情感数据;判断所述语音情感数据和所述文字情感数据是否匹配,若所述语音情感数据和所述文字情感数据匹配,则判定所述目标待识别语音数据为非合成语音数据。2.根据权利要求1所述的合成语音的识别方法,其特征在于,所述判断所述语音情感数据和所述文字情感数据是否匹配的步骤,包括:获取相邻的两个发音音素的发音情感连续数据和/或发音情感转折数据,以及相邻两个单词的文字情感连续数据和/或文字情感转折数据;判断所述发音情感连续数据和文字情感连续数据是否匹配和/或所述发音情感转折数据和所述文字情感转折数据是否匹配。3.根据权利要求1所述的合成语音的识别方法,其特征在于,所述获取所述目标待识别语音数据中每个发音音素的语音情感数据的步骤之前,包括:通过语音识别技术获取所述目标待识别语音数据中的至少一个所述发音音素。4.根据权利要求1所述的合成语音的识别方法,其特征在于,所述判断所述语音情感数据和所述文字情感数据是否匹配的步骤之前,包括:获取所述目标待识别语音的时间维度,将所述语音情感数据和所述文字情感数据在所述时间维度进行对齐。5.根据权利要求1所述的合成语音的识别方法,其特征在于,所述判断所述语音情感数据和所述文字情感数据是否匹配的步骤,包括:根据所述语音情感数据获取所述目标待识别语音数据的语音目标情感数据,根据所述文字情感数据获取所述目标待识别文字...

【专利技术属性】
技术研发人员:王安杰
申请(专利权)人:山东沣品信息网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1