The invention discloses a method and a system for voice wake, the method comprises: receiving voice data; extracting acoustic features of the speech data; using the acoustic and acoustic model of pre built wake up to awaken the word recognition, word recognition results; if the wake-up word recognition results to arouse the word extraction wake up the word features from the intermediate results confirm the voice data and word recognition process in the wake; wake word confirmed features and pre built model validation was carried out to confirm the word wake wake up word recognition results using the confirmed results; according to the confirmation results, determine the success or failure of awakening. The invention also discloses a kind of intelligent terminal. By using the invention, it can avoid the case of wake-up failure caused by improper threshold setting in the confirmation of the wake-up word, and improve the success rate of wake-up.
【技术实现步骤摘要】
语音唤醒方法、系统及智能终端
本专利技术涉及语音处理领域,具体涉及一种语音唤醒方法、系统及智能终端。
技术介绍
语音唤醒通过理解用户的语音数据,达到唤醒智能终端的目的,从而打开了人类通往人工智能的第一扇大门,广泛应用于各种智能终端上,如智能穿戴设备、手机、平板电脑、智能家电等。为了避免非唤醒词的语音将智能终端唤醒,所述非唤醒词如噪声、笑声、干扰人声(不包含唤醒词)等,现有的语音唤醒方法一般在唤醒词识别之后,会进行唤醒词的确认。具体地,根据唤醒词识别过程中分别对应的唤醒词和非唤醒词的声学似然度,计算唤醒词和非唤醒词的声学似然度之间的比值得到唤醒词的声学似然比,设置唤醒词声学似然比阈值进行唤醒词识别结果确认。当所述似然比大于阈值时,认为是唤醒词识别结果可信,唤醒成功,否则,唤醒失败。所述唤醒词声学似然比阈值一般根据大量实验结果来确定,即大量实验的唤醒率以及误唤醒率来确定。这样,针对不同的应用场景,往往需要重新做大量实验来确定唤醒词声学似然比阈值,代价较高,并且如果阈值设置不当,容易造成唤醒词识别结果准确但唤醒失败的情况,降低了唤醒成功率。
技术实现思路
本专利技术实施例一 ...
【技术保护点】
一种语音唤醒方法,其特征在于,包括:接收语音数据;提取所述语音数据的声学特征;利用所述声学特征及预先构建的声学模型进行唤醒词识别,得到唤醒词识别结果;如果所述唤醒词识别结果为唤醒词,则从所述语音数据及唤醒词识别过程的中间结果中提取唤醒词确认特征;利用所述唤醒词确认特征及预先构建的唤醒词确认模型对唤醒词识别结果进行确认,得到确认结果;根据所述确认结果,确定唤醒成功或失败。
【技术特征摘要】
1.一种语音唤醒方法,其特征在于,包括:接收语音数据;提取所述语音数据的声学特征;利用所述声学特征及预先构建的声学模型进行唤醒词识别,得到唤醒词识别结果;如果所述唤醒词识别结果为唤醒词,则从所述语音数据及唤醒词识别过程的中间结果中提取唤醒词确认特征;利用所述唤醒词确认特征及预先构建的唤醒词确认模型对唤醒词识别结果进行确认,得到确认结果;根据所述确认结果,确定唤醒成功或失败。2.根据权利要求1所述的方法,其特征在于,所述唤醒词确认特征包括:唤醒词Rank特征、以及以下任意一种或多种特征:唤醒词时长特征、唤醒词声学得分特征、唤醒词声学得分分布特征、唤醒词置信度分布特征、唤醒词Filler得分特征、唤醒词时间间隔特征。3.根据权利要求2所述的方法,其特征在于,按以下方式提取所述唤醒词Rank特征:获取唤醒词识别过程中计算得到的唤醒词各语音单元中每个状态的各高斯的声学得分;分别对每个状态的所有高斯的声学得分进行排序;按照状态的逻辑先后顺序,将唤醒词的所有状态排序后的高斯的声学得分拼接起来,得到唤醒词Rank特征。4.根据权利要求2所述的方法,其特征在于,按以下方式提取所述唤醒词声学得分分布特征:获取唤醒词识别过程中计算得到的唤醒词各语音单元中每个状态的声学得分;计算每个状态的声学得分在每个状态的混合高斯分布中的概率值;按照状态的逻辑先后顺序将每个状态的声学得分的概率值拼接起来,得到唤醒词每个状态的声学得分分布特征;按以下方式提取所述唤醒词置信度分布特征:获取唤醒词识别过程中计算得到的唤醒词各语音单元中每个状态的声学得分置信度;计算每个状态的声学得分置信度在每个状态的混合高斯分布中的概率值;按照状态的逻辑先后顺序将每个状态的声学得分置信度的概率值拼接起来,得到唤醒词每个状态的声学得分置信度分布特征。5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:按以下方式构建所述唤醒词确认模型:收集大量语音数据;利用收集的语音数据进行唤醒词识别,得到唤醒词识别结果;标注唤醒词识别结果的分类特征,所述分类特征分为两类,分别为:确认唤醒和不唤醒;提取唤醒词确认特征;利用提取的唤醒词确认特征和标注的分类特征,训练得到唤醒词确认模型。6.根据权利要求5所述的方法,其特征在于,所述确认结果为唤醒词识别结果是唤醒词或是非唤醒词;或者所述唤醒词识别结果是唤醒词的概率或是非唤醒词的概率。7.一种语音唤醒系统,其特征在于,包括:接收模块,用于接收语音数据;声学特征提取模块,用于提取所述语音数据的声学特征;唤醒词识别模块,用于利用所述声学特征及预先构建的声学模型进行唤醒词识别,得到唤醒词识别结果,并在所述唤醒词识别结果为唤醒词时,触发确认特征提取模块;所述确认特征提取模块,用于从所述语音数据及唤醒词识别过程的中间结果中提取唤醒词确认特征;唤醒词确认模块,用于利用所述唤醒词确认特征及预先构建的唤醒词确认模型对唤醒词识...
【专利技术属性】
技术研发人员:潘嘉,吴国兵,刘聪,胡国平,胡郁,刘庆峰,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。