【技术实现步骤摘要】
语音交互方法、服务器及存储介质
[0001]本申请涉及语音
,尤其涉及一种语音交互方法、服务器及存储介质。
技术介绍
[0002]目前智能汽车可以为用户提供语音交互功能。
[0003]语音交互功能依赖于语音识别技术。相关技术中可以采用上下文相关的音节建模方式或上下文无关的音节建模方式来构建声学模型。
[0004]但是,相关技术构建声学模型时,会出现音节不均衡的问题。
技术实现思路
[0005]为解决或部分解决相关技术中存在的问题,本申请提供一种语音交互方法、服务器及存储介质,能够在建模时实现音节均衡,更方便不同语种的语音识别和语音交互。
[0006]本申请第一方面提供一种语音交互方法,包括:获取利用不同语种的音素得到的短音节和利用不同语种的训练语料得到的长音节;确定所述短音节和所述长音节中的音素或音素组合所出现的频次,根据所述频次确定高频音节和低频音节;将所述高频音节进行拆分得到第一音节,将所述低频音节进行合并得到第二音节;将所述第一音节和所述第二音节进行合并,得到建模音节;根据 ...
【技术保护点】
【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:获取利用不同语种的音素得到的短音节和利用不同语种的训练语料得到的长音节;确定所述短音节和所述长音节中的音素或音素组合所出现的频次,根据所述频次确定高频音节和低频音节;将所述高频音节进行拆分得到第一音节,将所述低频音节进行合并得到第二音节;将所述第一音节和所述第二音节进行合并,得到建模音节;根据所述建模音节生成声学模型;接收车辆转发的车辆座舱内用户发出的语音请求;根据所述声学模型对所述语音请求进行识别,生成识别结果下发至车辆完成语音交互。2.根据权利要求1所述的方法,其特征在于:所述短音节是根据万国音标规则将所述不同语种的音素进行预合并,再根据发音学规则将所述进行预合并后的音素进行合并得到。3.根据权利要求1所述的方法,其特征在于:所述长音节是利用不同语种的训练语料识别出发音的组合音节,根据发音黏着度从所述组合音节中筛选得到。4.根据权利要求1所述的方法,其特征在于,所述将所述高频音节进行拆分得到第一音节,包括:将单音素音节作为第一音节;将频次大于第一设定阈值的辅音音素与韵母的组合作为第一组合,将频次大于第一设定阈值的第一组合作为第一音节;将所述频次大于所述第一设定阈值的第一组合与声母或特殊声母的组合作为第N组合,将频次大于所述第一设定阈值的第N组合作为第一音节,所述N大于等于2;将所述频次大于所述第一设定阈值的第N组合与声母或特殊声母的组合作为第N+1组合,将频次大于第一设定阈值的第N+1组合作为第一音节。5.根据权利要求1所述的方法,其特征在于,所述将所述低频音节进行合并得到第二音节,包括:根据所述第一音节进行声学模型训练,得到混淆矩阵及混淆得分;确定所述低频音节在所述第一音节中的相似音节,在所述相似音节的混淆得分大于混淆阈值时,将所述低频音节与所述相似音节进行合并,得到第二音节。6.根据权利要求5所述的方法,其特征在于,所述方法还包...
【专利技术属性】
技术研发人员:张辽,
申请(专利权)人:广州小鹏汽车科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。