语音处理方法、装置和介质制造方法及图纸

技术编号：30403105 阅读：13 留言：0更新日期：2021-10-20 10:51

本发明专利技术实施例提供了一种语音处理方法和装置、一种用于语音处理的装置，其中的方法具体包括：确定用户词库中用户词条对应的词条特征；所述词条特征包括：个人词频、公共词频、以及使用用户数量；依据所述词条特征，从所述用户词库中确定出个性化词条；所述个性化词条用于语音输入。本发明专利技术实施例能够提高个性化词条的区分性和准确度，以及能够提高语音识别的准确度。确度。确度。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、装置和介质

[0001]本专利技术涉及语音处理
，特别是涉及一种语音处理方法和装置、一种机器可读介质。

技术介绍

[0002]语音识别技术能够将语音转换成为对应的字符或编码，广泛应用于语音输入、智能聊天、语音翻译等领域。
[0003]目前的语音识别模型通常采用声学模型及语言模型，优先识别出常用词及语料中出现概率较大的词。
[0004]专利技术人在实施本专利技术实施例的过程中发现，常用词及语料中出现概率较大的词反映的是大多数用户的语言使用习惯，而单个用户通常具有自身的个性化语言使用习惯，若大多数用户的语言使用习惯与个性化语言使用习惯相悖，则将提供错误的语音识别结果。

技术实现思路

[0005]鉴于上述问题，提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的语音处理方法、语音处理装置及用于语音处理的装置，本专利技术实施例能够提高个性化词条的区分性和准确度，以及能够提高语音识别的准确度。
[0006]为了解决上述问题，本专利技术公开了一种语音处理方法，包括：
[0007]确定用户词库中用户词条对应的词条特征；所述词条特征包括：个人词频、公共词频、以及使用用户数量；
[0008]依据所述词条特征，从所述用户词库中确定出个性化词条；所述个性化词条用于语音输入。
[0009]为了解决上述问题，本专利技术公开了一种语音处理方法，包括：
[0010]接收待识别语音数据；
[0011]对所述待识别语音数据进行解码...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法，其特征在于，包括：确定用户词库中用户词条对应的词条特征；所述词条特征包括：个人词频、公共词频、以及使用用户数量；依据所述词条特征，从所述用户词库中确定出个性化词条；所述个性化词条用于语音输入。2.根据权利要求1所述的方法，其特征在于，所述从所述用户词库中确定出个性化词条，包括：从所述用户词库中滤除使用用户数量超过第一阈值的用户词条；和/或从所述用户词库中获取个人词频超过第二阈值的用户词条；和/或依据个人词频与公共词频之间的相对关系，从所述用户词库中获取个性化词条。3.根据权利要求1所述的方法，其特征在于，所述从所述用户词库中确定出个性化词条，包括：对所述个人词频、所述公共词频的倒数和所述使用用户数量的倒数进行融合；依据融合特征，从所述用户词库中获取个性化词条。4.一种语音处理方法，其特征在于，包括：接收待识别语音数据；对所述待识别语音数据进行解码；根据用户对应的个性化词条，对所述待识别语音数据对应的解码路径的得分进行调整；所述用户对应的个性化词条为依据权利要求1至3中任一所述的方法得到；根据所述解码路径的调整后得分，确定所述待识别语音数据对应的语音识别结果。5.一种语音处理装置，其特征在于，包括：词条特征确定模块，用于确定用户词库中用户词条对应的词条特征；所述词条特征包括：个人词频、公共词频、以及使用用户数量；个性化词条确定模块，用于依据所述词条特征，从所述用户词库中确定出个性化词条；所述个性化词条用于语音输入。6.一种语音处理装置，其特征在于，包括：接收模块，用于接收待识别语音数据；解码模块，用于对所述待识别语音数据进行解码；调整模块，用于根...

【专利技术属性】
技术研发人员：魏爽，郑宏，陈金坤，韩秦，杨家旭，李明浩，张群，杨浩，龙全友，李瑞星，陈章钦，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人