应用于机器人的语音处理方法及装置制造方法及图纸

技术编号：36200968 阅读：10 留言：0更新日期：2023-01-04 11:54

本发明专利技术涉及一种应用于机器人的语音处理方法及装置，在获取机器人采集的场景音，并基于语音端点检测，分离出场景音中的语音部分。通过预先建立声学模型，并基于声学模型识别语音部分，获得第一识别结果；并通过预先建立语言模型，并基于语言模型识别语音部分，获得第二识别结果。基于此，降低机器人采集的场景音在前端中受到的干扰，提高语音识别的准确率和稳定性。稳定性。稳定性。

全部详细技术资料下载

【技术实现步骤摘要】
应用于机器人的语音处理方法及装置

[0001]本专利技术涉及语音处理
，特别是涉及一种应用于机器人的语音处理方法及装置。

技术介绍

[0002]语音处理，通常是指对语音进行识别和应用等处理方式。经典的语音处理方法一般都建立在线性平稳系统的理论基础之上，这是以短时语音具有相对平稳性为前提条件的。但是，语音信号是一种典型的非线性、非平稳随机过程，这就使得采用经典的处理方法难以进一步提升语音处理系统的性能，如语音识别系统的识别率等。随着机器人技术的不断发展，以机器人智能语音交互为代表的语音新应用迫切要求发展新的语音处理技术与手段，以提高语音处理系统的性能水平。在这个过程中，伴随着智能技术如人工智能或机器学习的发展，智能语音处理逐步被应用至机器人中。智能语音处理，通常泛指在语音处理算法或系统实现中全部或部分采用智能化的处理技术或手段。
[0003]在机器人使用中，大量的使用场景是为了应付前端的使用场景，存在诸多的干扰因素，例如环境音干扰、说话人语言发音水平或语言差异等，会严重影响语音处理，降低语音识别的准确率和稳定性。

技术实现思路

[0004]基于此，有必要针对语音处理在机器人使用中，大量的使用场景是为了应付前端的使用场景，存在诸多的干扰因素这一问题，提供一种应用于机器人的语音处理方法及装置。
[0005]一种应用于机器人的语音处理方法，包括步骤：
[0006]获取机器人采集的场景音，并基于语音端点检测，分离出所述场景音中的语音部分；
[0007]预先建立声学模型，并基...

【技术保护点】

【技术特征摘要】
1.一种应用于机器人的语音处理方法，其特征在于，包括步骤：获取机器人采集的场景音，并基于语音端点检测，分离出所述场景音中的语音部分；预先建立声学模型，并基于所述声学模型识别所述语音部分，获得第一识别结果；预先建立语言模型，并基于所述语言模型识别所述语音部分，获得第二识别结果；根据所述第一识别结果和所述第二识别结果，获得语音处理结果。2.根据权利要求1所述的应用于机器人的语音处理方法，其特征在于，所述获取机器人采集的场景音，并基于语音端点检测，分离出所述场景音中的语音部分的过程，包括步骤：收集各应用场景下的非语音数据，通过深度神经网络进行语音与非语音建模，实现语音端点检测。3.根据权利要求1或2所述的应用于机器人的语音处理方法，其特征在于，所述获取机器人采集的场景音，并基于语音端点检测，分离出所述场景音中的语音部分的过程，包括步骤：结合短时场景下的BIC距离以及长时声纹相似性评估中的PLDA，分离出所述场景音中的语音部分。4.根据权利要求1所述的应用于机器人的语音处理方法，其特征在于，所述预先建立声学模型的过程，包括步骤：收集各发音风格的训练语音，以提高所述声学模型对发音变化的覆盖性；其中，所述训练语音用于训练所述声学模型。5.根据权利要求1或4所述的应用于机器人的语音处理方法，其特征在于，所述预先建立声学模型的过程，包括步骤：基于模型域、特征域以及特殊音素，进行所述声学模型的建模。6....

【专利技术属性】
技术研发人员：杜兰，陈彬，杜轶锋，周国华，叶国伟，杨光武，廖森平，曾文君，蒋仕坚，
申请(专利权)人：科大讯飞华南有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人