语音识别方法和装置制造方法及图纸

技术编号：11784792 阅读：76 留言：0更新日期：2015-07-28 01:46

本发明专利技术公开了语音识别方法，包括：记录客户端设备所在位置附近的背景音；根据记录的客户端设备所在位置附近的背景音生成噪音模型；根据生成的噪音模型对来自所述客户端设备的语音文件进行降噪处理；以及对降噪后的语音文件进行语音识别得到识别后的文本。本发明专利技术还公开了执行上述方法的边缘节点、语音识别引擎以及控制服务器。在本发明专利技术中，用于干扰消除的背景音是由客户端设备所在位置附近的边缘节点捕获并记录的，能及时并且准确地反映出客户端设备所在位置附近的环境噪音或外部声音情况，因此，以此背景音声称噪音模型并进行降噪可以获得非常好的降噪效果，从而可以大大提高语音识别的识别率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音识别
，特别涉及一种语音识别方法和装置。
技术介绍
语音识别技术简要来说就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别技术主要包括声音特征提取技术、模式匹配准则及模型训练技术等方面。目前语音识别技术已经得到快速的发展以及广泛的使用。但是，在环境噪声较大的环境下，例如在体育场等嘈杂环境下，语音识别技术的应用却受到了很大的限制。可以理解，用户说话时的背景噪声越大，语音识别的识别率就会越低。甚至受到背景噪声的影响，很多时候无法完成语音结束检测（utteranceEndingDetection),也即无法检测出用户什么时候停止说话的。
技术实现思路
为了解决上述问题，本专利技术的实施例提出了一种语音识别的方法及执行该方法的装置，可以提高噪声环境下语音识别的识别率。本专利技术实施例所述的语音识别方法包括：记录客户端设备所在位置附近的背景音，并根据记录的背景音生成噪音模型；根据生成的噪音模型对来自所述客户端设备的语音文件进行降噪处理；以及对降噪后的语音文件进行语音识别得到识别后的文本。上述记录用户所在位置附近的背景音包括：服务所述用户的边缘节点记录自身周围的背景音。其中，上述语音文件包含时间戳；则根据记录的背景音生成噪音模型包括：所述边缘节点根据语音文件对应的时间戳查找所述时间戳所指示时间对应的背景音，根据所述背景音生成噪音模型。上述根据记录的背景音生成噪音模型包括：边缘节点根据接收到语音文件的时间查找与所述时间对应的背景音，并根据查找到的背景音生成噪音模型。或者，...

【技术保护点】
一种语音识别方法，其特征在于，包括：记录客户端设备所在位置附近的背景音，并根据记录的背景音生成噪音模型；根据生成的噪音模型对来自所述客户端设备的语音文件进行降噪处理；以及对降噪后的语音文件进行语音识别得到识别后的文本。

【技术特征摘要】

【专利技术属性】
技术研发人员：王晓利，曾勇波，张永生，
申请(专利权)人：株式会社NTT都科摩，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人