一种语音识别的校正方法及装置制造方法及图纸

技术编号：15692542 阅读：286 留言：0更新日期：2017-06-24 06:39

本发明专利技术实施例公开了一种语音识别的校正方法及装置，该方法包括：根据设定检测设备的检测数据确定用户所处的当前应用场景；在所述当前应用场景下对检测到的声音进行语音识别；基于所述当前应用场景对应的深度学习模型对语音识别得到的语料进行深度学习，获取学习结果；根据所述学习结果对语音识别的结果进行校正。本发明专利技术实施例能够满足特定应用场景语音识别的要求，具有针对性的对各个应用场景进行语音识别，大大提升了语音识别的准确性，进而促进了人机交互，可应用范围广泛。

Method and device for correcting speech recognition

The embodiment of the invention discloses a method and a device for correction of speech recognition, the method comprises: according to the current application scenarios of user's data set to determine the detection of detection equipment; to detect the current scenario of voice recognition; the current application scenarios corresponding to deep learning model speech recognition based on the data of deep learning, learning results; corrected according to the study results of speech recognition results. The embodiment of the invention can meet the specific application scenarios of speech recognition, targeted speech recognition on various scenarios, greatly enhance the accuracy of speech recognition, and then promote the man-machine interaction, can be widely used.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别的校正方法及装置
本专利技术涉及语音处理技术，尤其涉及一种语音识别的校正方法及装置。
技术介绍
随着科技的发展，人类已进入人工智能时代，人工智能用于延展人类的智慧和能力，模拟人类的思维过程和智能行为，使机器能够胜任通常需要人类智能才能完成的复杂工作。人工智能的其中一个重要分支包括语音识别、文字翻译以及语音合成，语音识别技术是机器通过识别和理解过程把输入的语音信号转变成相应的文本，实现人与机器的交流；文字翻译技术是将语音识别到的词语按照正确的语法翻译为语句；语音合成技术(TexttoSpeech，简称TTS)是将机器产生或外部输入的文字信息转变为类似人类表达方式的语音并输出。目前，科大讯飞、微软、谷歌等公司研制出的语音识别技术是基于具有庞大的云数据处理能力的大数据平台计算而来，数据量具有大而广的特点，可以基本实现人机语言交互，但是，针对特定应用场景下的特定应用语句的识别和翻译往往是不够准确的。现有技术的校正方法中，通常采用统计学或机器学习的方法，逐步过滤获取校正集合。但是这种方法由于缺乏针对性，对每个用户的输入进行校正的过程基本是相同的，因此校正的准确性不高。例如，接收到不同用户的语音“lihua”，通过初始识别获取的对应文本为“李华”，可能通通校正为“梨花”、“理化”或者“礼花”，即没有根据不同的应用场景更具有针对性的获取校正结果。
技术实现思路
本专利技术实施例提供一种语音识别的校正方法及装置，以解决现有技术中对语音识别结果校正不准确的问题。第一方面，本专利技术实施例提供了一种语音识别的校正方法，包括：根据设定检测设备的检测数据确定用户所处的当前...

【技术保护点】
一种语音识别的校正方法，其特征在于，包括：根据设定检测设备的检测数据确定用户所处的当前应用场景；在所述当前应用场景下对检测到的声音进行语音识别；基于所述当前应用场景对应的深度学习模型对语音识别得到的语料进行深度学习，获取学习结果；根据所述学习结果对语音识别的结果进行校正。

【技术特征摘要】
1.一种语音识别的校正方法，其特征在于，包括：根据设定检测设备的检测数据确定用户所处的当前应用场景；在所述当前应用场景下对检测到的声音进行语音识别；基于所述当前应用场景对应的深度学习模型对语音识别得到的语料进行深度学习，获取学习结果；根据所述学习结果对语音识别的结果进行校正。2.根据权利要求1所述的方法，其特征在于，所述根据设定检测设备的检测数据确定用户所处的当前应用场景，包括以下的至少一种：对检测到的声音进行语音识别，判断语音识别得到语料所属的语料集对应的应用场景；通过定位模块检测移动终端所在的位置，获取用户所处的当前应用场景；通过蓝牙数字信号处理设备检测应用场景的特征，根据所述特征确定当前应用场景。3.根据权利要求1所述的方法，其特征在于，所述根据设定检测设备的检测数据确定用户所处的当前应用场景之前，还包括：使用聚类算法对各个应用场景下的语料库进行分组，根据所述分组的结果提取语料特征；对所述语料特征进行训练，创建对应各个应用场景的深度学习模型。4.根据权利要求1所述的方法，其特征在于，所述根据所述学习结果对语音识别的结果进行校正，包括：如果所述学习结果为所述语音识别的结果与当前应用场景不匹配，将所述语音识别的结果校正为当前应用场景下对应的结果。5.根据权利要求3所述的方法，其特征在于，所述语料库包括：已存储的用户输入的语料、经过筛选的语料和/或校正语音识别的结果得到的语料。6.一种语音识...

【专利技术属性】
技术研发人员：石日俭，贺磊，刘旭，吕晓霞，
申请(专利权)人：深圳市大乘科技股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人