一种语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：21435557 阅读：29 留言：0更新日期：2019-06-22 12:58

本发明专利技术实施例提出一种语音识别方法、装置、设备及存储介质，其中方法包括：接收语音数据，对所述语音数据进行语音识别，得到所述语音数据对应的第一文本数据；判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据；所述常用文本数据为出现次数超过预设阈值的语音识别结果；如果存在，则采用所述常用文本数据替换所述第一文本数据。发明专利技术实施例能够提高语音识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法、装置、设备及存储介质
本专利技术涉及语音识别
，尤其涉及一种语音识别方法、装置、设备及存储介质。
技术介绍
语音识别识别技术是一种对用户的语音数据进行识别的技术。语音识别作为一种常用的人机交互技术，目前已广泛应用于各类电子产品中。但是，现有的语音识别结果经常会出现错误，极大地影响用户使用体验。特别是在进行离线语音识别时，由于终端设备的计算能力相比服务器较弱，出现语音识别错误的可能性更大。
技术实现思路
本专利技术实施例提供一种语音识别方法及装置，以至少解决现有技术中的以上技术问题。第一方面，本专利技术实施例提供了一种语音识别方法，包括：接收语音数据，对所述语音数据进行语音识别，得到所述语音数据对应的第一文本数据；判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据；所述常用文本数据为出现次数超过预设阈值的语音识别结果；如果存在，则采用所述常用文本数据替换所述第一文本数据。在一种实施方式中，所述对所述语音数据进行语音识别，包括：对所述语音数据进行离线语音识别；所述常用文本数据为出现次数超过预设阈值的在线语音识别的结果。在一种实施方式中，预先设置所述固定数据表的方式为：对语音数据进行在线语音识别，得到所述语音数据对应的第二文本数据；判断所述第二文本数据的语义类型是否为可离线处理的语义类型；如果是，则对所述第二文本数据进行分词处理；针对分词处理后的各个词语及所述第二文本数据，判断所述固定数据表中是否包含所述词语或第二文本数据；如果不包含，则更新临时数据表记录的所述词语或第二文本数据的出现次数，并将出现次数...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：接收语音数据，对所述语音数据进行语音识别，得到所述语音数据对应的第一文本数据；判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据；所述常用文本数据为出现次数超过预设阈值的语音识别结果；如果存在，则采用所述常用文本数据替换所述第一文本数据。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：接收语音数据，对所述语音数据进行语音识别，得到所述语音数据对应的第一文本数据；判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据；所述常用文本数据为出现次数超过预设阈值的语音识别结果；如果存在，则采用所述常用文本数据替换所述第一文本数据。2.根据权利要求1所述的方法，其特征在于，所述对所述语音数据进行语音识别，包括：对所述语音数据进行离线语音识别；所述常用文本数据为出现次数超过预设阈值的在线语音识别的结果。3.根据权利要求2所述的方法，其特征在于，预先设置所述固定数据表的方式为：对语音数据进行在线语音识别，得到所述语音数据对应的第二文本数据；判断所述第二文本数据的语义类型是否为可离线处理的语义类型；如果是，则对所述第二文本数据进行分词处理；针对分词处理后的各个词语及所述第二文本数据，判断所述固定数据表中是否包含所述词语或第二文本数据；如果不包含，则更新临时数据表记录的所述词语或第二文本数据的出现次数，并将出现次数达到预设阈值的词语或第二文本数据记录至所述固定数据表，作为所述固定数据表中的常用文本数据。4.根据权利要求3所述的方法，其特征在于，还包括：当所述临时数据表的存储量达到存储上限时，按照最近最少使用方式释放所述临时数据表的存储空间。5.根据权利要求1至4任一所述的方法，其特征在于，所述固定数据表还保存所述常用文本数据对应的语义解析结果；所述判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据之后，还包括：如果存在，则从所述固定数据表中提取所述常用文本数据对应的语义解析结果。6.根据权利要求1至4任一所述的方法，其特征在于，所述判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据，包括：将所述第一文本数据分别与所述固定数据表中的各个常用文本数据进行对比，所述对比的方式为将相同位置的音素逐一进行对比；当音素对比结果相同的比例超过预设比例门限时，判定所述常用文本数据与所述第一文本数据的发音相似度达到预设条件。7.一种语音识别装置，其特征在于，包括：初步识别模块，用于接收语音数据，对所述语音数据进行语音识别，得到所述语音数据对应的第一文本数据；判断模块，用于判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达...

【专利技术属性】
技术研发人员：宋晔，张龙，揭朋朋，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人