用于检测语音识别结果的方法、装置制造方法及图纸

技术编号：26532792 阅读：17 留言：0更新日期：2020-12-01 14:17

本申请公开了用于检测语音识别结果的方法、装置、电子设备及计算机可读存储介质，涉及计算机技术领域、语音识别技术领域、图像处理技术领域、文字识别技术领域和质量评价技术领域。具体实现方案为：响应于接收到语音信息后，指示对语音识别界面进行多次截取，得到界面截图集合，并基于预先确定的识别特征从中确定待识别截图，基于待识别截图的时间戳，从待识别截图中确定标准识别截图，根据该标准识别截图中的文本信息确定语音识别结果，并与预先获取的语音识别标准内容进行比较，得到识别结果相似度检测结果，该方法无需获取语音识别应用的后台代码便可实现语音识别结果的检测，不仅提升了检测效率，还支持对不同应用的识别结果进行检测。

全部详细技术资料下载

【技术实现步骤摘要】
用于检测语音识别结果的方法、装置
本申请涉及计算机
，具体涉及语音识别
、图像处理
、文字识别
和质量评价
，尤其涉及用于检测语音识别结果的方法、装置、电子设备及计算机可读存储介质。
技术介绍
目前，各类终端设备、应用为了更好的实现人机交互，支持用户采用语音方式发出指令。因该交互过程是基于用户语音指令进行的，并且后续执行的操作需要根据该语音指令中的信息进行确定，因此语音指令中的信息能否被各类终端设备、应用准确的识别显得尤为重要。现有技术中，通常将语音识别结果直接呈现给用户，基于用户的反馈信息实现对语音识别结果的检测。
技术实现思路
本申请提供了一种用于检测语音识别结果的方法、装置、电子设备以及存储介质。第一方面，本申请的实施例提供了一种用于检测语音识别结果的方法，包括：响应于接收到语音信息，指示对语音识别界面进行多次截取，获取界面截图集合；响应于检测到该界面截图集合中存在具有预先确定的识别特征的界面截图，将具有预先确定的识别特征的界面截图确定为待识别截图；基于待识别截图的时间戳，从待识别截图中确定标准待识别截图，根据该标准待识别截图中的文本信息识别结果确定语音识别结果；检测该语音识别结果与预先获取的语音识别标准内容之间的相似度，得到识别结果相似度检测结果。第二方面，本申请的实施例提供了一种用于检测语音识别结果的装置，包括：界面截图获取单元，被配置成响应于接收到语音信息，指示对语音识别界面进行多次截取，获取界面截图集合；待识别截图确定单元...

【技术保护点】
1.一种用于检测语音识别结果的方法，包括：/n响应于接收到语音信息，指示对语音识别界面进行多次截取，获取界面截图集合；/n响应于检测到所述界面截图集合中存在具有预先确定的识别特征的界面截图，将具有预先确定的识别特征的界面截图确定为待识别截图；/n基于所述待识别截图的时间戳，从所述待识别截图中确定标准待识别截图，根据所述标准待识别截图中的文本信息识别结果确定语音识别结果；/n检测所述语音识别结果与预先获取的语音识别标准内容之间的相似度，得到识别结果相似度检测结果。/n

【技术特征摘要】
1.一种用于检测语音识别结果的方法，包括：
响应于接收到语音信息，指示对语音识别界面进行多次截取，获取界面截图集合；
响应于检测到所述界面截图集合中存在具有预先确定的识别特征的界面截图，将具有预先确定的识别特征的界面截图确定为待识别截图；
基于所述待识别截图的时间戳，从所述待识别截图中确定标准待识别截图，根据所述标准待识别截图中的文本信息识别结果确定语音识别结果；
检测所述语音识别结果与预先获取的语音识别标准内容之间的相似度，得到识别结果相似度检测结果。

2.根据权利要求1所述的方法，其中，所述根据所述标准待识别截图中的文本信息识别结果确定语音识别结果，包括：
根据所述待识别截图中的文本信息的位置确定待识别区域；
对所述标准待识别截图中对应所述待识别区域的文本信息进行识别，得到所述语音识别结果。

3.根据权利要求1所述的方法，其中，所述检测所述语音识别结果与预先获取的语音识别标准内容之间的相似度，得到识别结果相似度检测结果，包括：
解析所述语音识别标准内容的文字长度是否超过预先确定的阈值条件；
响应所述语音识别标准内容的文字长度超过所述阈值条件，对所述语音识别结果中的文字行进行拼接；
比较所述语音识别标准内容与将拼接后得到的文字内容的相似度，得到识别结果相似度检测结果。

4.根据权利要求1所述的方法，其中，所述根据所述标准待识别截图中的文本信息识别结果确定语音识别结果，包括：
采用光学字符识别技术对所述标准待识别截图中包含文本信息的区域进行解析；
根据解析的结果确定所述语音识别结果。

5.根据权利要求1所述的方法，还包括：
采用如所述权利要求1-4任意一项所述的用于检测语音识别结果的方法，获取不同应用的识别结果相似度检测结果；
基于不同应用的识别结果相似度检测结果，生成不同应用的语音识别质量信息。

6.一种用于检测语音识别结果的装置，包括：
界面截图获取单元，被配置成响应于接收到语音信息，指示对语音识别界面进行多次截取，获取界面截图集合；
待识别截图确定单元，被配置成响应于检测到所述界面截图集合中存在具有预先确定的识别特征的界面截图，将具有预先确定的识别特征的界面截图确定为待识...

【专利技术属性】
技术研发人员：孙俊岭，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人