用于检测语音识别结果的方法、装置制造方法及图纸

技术编号:26532792 阅读:17 留言:0更新日期:2020-12-01 14:17
本申请公开了用于检测语音识别结果的方法、装置、电子设备及计算机可读存储介质,涉及计算机技术领域、语音识别技术领域、图像处理技术领域、文字识别技术领域和质量评价技术领域。具体实现方案为:响应于接收到语音信息后,指示对语音识别界面进行多次截取,得到界面截图集合,并基于预先确定的识别特征从中确定待识别截图,基于待识别截图的时间戳,从待识别截图中确定标准识别截图,根据该标准识别截图中的文本信息确定语音识别结果,并与预先获取的语音识别标准内容进行比较,得到识别结果相似度检测结果,该方法无需获取语音识别应用的后台代码便可实现语音识别结果的检测,不仅提升了检测效率,还支持对不同应用的识别结果进行检测。

【技术实现步骤摘要】
用于检测语音识别结果的方法、装置
本申请涉及计算机
,具体涉及语音识别
、图像处理
、文字识别
和质量评价
,尤其涉及用于检测语音识别结果的方法、装置、电子设备及计算机可读存储介质。
技术介绍
目前,各类终端设备、应用为了更好的实现人机交互,支持用户采用语音方式发出指令。因该交互过程是基于用户语音指令进行的,并且后续执行的操作需要根据该语音指令中的信息进行确定,因此语音指令中的信息能否被各类终端设备、应用准确的识别显得尤为重要。现有技术中,通常将语音识别结果直接呈现给用户,基于用户的反馈信息实现对语音识别结果的检测。
技术实现思路
本申请提供了一种用于检测语音识别结果的方法、装置、电子设备以及存储介质。第一方面,本申请的实施例提供了一种用于检测语音识别结果的方法,包括:响应于接收到语音信息,指示对语音识别界面进行多次截取,获取界面截图集合;响应于检测到该界面截图集合中存在具有预先确定的识别特征的界面截图,将具有预先确定的识别特征的界面截图确定为待识别截图;基于待识别截图的时间戳,从待识别截图中确定标准待识别截图,根据该标准待识别截图中的文本信息识别结果确定语音识别结果;检测该语音识别结果与预先获取的语音识别标准内容之间的相似度,得到识别结果相似度检测结果。第二方面,本申请的实施例提供了一种用于检测语音识别结果的装置,包括:界面截图获取单元,被配置成响应于接收到语音信息,指示对语音识别界面进行多次截取,获取界面截图集合;待识别截图确定单元,被配置成响应于检测到该界面截图集合中存在具有预先确定的识别特征的界面截图,将具有预先确定的识别特征的界面截图确定为待识别截图;语音识别结果确定单元,被配置成基于待识别截图的时间戳,从待识别截图中确定标准待识别截图,根据该标准待识别截图中的文本信息识别结果确定语音识别结果;识别结果检测单元,被配置成检测该语音识别结果与预先获取的语音识别标准内容之间的相似度,得到识别结果相似度检测结果。第三方面,本申请的实施例提供了一种电子设备,包括:至少一个处理器;以及与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行如第一方面中任一实现方式描述的用于检测语音识别结果的方法。第四方面,本申请的实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,包括:该计算机指令用于使该计算机执行如第一方面中任一实现方式描述的用于检测语音识别结果的方法。本申请在响应接收到语音信息后,指示对语音识别界面进行多次截取得到界面截图集合,基于预先确定的识别特征从该界面截图集合中确定待识别截图,基于待识别截图的时间戳,从待识别截图中确定标准识别截图,根据该标准识别截图中的文本信息确定语音识别结果,并与预先获取的语音识别标准内容进行比较,得到识别结果相似度检测结果,无需获取语音识别应用的后台代码便可实现语音识别结果的检测,不仅提升了检测效率,还支持对不同应用的语音识别结果进行检测。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请的实施例可以应用于其中的示例性系统架构;图2是根据本申请的用于检测语音识别结果的方法的一个实施例的流程图;图3是根据本申请的用于检测语音识别结果的方法的实施例中的界面截图的示意图;图4是根据本申请的用于检测语音识别结果的方法的一个应用场景中录音态界面截图的示意图;图5a是根据本申请的用于检测语音识别结果的方法的一个应用场景中识别态界面截图的示意图;图5b是根据本申请的用于检测语音识别结果的方法的一个应用场景中另一个识别态界面截图的示意图;图6是根据本申请的用于检测语音识别结果的装置的一个实施例的结构示意图;图7是适于用来实现本申请实施例的用于检测语音识别结果的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于检测语音识别结果的方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以实现接收语音识别的结果、发出界面截图等目的。终端设备101、102、103上可以安装有各种支持语音录入功能的应用,例如导航类应用、购物搜索类应用、自助拨号类应用等。终端设备101、102、103可以是硬件,也可以是软件。硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来实现检测语音识别结果),也可以实现成单个软件或软件模块。在此不做具体限定。服务器105可以是提供各种服务的服务器,例如通过网络104从在本申请中接收语音信息的终端设备101、102、103中获取界面截图集合,后续从该界面截图集合中基于预先确定的识别特征确定待识别截图,基于待识别截图的时间戳确定标准待识别截图,并根据该标准待识别截图中的内容确定语音识别结果,检测语音识别结果与预先获取的语音识别标准内容之间的相似度,得到相似度检测结果。需要说明的是,本申请的实施例所提供的用于检测语音识别结果的方法一般由服务器105执行,相应地,用于检测语音识别结果的装置一般设置于服务器105中。需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。此外,用于检测语音识别结果的方法也可以由终端设备101、102、103执行,相应地,用于检测语音识别结果的装置也可以设置于终端设备101、102、103中。此时,示例性系统架构100也可以不包括服务本文档来自技高网...

【技术保护点】
1.一种用于检测语音识别结果的方法,包括:/n响应于接收到语音信息,指示对语音识别界面进行多次截取,获取界面截图集合;/n响应于检测到所述界面截图集合中存在具有预先确定的识别特征的界面截图,将具有预先确定的识别特征的界面截图确定为待识别截图;/n基于所述待识别截图的时间戳,从所述待识别截图中确定标准待识别截图,根据所述标准待识别截图中的文本信息识别结果确定语音识别结果;/n检测所述语音识别结果与预先获取的语音识别标准内容之间的相似度,得到识别结果相似度检测结果。/n

【技术特征摘要】
1.一种用于检测语音识别结果的方法,包括:
响应于接收到语音信息,指示对语音识别界面进行多次截取,获取界面截图集合;
响应于检测到所述界面截图集合中存在具有预先确定的识别特征的界面截图,将具有预先确定的识别特征的界面截图确定为待识别截图;
基于所述待识别截图的时间戳,从所述待识别截图中确定标准待识别截图,根据所述标准待识别截图中的文本信息识别结果确定语音识别结果;
检测所述语音识别结果与预先获取的语音识别标准内容之间的相似度,得到识别结果相似度检测结果。


2.根据权利要求1所述的方法,其中,所述根据所述标准待识别截图中的文本信息识别结果确定语音识别结果,包括:
根据所述待识别截图中的文本信息的位置确定待识别区域;
对所述标准待识别截图中对应所述待识别区域的文本信息进行识别,得到所述语音识别结果。


3.根据权利要求1所述的方法,其中,所述检测所述语音识别结果与预先获取的语音识别标准内容之间的相似度,得到识别结果相似度检测结果,包括:
解析所述语音识别标准内容的文字长度是否超过预先确定的阈值条件;
响应所述语音识别标准内容的文字长度超过所述阈值条件,对所述语音识别结果中的文字行进行拼接;
比较所述语音识别标准内容与将拼接后得到的文字内容的相似度,得到识别结果相似度检测结果。


4.根据权利要求1所述的方法,其中,所述根据所述标准待识别截图中的文本信息识别结果确定语音识别结果,包括:
采用光学字符识别技术对所述标准待识别截图中包含文本信息的区域进行解析;
根据解析的结果确定所述语音识别结果。


5.根据权利要求1所述的方法,还包括:
采用如所述权利要求1-4任意一项所述的用于检测语音识别结果的方法,获取不同应用的识别结果相似度检测结果;
基于不同应用的识别结果相似度检测结果,生成不同应用的语音识别质量信息。


6.一种用于检测语音识别结果的装置,包括:
界面截图获取单元,被配置成响应于接收到语音信息,指示对语音识别界面进行多次截取,获取界面截图集合;
待识别截图确定单元,被配置成响应于检测到所述界面截图集合中存在具有预先确定的识别特征的界面截图,将具有预先确定的识别特征的界面截图确定为待识...

【专利技术属性】
技术研发人员:孙俊岭
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1