语音响应时间的识别方法及装置制造方法及图纸

技术编号:35586066 阅读:33 留言:0更新日期:2022-11-16 15:00
本申请公开了一种语音响应时间的识别方法及装置。应用于语音识别技术领域。其中,该方法包括:获取对目标设备的显示屏幕进行录制所得到的目标视频,其中,目标视频包括对目标设备输入目标语音指令时显示屏幕上显示的画面;对目标视频中的帧图像进行字符识别,得到第一信息中的首字符出现的第一帧图像,以及第一信息中的尾字符出现的第二帧图像,其中,第一信息是目标设备对目标语音指令进行语音识别所得到的、且显示在显示屏幕上的部分或全部信息;根据第一帧图像对应的第一时间戳和第二帧图像对应的第二时间戳,确定目标设备的语音响应时间。本发明专利技术解决了相关技术中的语音响应时间的识别效率较低的技术问题。间的识别效率较低的技术问题。间的识别效率较低的技术问题。

【技术实现步骤摘要】
语音响应时间的识别方法及装置


[0001]本专利技术涉及计算机领域,具体而言,涉及一种语音响应时间的识别方法及装置。

技术介绍

[0002]相关技术中通常将语音响应时间作为衡量语音识别质量关键指标之一,语音响应时间通常是指发出语音指令到语音指令识别出来的时长,可以通过被识别出的语音指令对应的首字符和尾字符在电子设备的屏幕显示的时刻来确定语音响应时间。目前,当需要对语音响应时间进行对比分析时,通常需要录制多个视频,然后对上述视频通过人工逐帧分析,并记录语音指令对应的首字符和尾字符对应的时间点的方式来分析响应速度。然而,上述方式会导致语音响应时间的识别效率较低。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种语音响应时间的识别方法及装置,以至少解决相关技术中的语音响应时间的识别效率较低的技术问题。
[0005]根据本专利技术实施例的一个方面,提供了一种语音响应时间的识别方法,包括:获取对目标设备的显示屏幕进行录制所得到的目标视频,其中,上述目标视频包括对上述目标设备输入目标语音指令时上述显示屏幕上显示的画面;对上述目标视频中的帧图像进行字符识别,得到第一信息中的首字符出现的第一帧图像,以及上述第一信息中的尾字符出现的第二帧图像,其中,上述第一信息是上述目标设备对上述目标语音指令进行语音识别所得到的、且显示在上述显示屏幕上的部分或全部信息;上述第一信息与第二信息相同,上述第二信息为所述目标语音指令所表示的信息;确定上述第一帧图像对应的第一时间戳和上述第二帧图像对应的第二时间戳,其中,所述第一时间戳和所述第二时间戳用于确定上述目标设备的语音响应时间。
[0006]根据本专利技术实施例的另一方面,还提供了一种语音响应时间的识别装置,包括:获取单元,用于获取对目标设备的显示屏幕进行录制所得到的目标视频,其中,上述目标视频包括对上述目标设备输入目标语音指令时上述显示屏幕上显示的画面;识别单元,用于对上述目标视频中的帧图像进行字符识别,得到第一信息中的首字符出现的第一帧图像,以及上述第一信息中的尾字符出现的第二帧图像,其中,上述第一信息是上述目标设备对上述目标语音指令进行语音识别所得到的、且显示在上述显示屏幕上的部分或全部信息;确定单元,用于确定上述第一帧图像对应的第一时间戳和上述第二帧图像对应的第二时间戳,其中,上述第一时间戳和上述第二时间戳用于确定上述目标设备的语音响应时间。
[0007]根据本专利技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述的语音响应时间的识别方法。
[0008]根据本专利技术实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上
述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的语音响应时间的识别方法。
[0009]在本申请实施例中,通过对目标视频中的帧图像进行字符识别,得到第一信息中的首字符出现的第一帧图像,以及所述第一信息中的尾字符出现的第二帧图像,根据第一帧图像和第二帧图像对应的时间戳来确定出目标设备的语音响应时间。从而避免了人工参与语音响应时间的确认,大大提高目标设备的语音响应时间的识别效率,节省了识别时间,解决了相关技术中的语音响应时间的识别效率较低的技术问题。
附图说明
[0010]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0011]图1是根据本申请实施例的一种可选的语音响应时间的识别方法的应用环境的示意图;
[0012]图2是根据本申请实施例的另一种可选的语音响应时间的识别方法的应用环境的示意图;
[0013]图3是根据本申请实施例的一种可选的语音响应时间的识别方法的流程图;
[0014]图4A是根据本申请实施例的另一种可选的语音响应时间的识别方法的图像显示示意图;
[0015]图4B是根据本申请实施例的一种可选的语音响应时间的识别方法的图像显示示意图;
[0016]图5是根据本申请实例的另一种可选的语音响应时间的识别方法的界面显示示意图;
[0017]图6是根据本申请实施例的一种可选的语音响应时间的识别方法的流程示意图;
[0018]图7是根据本申请实施例的另一种可选的语音响应时间的识别方法的流程示意图;
[0019]图8是根据本申请实施例的又一种可选的语音响应时间的识别方法的流程示意图;
[0020]图9是根据本申请实施例的另一种可选的语音响应时间的识别方法的流程示意图;
[0021]图10是根据本申请实施例的再一种可选的语音响应时间的识别方法的流程示意图;
[0022]图11是根据本申请实施例的又一种可选的语音响应时间的识别方法的界面显示示意图;
[0023]图12是根据本申请实施例的又一种可选的语音响应时间的识别方法的界面显示示意图;
[0024]图13是根据本申请实施例的又一种可选的语音响应时间的识别方法的流程图;
[0025]图14是根据本申请实施例的另一种可选的语音响应时间的识别方法的流程图;
[0026]图15是根据本申请实施例的又一种可选的语音响应时间的识别方法的流程图;
[0027]图16是根据本申请实施例的一种可选的音响应时间的识别装置的结构示意图;
[0028]图17是根据本申请实施例的一种可选的电子设备的结构示意图。
具体实施方式
[0029]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0030]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0031]根据本申请实施例的一个方面,提供了一种语音响应时间的识别方法,可选地,作为一种可选的实施方式,上述一种语音响应时间的识别可以但不限于应用于如图1所示的环境中。该应用环境中包括:与用户进行人机交互的终端设备102、网络104、服务器106,终端设备102可以包括但不限于车载电子设备、手持终端、可穿戴设备、便携本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音响应时间的识别方法,其特征在于,包括:获取对目标设备的显示屏幕进行录制所得到的目标视频,其中,所述目标视频包括对所述目标设备输入目标语音指令时所述显示屏幕上显示的画面;对所述目标视频中的帧图像进行字符识别,得到第一信息中的首字符出现的第一帧图像,以及所述第一信息中的尾字符出现的第二帧图像,其中,所述第一信息是所述目标设备对所述目标语音指令进行语音识别所得到的、且显示在所述显示屏幕上的部分或全部信息,所述第一信息与第二信息相同,所述第二信息为所述目标语音指令所表示的信息;确定所述第一帧图像对应的第一时间戳和所述第二帧图像对应的第二时间戳,其中,所述第一时间戳和所述第二时间戳用于确定所述目标设备的语音响应时间。2.根据权利要求1所述的方法,其特征在于,所述对所述目标视频中的帧图像进行字符识别,得到第一信息中的首字符出现的第一帧图像,以及所述第一信息中的尾字符出现的第二帧图像,包括:对所述目标视频中的帧图像中预设的目标展示区域进行字符识别,分别识别到所述首字符和所述尾字符,并确定所述首字符出现的所述第一帧图像以及所述尾字符出现的所述第二帧图像,其中,所述目标展示区域为展示所述第一信息的区域。3.根据权利要求2所述的方法,其特征在于,所述对所述目标视频中的帧图像中预设的目标展示区域进行字符识别,分别识别到所述首字符和所述尾字符,并确定所述首字符出现的所述第一帧图像以及所述尾字符出现的所述第二帧图像之前,所述方法还包括:确定所述目标设备中的预设区域,其中,所述预设区域用于显示所述目标设备对输入的语音指令进行语音识别得到的信息;将所述预设区域确定为所述目标展示区域。4.根据权利要求1所述的方法,其特征在于,所述对所述目标视频中的帧图像进行字符识别,得到第一信息中的首字符出现的第一帧图像,包括:在所述识别到的字符包括所述第二信息中的首字符、且当前帧图像之前的帧图像中未识别到所述第二信息中的首字符时,将所述识别到的字符中与所述第二信息中的首字符相同的字符确定为所述第一信息中的首字符,并将所述当前帧图像确定为所述第一帧图像。5.根据权利要求1所述的方法,其特征在于,所述对所述目标视频中的帧图像进行字符识别,得到第一信息中的尾字符出现的第二帧图像,包括:在所述识别到的字符包括所述第二信息、且当前帧图像之前的帧图像中未识别到所述第二信息中的尾字符时,将所述识别到的...

【专利技术属性】
技术研发人员:陈姿
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1