实时语音识别方法、服务端及客户端技术

技术编号:23935814 阅读:50 留言:0更新日期:2020-04-25 03:07
本发明专利技术实施例提供一种实时语音识别方法、服务端及客户端,其中方法包括:确定语音识别的当前中间结果;对所述当前中间结果,以及上一中间结果进行差分,得到差分结果;将所述差分结果发送至客户端,以供所述客户端通过合并所述上一中间结果和所述差分结果,得到所述当前中间结果。本发明专利技术实施例提供的方法、服务端及客户端,对当前中间结果以及上一中间结果进行差分,并将差分结果发送至客户端,差分结果的传输和应用,避免了相同内容的重复传输,相比全量传输的方案,缩减了实时语音识别过程中中间结果的传输量的大小,在大量客户端并发的情况下能够明显节省传输资源,实现了流量优化。

Real time speech recognition method, server and client

【技术实现步骤摘要】
实时语音识别方法、服务端及客户端
本专利技术涉及语音识别
,尤其涉及一种实时语音识别方法、服务端及客户端。
技术介绍
随着人工智能技术的不断突破,语音识别技术得到了迅速的发展。当前的语音识别技术,可以在实时解码过程中不断将语音识别的中间结果发送到客户端,让用户感知会话过程中一直有字幕弹出,优化语音识别在实时性方面的体验。为了满足实时性的需求,服务端每次识别出新的词单元,新的词单元之前的信息都可能会被纠正修改,需要将当前句子的所有信息作为中间结果传输至客户端。当中间结果很长时,前后发送的中间结果中重复每次发送的文本字节数最多时达到3K-5K大小,在大量客户端并发的情况下会导致明显的流量浪费。
技术实现思路
本专利技术实施例提供一种实时语音识别方法、服务端及客户端,用以解决现有的实时语音识别过程中中间结果的全量传输导致了不必要的流量浪费的问题。第一方面,本专利技术实施例提供一种实时语音识别方法,包括:确定语音识别的当前中间结果;对所述当前中间结果,以及上一中间结果进行差分,得到差分结果;将所述差分结果发送至客户端,以供所述客户端通过合并所述上一中间结果和所述差分结果,得到所述当前中间结果。优选地,所述对所述当前中间结果,以及上一中间结果进行差分,得到差分结果,具体包括:若满足预设差分条件,则对所述当前中间结果,以及上一中间结果进行差分,得到差分结果;否则,将所述当前中间结果发送至客户端。优选地,所述预设差分条件为所述当前中间结果的数据量大于等于预设差分数据量阈值。优选地,所述对所述当前中间结果,以及上一中间结果进行差分,得到差分结果,具体包括:基于预设差分操作类型,对所述当前中间结果,以及上一中间结果进行差分,得到包含所述预设差分操作类型对应类型标识的差分结果。优选地,所述将所述差分结果发送至客户端,具体包括:将所述差分结果封装在携带有差分标识的数据包中,并将所述数据包发送至所述客户端。第二方面,本专利技术实施例提供一种实时语音识别方法,包括:接收服务端发送的差分结果;所述差分结果为所述服务端对语音识别的当前中间结果,以及上一中间结果进行差分得到的;合并所述上一中间结果和所述差分结果,得到所述当前中间结果。优选地,所述接收服务端发送的差分结果,具体包括:接收并解析所述服务端发送的数据包;若解析得到差分标识,则从所述数据包中提取所述差分结果。优选地,所述合并所述上一中间结果和所述差分结果,得到所述当前中间结果,具体包括:基于所述差分结果中包含的类型标识所对应的预设差分操作类型,合并所述上一中间结果和所述差分结果,得到所述当前中间结果。第三方面,本专利技术实施例提供一种服务端,包括:中间结果识别单元,用于确定语音识别的当前中间结果;差分单元,用于对所述当前中间结果,以及上一中间结果进行差分,得到差分结果;发送单元,用于将所述差分结果发送至客户端,以供所述客户端通过合并所述上一中间结果和所述差分结果,得到所述当前中间结果。第四方面,本专利技术实施例提供一种客户端,包括:接收单元,用于接收服务端发送的差分结果;所述差分结果为所述服务端对语音识别的当前中间结果,以及上一中间结果进行差分得到的;合并单元,用于合并上一中间结果和所述差分结果,得到所述当前中间结果。第五方面,本专利技术实施例提供一种电子设备,包括处理器、通信接口、存储器和总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信,处理器可以调用存储器中的逻辑指令,以执行如第一方面或第二方面所提供的方法的步骤。第六方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面或第二方面所提供的方法的步骤。本专利技术实施例提供的一种实时语音识别方法、服务端及客户端,对当前中间结果以及上一中间结果进行差分,并将差分结果发送至客户端,差分结果的传输和应用,避免了相同内容的重复传输,相比全量传输的方案,缩减了实时语音识别过程中中间结果的传输量的大小,在大量客户端并发的情况下能够明显节省传输资源,实现了流量优化。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的实时语音识别方法的流程示意图;图2为本专利技术实施例提供的差分规则示意图;图3为本专利技术另一实施例提供的实时语音识别方法的流程示意图;图4为本专利技术又一实施例提供的实时语音识别方法的流程示意图;图5为本专利技术再一实施例提供的实时语音识别方法的流程示意图;图6为本专利技术实施例提供的服务端的结构示意图;图7为本专利技术实施例提供的客户端的结构示意图;图8为本专利技术实施例提供的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。当前的语音识别技术,可以在实时解码过程中不断将语音识别的中间结果发送到客户端,以满足用户的实时性需求。每次的中间结果中均包含了例如VAD(VoiceActivityDetection,语音端点检测)、置信度、分词、词属性在内的各种信息。针对任意一次中间结果,该中间结果中不仅包含有较上一中间结果新生成的信息,还包含有大量与上一中间结果相同的信息。例如,任意一次中间结果对应的文本为“尊敬的领导”,该中间结果的上一中间结果对应的文本为“尊敬的”,两次中间结果包含的“尊敬的”所对应的信息是相同的,这一部分信息存在重复传输。在中间结果的传输过程中,前后发送的中间结果可能存在大量重复传输的信息,尤其是当中间结果很长时,每次重复发送的文本字节数多达3K-5K大小,前后两次发送的中间结果的内容重复率高达80%。中间结果中部分内容的重复发送,在大量客户端并发的情况下会导致明显的流量浪费。对此,本专利技术实施例提供了一种实时语音识别方法。图1为本专利技术实施例提供的实时语音识别方法的流程示意图,如图1所示,该方法的执行主体可以是执行实时语音识别的服务端,该方法具体用于在中间结果中部分内容重复发送的场景下,此外,该方法也适用于其余存在大量数据重复方法的实时网络业务场景,本专利技术实施例对此不作具体限定。该方法包括:步骤110,确定语音识别的当前中间结果。具体地,在实时语音识别过程中,当前中间结果即当前时刻对语音数据流进行实时解码,得到的中本文档来自技高网...

【技术保护点】
1.一种实时语音识别方法,其特征在于,包括:/n确定语音识别的当前中间结果;/n对所述当前中间结果,以及上一中间结果进行差分,得到差分结果;/n将所述差分结果发送至客户端,以供所述客户端通过合并所述上一中间结果和所述差分结果,得到所述当前中间结果。/n

【技术特征摘要】
1.一种实时语音识别方法,其特征在于,包括:
确定语音识别的当前中间结果;
对所述当前中间结果,以及上一中间结果进行差分,得到差分结果;
将所述差分结果发送至客户端,以供所述客户端通过合并所述上一中间结果和所述差分结果,得到所述当前中间结果。


2.根据权利要求1所述的实时语音识别方法,其特征在于,所述对所述当前中间结果,以及上一中间结果进行差分,得到差分结果,具体包括:
若满足预设差分条件,则对所述当前中间结果,以及上一中间结果进行差分,得到差分结果;
否则,将所述当前中间结果发送至客户端。


3.根据权利要求2所述的实时语音识别方法,其特征在于,所述预设差分条件为所述当前中间结果的数据量大于等于预设差分数据量阈值。


4.根据权利要求1至3中任一项所述的实时语音识别方法,其特征在于,所述对所述当前中间结果,以及上一中间结果进行差分,得到差分结果,具体包括:
基于预设差分操作类型,对所述当前中间结果,以及上一中间结果进行差分,得到包含所述预设差分操作类型对应类型标识的差分结果。


5.根据权利要求1至3任一项所述的实时语音识别方法,其特征在于,所述将所述差分结果发送至客户端,具体包括:
将所述差分结果封装在携带有差分标识的数据包中,并将所述数据包发送至所述客户端。


6.一种实时语音识别方法,其特征在于,包括:
接收服务端发送的差分结果;所述差分结果为所述服务端对语音识别的当前中间结果,以及上一中间结果进行差分得到的;
合并所述上一中间结果和所述差分结果,得到所述当前中间结果。
...

【专利技术属性】
技术研发人员:张云
申请(专利权)人:安徽听见科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1