实时语音识别方法、服务端及客户端技术

技术编号：23935814 阅读：50 留言：0更新日期：2020-04-25 03:07

本发明专利技术实施例提供一种实时语音识别方法、服务端及客户端，其中方法包括：确定语音识别的当前中间结果；对所述当前中间结果，以及上一中间结果进行差分，得到差分结果；将所述差分结果发送至客户端，以供所述客户端通过合并所述上一中间结果和所述差分结果，得到所述当前中间结果。本发明专利技术实施例提供的方法、服务端及客户端，对当前中间结果以及上一中间结果进行差分，并将差分结果发送至客户端，差分结果的传输和应用，避免了相同内容的重复传输，相比全量传输的方案，缩减了实时语音识别过程中中间结果的传输量的大小，在大量客户端并发的情况下能够明显节省传输资源，实现了流量优化。

Real time speech recognition method, server and client

全部详细技术资料下载

【技术实现步骤摘要】
实时语音识别方法、服务端及客户端
本专利技术涉及语音识别
，尤其涉及一种实时语音识别方法、服务端及客户端。
技术介绍
随着人工智能技术的不断突破，语音识别技术得到了迅速的发展。当前的语音识别技术，可以在实时解码过程中不断将语音识别的中间结果发送到客户端，让用户感知会话过程中一直有字幕弹出，优化语音识别在实时性方面的体验。为了满足实时性的需求，服务端每次识别出新的词单元，新的词单元之前的信息都可能会被纠正修改，需要将当前句子的所有信息作为中间结果传输至客户端。当中间结果很长时，前后发送的中间结果中重复每次发送的文本字节数最多时达到3K-5K大小，在大量客户端并发的情况下会导致明显的流量浪费。
技术实现思路
本专利技术实施例提供一种实时语音识别方法、服务端及客户端，用以解决现有的实时语音识别过程中中间结果的全量传输导致了不必要的流量浪费的问题。第一方面，本专利技术实施例提供一种实时语音识别方法，包括：确定语音识别的当前中间结果；对所述当前中间结果，以及上一中间结果进行差分，得到差分结果；将所述差分结果发送至客户端，以供所述客户端通过合并所述上一中间结果和所述差分结果，得到所述当前中间结果。优选地，所述对所述当前中间结果，以及上一中间结果进行差分，得到差分结果，具体包括：若满足预设差分条件，则对所述当前中间结果，以及上一中间结果进行差分，得到差分结果；否则，将所述当前中间结果发送至客户端。优选地，所述预设差分条件为所述当前中间...

【技术保护点】
1.一种实时语音识别方法，其特征在于，包括：/n确定语音识别的当前中间结果；/n对所述当前中间结果，以及上一中间结果进行差分，得到差分结果；/n将所述差分结果发送至客户端，以供所述客户端通过合并所述上一中间结果和所述差分结果，得到所述当前中间结果。/n

【技术特征摘要】
1.一种实时语音识别方法，其特征在于，包括：
确定语音识别的当前中间结果；
对所述当前中间结果，以及上一中间结果进行差分，得到差分结果；
将所述差分结果发送至客户端，以供所述客户端通过合并所述上一中间结果和所述差分结果，得到所述当前中间结果。

2.根据权利要求1所述的实时语音识别方法，其特征在于，所述对所述当前中间结果，以及上一中间结果进行差分，得到差分结果，具体包括：
若满足预设差分条件，则对所述当前中间结果，以及上一中间结果进行差分，得到差分结果；
否则，将所述当前中间结果发送至客户端。

3.根据权利要求2所述的实时语音识别方法，其特征在于，所述预设差分条件为所述当前中间结果的数据量大于等于预设差分数据量阈值。

4.根据权利要求1至3中任一项所述的实时语音识别方法，其特征在于，所述对所述当前中间结果，以及上一中间结果进行差分，得到差分结果，具体包括：
基于预设差分操作类型，对所述当前中间结果，以及上一中间结果进行差分，得到包含所述预设差分操作类型对应类型标识的差分结果。

5.根据权利要求1至3任一项所述的实时语音识别方法，其特征在于，所述将所述差分结果发送至客户端，具体包括：
将所述差分结果封装在携带有差分标识的数据包中，并将所述数据包发送至所述客户端。

6.一种实时语音识别方法，其特征在于，包括：
接收服务端发送的差分结果；所述差分结果为所述服务端对语音识别的当前中间结果，以及上一中间结果进行差分得到的；
合并所述上一中间结果和所述差分结果，得到所述当前中间结果。
...

【专利技术属性】
技术研发人员：张云，
申请(专利权)人：安徽听见科技有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人