基于K歌系统的语音识别方法、介质及系统技术方案

技术编号:20007047 阅读:32 留言:0更新日期:2019-01-05 18:39
本发明专利技术公开了一种基于K歌系统的语音识别方法、介质及系统,方法包括以下步骤:获取用户的语音信息;采用断句算法对语音信息进行处理以识别用户的当前状态,其中,用户的当前状态包括语音交互状态和唱歌状态;当用户的当前状态为唱歌状态时,对语音信息进行截留;当用户的当前状态为语音交互状态时,将语音信息发送至云端服务器,以便云端服务器识别语音信息对应的语音指令;能够实现在没有唤醒词的条件下对用户的语音进行实时识别,达成对用户的交互语音进行精准识别的同时,节约服务器的存储资源和运算资源。

Speech Recognition Method, Media and System Based on K-song System

The invention discloses a speech recognition method, medium and system based on K-song system. The method comprises the following steps: acquiring the voice information of the user; processing the voice information with a sentence-breaking algorithm to identify the current state of the user, in which the current state of the user includes voice interaction state and singing state; and carrying out voice information when the current state of the user is singing state. Interception; when the user's current state is voice interaction state, voice information is sent to the cloud server so that the cloud server can recognize voice instructions corresponding to voice information; it can realize real-time recognition of user's voice without wake-up words, achieve accurate recognition of user's interactive voice, save the storage resources and operation of the server. Calculate resources.

【技术实现步骤摘要】
基于K歌系统的语音识别方法、介质及系统
本专利技术涉及语音识别
,特别涉及一种基于K歌系统的语音识别方法、介质及系统。
技术介绍
语音识别,在现有的智能设备中已得到广泛的应用,例如,手机、智能音箱和智能电视。在现有的智能设备中,用户需要使用智能设备中的语音识别功能时,必须先喊出预先设定的唤醒词以对语音识别功能进行唤醒,以便语音识别功能对后续用户发出的语音进行识别;然而,这种方式至少存在以下缺点:1、在喊出唤醒词之后,系统需要对语音识别功能进行启动之后,用户方可使用相应功能,存在一定延迟;2、用户需要选择合适的唤醒词(不能太常用,也不宜太过简短),并且,在每次使用之前需要喊出设定的唤醒词,这种方式给用户带来很大的不便,且极大地影响用户的智能体验。
技术实现思路
本申请是基于专利技术人对以下问题的认识和研究而做出的:相关技术中,不惜牺牲用户体验,而采用唤醒词进行语音识别功能唤醒的原因在于:若语音识别的过程中无“唤醒词”,则语音识别系统需要对用户输入的所有语音数据进行识别;即言,语音识别系统为了识别所有语音数据中2%的有效语音数据,需要对100%的语音数据进行存储和识别;这种方式虽解决了用户体验和系统延迟的问题,却造成了存储资源和运算资源的极大浪费。本专利技术旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种基于K歌系统的语音识别方法,能够实现在没有唤醒词的条件下对用户的语音进行实时识别,达成对用户的交互语音进行精准识别的同时,节约服务器的存储资源和运算资源。本专利技术的第二个目的在于提出一种计算机可读存储介质。本专利技术的第三个目的在于提出一种K歌系统。为达到上述目的,本专利技术第一方面实施例提出了一种基于K歌系统的语音识别方法,包括以下步骤:获取用户的语音信息;采用断句算法对所述语音信息进行处理以识别所述用户的当前状态,其中,所述用户的当前状态包括语音交互状态和唱歌状态;当所述用户的当前状态为所述唱歌状态时,对所述语音信息进行截留;当所述用户的当前状态为所述语音交互状态时,将所述语音信息发送至云端服务器,以便所述云端服务器识别所述语音信息对应的语音指令。根据本专利技术实施例的基于K歌系统的语音识别方法,首先,获取用户的语音信息;接着,采用断句算法对语音信息进行处理以识别用户的当前状态,其中,用户的当前状态包括语音交互状态和唱歌状态;然后,当用户的当前状态为唱歌状态时,对语音信息进行截留;接着,当用户的当前状态为语音交互状态时,将语音信息发送至云端服务器,以便云端服务器识别语音信息对应的语音指令;从而实现在没有唤醒词的条件下对用户的语音进行实时识别,达成对用户的交互语音进行精准识别的同时,节约服务器的存储资源和运算资源。另外,根据本专利技术上述实施例提出的基于K歌系统的语音识别方法还可以具有如下附加的技术特征:可选地,通过所述K歌系统中的麦克风获取所述用户的语音信息。可选地,获取所述用户的语音信息,包括:实时采集语音信号;当连续第一预设时间的语音信号未处于预设静音阈值区间内时,开始语音录音,直至连续第二预设时间的语音信号处于所述预设静音阈值区间内时,停止语音录音,以将录制的第一语音片段作为所述用户的第一语音信息。可选地,采用断句算法对所述语音信息进行处理以识别所述用户的当前状态,包括:对所述第一语音片段的语音长度进行判断;如果所述语音长度大于第一时间阈值且小于第二时间阈值,则判断所述用户的当前状态为所述语音交互状态;如果所述语音长度大于等于第二时间阈值,则判断所述用户的当前状态为所述唱歌状态。可选地,在开始语音录音后,还当连续第三预设时间的语音信号处于所述预设静音阈值区间内时,停止语音录音,以将录制的第二语音片段作为所述用户的第二语音信息,其中,所述第三预设时间小于所述第二预设时间。可选地,同时,还对所述第二语音片段的语音长度进行判断,其中,如果所述语音长度大于第三时间阈值且小于等于第一时间阈值,则判断所述用户的当前状态为所述语音交互状态;如果所述语音长度大于第一时间阈值,则判断所述用户的当前状态为所述唱歌状态。可选地,所述第一预设时间为100毫秒,所述第二预设时间为1000毫秒,所述第三预设时间为100毫秒。可选地,所述第一时间阈值为1.5秒,所述第二时间阈值为8秒,所述第三时间阈值为0.2秒。为达到上述目的,本专利技术第二方面实施例提出了一种计算机可读存储介质,其上存储有基于K歌系统的语音识别程序,该基于K歌系统的语音识别程序被处理器执行时实现上述的基于K歌系统的语音识别方法。为达到上述目的,本专利技术第三方面实施例提出了一种K歌系统,包括语音输入装置和客户端,所述客户端包括存储器、处理器及存储在存储器上并可在处理器上运行的基于K歌系统的语音识别程序,所述处理器执行所述语音识别程序时实现上述的基于K歌系统的语音识别方法。附图说明图1为根据本专利技术实施例的基于K歌系统的语音识别方法的流程示意图;图2为根据本专利技术另一实施例的基于K歌系统的语音识别方法的流程示意图;图3为根据本专利技术又一实施例的基于K歌系统的语音识别方法的流程示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。在现有的语音识别方法中,多通过设置唤醒词的方式对语音识别功能进行唤醒,以避免现有的无唤醒模式的语音识别方法中,存储资源和运算资源被大量浪费,成本高昂难以实现的弊端;本专利技术实施例提出的基于K歌系统的语音识别方法,首先,获取用户的语音信息;接着,采用断句算法对语音信息进行处理以识别用户的当前状态,其中,用户的当前状态包括语音交互状态和唱歌状态;然后,当用户的当前状态为唱歌状态时,对语音信息进行截留;接着,当用户的当前状态为语音交互状态时,将语音信息发送至云端服务器,以便云端服务器识别语音信息对应的语音指令;从而实现在没有唤醒词的条件下对用户的语音进行实时识别,达成对用户的交互语音进行精准识别的同时,节约服务器的存储资源和运算资源。为了更好的理解上述技术方案,下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。图1为根据本专利技术实施例提出的基于K歌系统的语音识别方法的流程示意图,如图1所示,该基于K歌系统的语音识别方法包括以下步骤:S101,获取用户的语音信息。需要说明的是,K歌系统的设置方式有多种,例如,在KTV中设置服务器、云端服务器、点歌服务端、麦克风以及显示屏以形成K歌系统;或者,通过设置云端服务器,并建立云端服务器与下载了相应程序的用户终端的连接,以形成K歌系统,其中,用户终端可以是手机、电脑、平板电脑或其他智能终端。相应地,获取用户的语音信息的途经可以有多种,例如,在K歌系统用户通过其手机下载相应程序之后,通过该已下载相应程序的手机获取用户的本文档来自技高网...

【技术保护点】
1.一种基于K歌系统的语音识别方法,其特征在于,包括以下步骤:获取用户的语音信息;采用断句算法对所述语音信息进行处理以识别所述用户的当前状态,其中,所述用户的当前状态包括语音交互状态和唱歌状态;当所述用户的当前状态为所述唱歌状态时,对所述语音信息进行截留;当所述用户的当前状态为所述语音交互状态时,将所述语音信息发送至云端服务器,以便所述云端服务器识别所述语音信息对应的语音指令。

【技术特征摘要】
1.一种基于K歌系统的语音识别方法,其特征在于,包括以下步骤:获取用户的语音信息;采用断句算法对所述语音信息进行处理以识别所述用户的当前状态,其中,所述用户的当前状态包括语音交互状态和唱歌状态;当所述用户的当前状态为所述唱歌状态时,对所述语音信息进行截留;当所述用户的当前状态为所述语音交互状态时,将所述语音信息发送至云端服务器,以便所述云端服务器识别所述语音信息对应的语音指令。2.如权利要求1所述的基于K歌系统的语音识别方法,其特征在于,通过所述K歌系统中的麦克风获取所述用户的语音信息。3.如权利要求1或2所述的基于K歌系统的语音识别方法,其特征在于,获取所述用户的语音信息,包括:实时采集语音信号;当连续第一预设时间的语音信号未处于预设静音阈值区间内时,开始语音录音,直至连续第二预设时间的语音信号处于所述预设静音阈值区间内时,停止语音录音,以将录制的第一语音片段作为所述用户的第一语音信息。4.如权利要求3所述的基于K歌系统的语音识别方法,其特征在于,采用断句算法对所述语音信息进行处理以识别所述用户的当前状态,包括:对所述第一语音片段的语音长度进行判断;如果所述语音长度大于第一时间阈值且小于第二时间阈值,则判断所述用户的当前状态为所述语音交互状态;如果所述语音长度大于等于第二时间阈值,则判断所述用户的当前状态为所述唱歌状态。5.如权利要求4所述的基于K歌系统的语音识别方法,其特征在...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:厦门轻唱科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1