语音取号的方法及终端设备技术

技术编号:20005513 阅读:25 留言:0更新日期:2019-01-05 17:55
本发明专利技术适用于语音识别技术领域,提供了一种语音取号的方法及终端设备,所述方法包括:接收用户的语音信号;通过语种识别模型分析所述语音信号,得到所述语音信号的语种信息;对所述语音信号进行识别,获得所述语音信号对应的多个词序列;每个所述词序列包括多个词;根据所述语种信息对应的词库,删除多个所述词序列中包括在所述词库中出现频率为零的词的词序列,将剩下的所述词序列中出现概率最高的词序列确定为所述语音信号的识别结果;提取所述识别结果中的关键字,确定用户办理的业务,并生成所述业务对应的排队票。本发明专利技术通过实现语音取号,提高了排队取号的效率。

Voice Numbering Method and Terminal Equipment

The invention is applicable to the field of speech recognition technology, and provides a method of voice numbering and a terminal device. The method includes: receiving the voice signal of a user; analyzing the voice signal through a language recognition model to obtain the language information of the voice signal; recognizing the voice signal to obtain a plurality of word sequences corresponding to the voice signal; and each word order. Column includes a plurality of words; according to the lexicon corresponding to the linguistic information, delete the lexical sequence including the word sequence with zero occurrence frequency in the lexicon, determine the word sequence with the highest occurrence probability remaining in the lexical sequence as the recognition result of the speech signal; extract the keywords in the recognition result, determine the business performed by the user, and generate the said speech signal. Business queuing tickets. The invention improves the efficiency of queuing by realizing voice numbering.

【技术实现步骤摘要】
语音取号的方法及终端设备
本专利技术属于语音识别
,尤其涉及一种语音取号的方法及终端设备。
技术介绍
现有的排队取号机主要应用于银行、和医院等需要排队等候的场所。顾客在办理业务时,需要在排队取号机的触摸屏上,选择需要办理的业务并取排队票,排队票上面有号码、等候人数、时间、和办理的业务类型等。这时顾客就可以在休息区去等候了,在此期间顾客只需注意显示屏和/或音箱的叫号就行。当顾客看见显示屏显示他的号码和/或听到音箱叫到他的号码时前去办理即可。但是,有些不识字或者语言不通的人,办理业务需要工作人员帮忙取号才能取号,取号效率低。并且当客户较多时,工作人员有限,不能及时帮助客户取号,导致排队取号效率更为低下,客户体验不佳。
技术实现思路
有鉴于此,本专利技术实施例提供了一种语音取号的方法及终端设备,以解决现有技术排队取号效率不高的问题。本专利技术实施例的第一方面提供了一种语音取号的方法,包括:接收用户的语音信号;通过语种识别模型分析所述语音信号,得到所述语音信号的语种信息;对所述语音信号进行识别,获得所述语音信号对应的多个词序列;每个所述词序列包括多个词;根据所述语种信息对应的词库,删除多个所述词序列中包括在所述词库中出现频率为零的词的词序列,将剩下的所述词序列中出现概率最高的词序列确定为所述语音信号的识别结果;提取所述识别结果中的关键字,确定用户办理的业务,并生成所述业务对应的排队票。本专利技术实施例的第二方面提供了一种终端设备,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如下步骤:接收用户的语音信号;通过语种识别模型分析所述语音信号,得到所述语音信号的语种信息;对所述语音信号进行识别,获得所述语音信号对应的多个词序列;每个所述词序列包括多个词;根据所述语种信息对应的词库,删除多个所述词序列中包括在所述词库中出现频率为零的词的词序列,将剩下的所述词序列中出现概率最高的词序列确定为所述语音信号的识别结果;提取所述识别结果中的关键字,确定用户办理的业务,并生成所述业务对应的排队票。本专利技术实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:接收用户的语音信号;通过语种识别模型分析所述语音信号,得到所述语音信号的语种信息;对所述语音信号进行识别,获得所述语音信号对应的多个词序列;每个所述词序列包括多个词;根据所述语种信息对应的词库,删除多个所述词序列中包括在所述词库中出现频率为零的词的词序列,将剩下的所述词序列中出现概率最高的词序列确定为所述语音信号的识别结果;提取所述识别结果中的关键字,确定用户办理的业务,并生成所述业务对应的排队票。本专利技术实施例中,通过识别用户语音信号的语种,并获取用户语音信号对应的多个词序列,进而获取语种词库,根据词库获得语音识别结果,从而实现取号终端设备的全自动语音取号,提高了排队取号的效率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种语音取号的方法的实现流程图;图2是本专利技术实施例提供的另一种语音取号的方法的实现流程图;图3是本专利技术实施例提供的另一种语音取号的方法的实现流程图;图4是本专利技术实施例提供的另一种语音取号的方法的实现流程图;图5是本专利技术实施例提供的一种语音取号的装置的结构框图;图6是本专利技术实施例提供的终端设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。图1示出了本专利技术实施例提供的语音取号的方法的实现流程,该方法流程包括步骤S101至S105。该方法适用于利用需要进行语音取号的情形。该方法由语音取号的装置执行,所述语音取号的装置配置于终端设备,可由软件和/或硬件实现。终端设备包括排队取号机等取号终端。各步骤的具体实现原理如下。S101,接收用户的语音信号。本专利技术实施例中,用户为利用终端设备排队取号的用户。终端设备包括麦克风等收音设备,终端设备通过收音设备获取用户的语音信号。示例性地,当轮到某用户取号时,终端设备感应到某距离内有人,或者接收到用户点击终端设备屏幕中任一区域的触发信号,控制终端设备的收音设备开启,此时,用户若发出例如“我要办理现金业务”或“我要办理转账业务”等语音,终端设备通过收音设备获取用户的语音信号。S102,通过语种识别模型分析所述语音信号,得到所述语音信号的语种信息。本专利技术实施例中,语种识别模型为基于机器学习技术,通过大量的语音样本预先训练好的用于语种识别的模型,语音样本包括语音信号及其对应的语种信息,语种信息覆盖各待识别的语种类型。用于语种识别的模型可以为深度学习模型,例如卷积神经网络(ConvolutionalNeuralNetwork,CNN)模型,循环神经网络(RecurrentNeuralNetwork,RNN)模型、或长短期记忆网络(LongShortTermMemory,LSTM)模型等。作为本专利技术一实施例,将用户的语音信号作为语种识别模型的输入,通过语种识别模型便可以得到语音信号的语种信息。在这种情况下,语种识别模型优选为RNN模型。此外,也可以先将所述语音信号转换成预设格式的语音信号,再将转换成预设格式的语音信号作为语种识别模型的输入,通过语种识别模型便可以得到语音信号的语种信息。作为本专利技术另一实施例,将所述语音信号转换成预设格式的语音信号,并对转换成预设格式的所述语音信号进行预处理,利用预处理后的所述语音信号,通过语种识别模型,得到所述语音信号的语种信息。在这种情况下,语种识别模型优选为RNN模型或LSTM模型。其中,由于不同的终端设备,获取的语音信号的文件格式不尽相同,如MP3文件格式、MP4文件格式、AMR文件格式、或WAV文件格式等。本专利技术实施例中,首先将语音信号转换成预设格式的语音信号,然后对转换成预设格式的所述语音信号进行预处理。预设格式的语音信号优选为WAV文件格式。WAV文件里存储的除了文件头之外,就是用户语音每个采样点的采样数据,WAV文件不采用压缩技术,用户语音的采样数据很容易被读出来,便于进行后续的过程,易于实现。需要说明的是,在将所述语音信号转换成预设格式的语音信号后,还可以先对所述语音信号进行滤波处理,再进行预处理过程。本专利技术实施例中WAV文件格式的用户语音信号为经过数字化处理的语音信号,对采集的用户的语音信号,进行滤波处理,滤除50Hz的电源干扰,滤波采用带通滤波器,其上下截止频率分别为fH和fL,生成滤波后的语音信号,fH=4500Hz或8000Hz,fL=60Hz。进一步地,对转换成预设格式的所述语音信号进行预处理,包括预本文档来自技高网...

【技术保护点】
1.一种语音取号的方法,其特征在于,包括:接收用户的语音信号;通过语种识别模型分析所述语音信号,得到所述语音信号的语种信息;对所述语音信号进行识别,获得所述语音信号对应的多个词序列;每个所述词序列包括多个词;根据所述语种信息对应的词库,删除多个所述词序列中包括在所述词库中出现频率为零的词的词序列,将剩下的所述词序列中出现概率最高的词序列确定为所述语音信号的识别结果;提取所述识别结果中的关键字,确定用户办理的业务,并生成所述业务对应的排队票。

【技术特征摘要】
1.一种语音取号的方法,其特征在于,包括:接收用户的语音信号;通过语种识别模型分析所述语音信号,得到所述语音信号的语种信息;对所述语音信号进行识别,获得所述语音信号对应的多个词序列;每个所述词序列包括多个词;根据所述语种信息对应的词库,删除多个所述词序列中包括在所述词库中出现频率为零的词的词序列,将剩下的所述词序列中出现概率最高的词序列确定为所述语音信号的识别结果;提取所述识别结果中的关键字,确定用户办理的业务,并生成所述业务对应的排队票。2.如权利要求1所述的方法,其特征在于,通过语种识别模型分析所述语音信号,得到所述语音信号的语种信息,包括:将所述语音信号转换成预设格式的语音信号,并对转换成预设格式的所述语音信号进行预处理,通过语种识别模型分析预处理后的所述语音信号,得到所述语音信号的语种信息。3.如权利要求2所述的方法,其特征在于,所述对转换成预设格式的所述语音信号进行预处理,包括:对转换成预设格式的语音信号进行分帧处理得到N帧子信号;其中,N为正整数;提取每帧所述子信号的声学特征构成声学特征向量;组合N帧所述子信号的所述声学特征向量构成观察矩阵DETECT。4.如权利要求3所述的方法,其特征在于,所述对所述语音信号进行识别,获得所述语音信号对应的多个词序列,包括:分别将每帧所述子信号的所述声学特征向量输入声学模型得到每帧所述子信号对应的概率排名靠前的若干个音素;将N帧所述子信号对应的音素按照帧的时间先后顺序进行排序,构建成多个词序列。5.如权利要求3所述的方法,其特征在于,所述对转换成预设格式的语音信号进行分帧处理得到N帧子信号之后,还包括:计算每帧所述子信号的短时能量和过零率,基于所述短时能量和所述过零率确定N帧所述子信号中的静音帧,切除所述静音帧,得到包括剩余帧的所述语音信号;相应的,提取每帧所述子信号的声学特征构成声学特征向量;组合N帧所述子信号的所述声学特征向量构成观察矩阵DETECT,包括:提取剩余帧中每帧所述子信号的声学特征构成声学特征向量;组合剩余帧中每帧所述子信号的所述声学特征向量构成观察矩阵DETECT。6.如权利要求5所述的方法,其特征...

【专利技术属性】
技术研发人员:袁启凤
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1