一种基于语音识别的售票方法及售票系统技术方案

技术编号:34951049 阅读:29 留言:0更新日期:2022-09-17 12:28
本发明专利技术提出一种基于语音识别的售票方法及售票系统,通过摄像头检测拍摄画面内是否存在大小、朝向以及停留时间符合预设条件的人脸图像,所述人脸图像包含嘴形图像,通过麦克风获取用户输入的语音信号,根据所述嘴形图像的变化确定用户输入的语音信号的起点和终点,对所述语音信号执行去噪,从去噪后的语音信号中提取用户的声音数据,对所述声音数据执行语音识别得到所述声音数据对应的文字内容,根据所述文字内容生成并显示票据信息,解决了公共场合的环境噪音导致语音识别成功率低的问题。合的环境噪音导致语音识别成功率低的问题。合的环境噪音导致语音识别成功率低的问题。

【技术实现步骤摘要】
一种基于语音识别的售票方法及售票系统


[0001]本专利技术涉及自助售票
,特别涉及一种基于语音识别的售票方法及售票系统。

技术介绍

[0002]为了缓解人工售票窗口的售票压力、解决人流拥挤和排队的问题以及提高售票效率,大量的公共服务场所例如电影院、地铁站、火车站以及长途汽车站等均布置有大量的自助售票设备提供给人们自助购票。使用自助售票机购票的好处在于即买即用,不会因临时改变行程而带来需要退票的问题,同时还可以随时可向现场工作人员提出咨询和请求协助。然而自助售票机存在文字输入比较困难,需要按照引导一步一步操作的问题,使其便利性大打折扣。对于一些年龄较大或者识字较少的群体,使用自助售票机进行购票比较困难。近些年出现的具有语音识别功能的自助售票机解决了这个痛点,通过语音输入所需购票的关键信息如入场或入站的时间、想要观看的电影或目标站点等即可快速定位需要购买电影票或者车票,操作简单且缩短了购票所需要耗费的时间。但是,由于自助售票机一般安装于人流较大的公共场合,环境噪音非常严重,对语音识别效果产生极大的影响,有时候需要用户大声重复数遍才能成功识别,失去了输入效率高的优势。

技术实现思路

[0003]本专利技术正是基于上述问题,提出了一种基于语音识别的售票方法及售票系统,解决了公共场合的环境噪音导致语音识别成功率低的问题。
[0004]有鉴于此,本专利技术的第一方面提出了一种基于语音识别的售票方法,包括:
[0005]通过摄像头检测拍摄画面内是否存在大小、朝向以及停留时间符合预设条件的人脸图像,所述人脸图像包含嘴形图像;
[0006]通过麦克风获取用户输入的语音信号;
[0007]根据所述嘴形图像的变化确定用户输入的语音信号的起点和终点;
[0008]对所述语音信号执行去噪;
[0009]从去噪后的语音信号中提取用户的声音数据;
[0010]对所述声音数据执行语音识别得到所述声音数据对应的文字内容;
[0011]根据所述文字内容生成并显示票据信息。
[0012]进一步的,在上述的基于语音识别的售票方法中,在通过麦克风获取用户输入的语音信号的步骤之前,还包括:
[0013]通过所述麦克风持续监听环境声音信息;
[0014]分析所述环境声音信息中是否存在周期性噪声以及与所述周期性噪音对应的回音噪声;
[0015]若存在所述周期性噪声,提取所述周期性噪声的时间特征和频谱特征;
[0016]若存在与所述周期性噪音对应的回音噪声,提取所述回音噪声的时间特征和频谱
特征。
[0017]进一步的,在上述的基于语音识别的售票方法中,对所述语音信号执行去噪的步骤具体包括:
[0018]若存在所述周期性噪声,根据所述周期性噪声的时间特征和频谱特征生成所述周期性噪声对应的第一反相波形;
[0019]若存在与所述周期性噪音对应的回音噪声,根据所述回音噪声的时间特征和频谱特征生成所述回音噪声对应的第二反相波形;
[0020]将所述语音信号、所述第一反相波形和/或所述第二反相波形输入到反相降噪函数中以抵消所述周期性噪声和/或所述回音噪声。
[0021]进一步的,在上述的基于语音识别的售票方法中,根据所述嘴形图像的变化确定用户输入的语音信号的起点和终点的步骤具体包括:
[0022]从所述摄像头拍摄的具有人脸图像的每一帧画面图像中提取嘴形图像;
[0023]将每一帧画面图像中的嘴形图像与在先间隔帧数为n的具有人脸图像的画面图像中的嘴形图像进行对比,其中n为大于或等于1的正整数;
[0024]判断用户的嘴形是否从闭合状态改变为张开状态;
[0025]以所述用户的嘴形第一次从闭合状态改变为张开状态的画面图像对应的时间点为所述语音信号的起点;
[0026]判断用户的嘴形是否从张开状态改变为闭合状态且保持闭合状态的时间超过预设的第一阈值;
[0027]以所述用户的嘴形最后一次的从张开状态改变为闭合状态的时间点为所述语音信号的终点。
[0028]进一步的,在上述的基于语音识别的售票方法中,对所述语音信号执行去噪的步骤还包括:
[0029]获取所述用户的嘴形每一次从闭合状态改变为张开状态以及从张开状态改变为闭合状态的时间点,以获取所述用户的嘴形为张开状态以及闭合状态对应的时间段;
[0030]从所述语音信号中剔除在所述用户嘴形为闭合状态的时间段内短时能量超过预设的第二阈值的声音信号。
[0031]进一步的,在上述的基于语音识别的售票方法中,从去噪后的语音信号中提取用户的声音数据的步骤具体包括:
[0032]将去噪后的语音信号输入到削波函数中获取用户声音的准基音周期;
[0033]将所述准基音周期与所述语音信号输入到声音波形拟合函数中拟合用户的声音波形;
[0034]根据拟合结果从所述语音信号中提取用户的声音数据。
[0035]进一步的,在上述的基于语音识别的售票方法中,所述准基音周期由基音周期值及其误差范围值组成。
[0036]进一步的,在上述的基于语音识别的售票方法中,将去噪后的语音信号输入到削波函数中获取用户声音的准基音周期的步骤具体包括:
[0037]确定所述用户的声音数据的声音波形中的最大峰值;
[0038]取所述最大峰值与所述声音波形在所述用户的嘴形为张开状态时间段的峰值平
均值的平均数为削波电平;
[0039]将所述声音波形与所述削波电平输入削波函数得到峰值波形;
[0040]确定所述峰值波形是否存在不符合误差值不大于第三阈值的周期性规律的波形;
[0041]确定为是时,将所述削波电平向上微调继续执行将所述声音波形与所述削波电平输入削波函数得到峰值波形的步骤;
[0042]确定为否时,根据所述峰值波形计算得到所述基音周期值及其误差范围值。
[0043]进一步的,在上述的基于语音识别的售票方法中,将所述准基音周期与所述语音信号输入到声音波形拟合函数中拟合用户的声音波形的步骤具体包括:
[0044]将所述基音周期值输入到自相关函数;
[0045]调整所述自相关函数的系数以及在所述误差值范围内微调所述基音周期值以生成对应的谐波波形;
[0046]将所述谐波波形与所述语音信号的声音波形进行匹配;
[0047]根据匹配结果确定用户的声音波形。
[0048]本专利技术的第二方面提出了一种售票系统,包括用于获取用户人脸图形及其嘴形图像的摄像头、用于监听环境噪音以及用户语音信号的麦克风、用于接收用户触控输入的触控屏幕、用于存储计算机程序的存储器以及处理器,所述处理器用于执行所述计算机程序实现上述第一方面中任一所述的基于语音识别的售票方法。
[0049]本专利技术提出一种基于语音识别的售票方法及售票系统,通过摄像头检测拍摄画面内是否存在大小、朝向以及停留时间符合预设条件的人脸图像,所述人脸图像包含嘴形图像,通过麦克风获取用户输入本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语音识别的售票方法,其特征在于,包括:通过摄像头检测拍摄画面内是否存在大小、朝向以及停留时间符合预设条件的人脸图像,所述人脸图像包含嘴形图像;通过麦克风获取用户输入的语音信号;根据所述嘴形图像的变化确定用户输入的语音信号的起点和终点;对所述语音信号执行去噪;从去噪后的语音信号中提取用户的声音数据;对所述声音数据执行语音识别得到所述声音数据对应的文字内容;根据所述文字内容生成并显示票据信息。2.根据权利要求1所述的基于语音识别的售票方法,其特征在于,在通过麦克风获取用户输入的语音信号的步骤之前,还包括:通过所述麦克风持续监听环境声音信息;分析所述环境声音信息中是否存在周期性噪声以及与所述周期性噪音对应的回音噪声;若存在所述周期性噪声,提取所述周期性噪声的时间特征和频谱特征;若存在与所述周期性噪音对应的回音噪声,提取所述回音噪声的时间特征和频谱特征。3.根据权利要求2所述的基于语音识别的售票方法,其特征在于,对所述语音信号执行去噪的步骤具体包括:若存在所述周期性噪声,根据所述周期性噪声的时间特征和频谱特征生成所述周期性噪声对应的第一反相波形;若存在与所述周期性噪音对应的回音噪声,根据所述回音噪声的时间特征和频谱特征生成所述回音噪声对应的第二反相波形;将所述语音信号、所述第一反相波形和/或所述第二反相波形输入到反相降噪函数中以抵消所述周期性噪声和/或所述回音噪声。4.根据权利要求3所述的基于语音识别的售票方法,其特征在于,根据所述嘴形图像的变化确定用户输入的语音信号的起点和终点的步骤具体包括:从所述摄像头拍摄的具有人脸图像的每一帧画面图像中提取嘴形图像;将每一帧画面图像中的嘴形图像与在先间隔帧数为n的具有人脸图像的画面图像中的嘴形图像进行对比,其中n为大于或等于1的正整数;判断用户的嘴形是否从闭合状态改变为张开状态;以所述用户的嘴形第一次从闭合状态改变为张开状态的画面图像对应的时间点为所述语音信号的起点;判断用户的嘴形是否从张开状态改变为闭合状态且保持闭合状态的时间超过预设的第一阈值;以所述用户的嘴形最后一次的从张开状态改变为闭合状态的时间点为所述语音信号的终点。5.根据权利要求4所述的基于语音识别的售票方法,其特征在于,对所述语音信号执行...

【专利技术属性】
技术研发人员:王晨光周帅杨国荣晏承彬
申请(专利权)人:深圳市智远联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1