当前位置: 首页 > 专利查询>彭玲玲专利>正文

一种用于语音指令捕捉的信号精确度调节系统技术方案

技术编号:30152884 阅读:16 留言:0更新日期:2021-09-25 15:02
本发明专利技术公开了一种用于语音指令捕捉的信号精确度调节系统及方法,系统包括语音指令样本库实时更新模块、指令分段采集单元、采集单元识别指令分析匹配模块、样本库指令智能匹配模块和非限定语音指令信号人工捕捉训练模块,语音指令样本库实时更新模块对新更新的语音指令实时上传到语音指令样本库中进行存储,指令分段采集单元用于对用户输入的语音指令进行片段化采集,智能识别当前用户识别的语音指令,采集单元识别指令分析匹配模块用于对不同采集模块采集的语音指令进行识别匹配分析,样本库指令智能匹配模块将采集筛选出的语音指令与样本库进行匹配,非限定语音指令信号人工捕捉训练模块用于对采集的未在样本库中的语音指令进行捕捉训练。音指令进行捕捉训练。音指令进行捕捉训练。

【技术实现步骤摘要】
一种用于语音指令捕捉的信号精确度调节系统


[0001]本专利技术涉及语音识别
,具体为一种用于语音指令捕捉的信号精确度调节系统。

技术介绍

[0002]语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用,例如在翼卡车联网中,只需按一键通客服人员口述即可设置目的地直接导航,安全、便捷。
[0003]根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别,关键词识别和连续语音识别。其中,孤立词识别 的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现。
[0004]根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。
[0005]语音识别的应用领域非常广泛,常见的应用系统有:语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务。
[0006]语音识别主要有以下五个问题:对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则;语音信息量大。语音模式不仅对不同的说话人不同,对同一说话人也是不同的,例如,一个说话人在随意说话和认真说话时的语音信息是不同的。一个人的说话方式随着时间变化。语音的模糊性。说话者在讲话时,不同的词可能听起来是相似的。这在英语和汉语中常见。单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等。环境噪声和干扰对语音识别有严重影响,致使识别率低。
[0007]目前,在语音指令识别时很容易导致语音指令识别不清晰的情况出现,但在现在语音输入时,设备往往只对语音进行识别,而本申请旨在对语音和用户唇语通过录音和录像分段进行识别分析,提高语音指令信号的精确度。

技术实现思路

[0008]本专利技术的目的在于提供一种用于语音指令捕捉的信号精确度调节系统及方法,以解决上述
技术介绍
中提出的问题。
[0009]为了解决上述技术问题,本专利技术提供如下技术方案:一种用于语音指令捕捉的信号精确度调节系统及方法,系统包括语音指令样本库实时更新模块、指令分段采集单元、采集单元识别指令分析匹配模块、样本库指令智能匹配模块和非限定语音指令信号人工捕捉训练模块,其中,语音指令样本库实时更新模块、指令分段采集单元、采集单元识别指令分析匹配模块、样本库指令智能匹配模块和非限定语音指令信号人工捕捉训练模块依次通过内网连接,样本库指令智能匹配模块和非限定语音指令信号人工捕捉训练模块分别和语音指令样本库实时更新模块通过内网连接;所述语音指令样本库实时更新模块用于对新更新的语音指令实时上传到语音指令样本库中进行存储,将存储的语音指令反馈给系统平台用于方便用户查看,指令分段采集单元用于对用户输入的语音指令进行片段化采集,智能识别当前用户识别的语音指令,采集单元识别指令分析匹配模块用于对不同采集模块采集的语音指令进行识别匹配,分析采集的不同指令的匹配率,样本库指令智能匹配模块将采集筛选出的语音指令与样本库进行匹配,确认当前样本库是否存在该语音指令,非限定语音指令信号人工捕捉训练模块用于对采集的未在样本库中的语音指令进行捕捉训练。
[0010]通过采用上述技术方案:所述语音指令样本库实时更新模块包括更新指令样本关键词汇输入子模块和指令样本关键词汇汇总反馈子模块,更新指令样本关键词汇输入子模块用于将训练输出的语音指令实时输入样本库中进行更新,对样本库内的语音指令模板进行扩充,指令样本关键词汇汇总反馈子模块用于对语音指令样本库的内部的语音指令进行汇总,将汇总后的语音指令反馈给系统平台,用户根据汇总后的语音指令集合对相应设备发送语音指令进行控制。
[0011]通过采用上述技术方案:所述指令分段采集单元包括指令第一语音采集单元和指令第二视频采集单元,指令第一语音采集单元用于对用户发出的语音指令进行录音,对录音文件进行分段化切割,对每一分段进行语音识别,指令第二视频采集单元用于对用户发出语音指令时进行录像,对录像视频进行分段切割,对每一分段录像视频进行唇语识别,将语音识别和唇语识别出的指令信息进行分别按照不同分段进行汇总,其中,录音文件和录像文件按照同一时间片段进行切割,将语音识别和唇语识别后的分段数据分别进行标记,将标记后的数据发送至采集单元识别指令分析匹配模块。
[0012]通过采用上述技术方案:所述采集单元识别指令分析匹配模块包括片段化识别指令匹配率分析子模块和二次识别调整匹配子模块,片段化识别指令匹配率分析子模块按照指令第一语音采集单元和指令第二视频采集单元采集的的分段式录音和录像文件进行识别,将同一时间分段的语音识别和唇语识别的数据进行匹配,对每一分段的语音和唇语识别数据的匹配率分析,二次识别调整匹配子模块用于在首次匹配率不满足要求时,对指令第一语音采集单元和指令第二视频采集单元采集语音文件和视频文件重新按照时间进行分段,对分段后的录音文件和录像文件分别重新进行语音识别和唇语识别,对重新识别的数据进行匹配分析。
[0013]通过采用上述技术方案:所述片段化识别指令匹配率分析子模块用于对采集的语
音文件和录像文件分别进行分段化语音识别和唇语识别,对同一时间分段的语音识别数据和唇语识别数据按照分段内关键词和分段解释内容进行匹配,设定当前不同分段的语音识别数据和唇语识别数据关键词匹配率为F1%,分段解释内容匹配率为F2%,设定关键词匹配率占比为Pm%,分段解释内容匹配率占比为Pn%,设定某一时间分段内语音识别数据和唇语识别数据的综合匹配度为F0,满足公式:计算得出当前时间分段内语音识别数据和唇语识别数据的综合匹配度,逐一计算出采集语音文件和录像文件不同时间分段的综合匹配度为F01、F02、F03、

、F0
n
‑1、F0
n
,设定采集的语音指令总匹配度满足以下公式:当采集的语音指令不同分段集合的总匹配度满足上述公式,判定该语音指令匹配度合格,发送至样本库进行匹配,当采集的语音指令不同分段集合的总匹配度不满足上述公式,判定该语音指令匹配度不合格,该语音指令发送至二次识别调整匹配子模块,对指令第一语音采集单本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于语音指令捕捉的信号精确度调节系统,其特征在于:所述系统包括语音指令样本库实时更新模块、指令分段采集单元、采集单元识别指令分析匹配模块、样本库指令智能匹配模块和非限定语音指令信号人工捕捉训练模块,其中,语音指令样本库实时更新模块、指令分段采集单元、采集单元识别指令分析匹配模块、样本库指令智能匹配模块和非限定语音指令信号人工捕捉训练模块依次通过内网连接,样本库指令智能匹配模块和非限定语音指令信号人工捕捉训练模块分别和语音指令样本库实时更新模块通过内网连接;所述语音指令样本库实时更新模块用于对新更新的语音指令实时上传到语音指令样本库中进行存储,将存储的语音指令反馈给系统平台用于方便用户查看,指令分段采集单元用于对用户输入的语音指令进行片段化采集,智能识别当前用户识别的语音指令,采集单元识别指令分析匹配模块用于对不同采集模块采集的语音指令进行识别匹配,分析采集的不同指令的匹配率,样本库指令智能匹配模块将采集筛选出的语音指令与样本库进行匹配,确认当前样本库是否存在该语音指令,非限定语音指令信号人工捕捉训练模块用于对采集的未在样本库中的语音指令进行捕捉训练;所述语音指令样本库实时更新模块包括更新指令样本关键词汇输入子模块和指令样本关键词汇汇总反馈子模块,更新指令样本关键词汇输入子模块用于将训练输出的语音指令实时输入样本库中进行更新,对样本库内的语音指令模板进行扩充,指令样本关键词汇汇总反馈子模块用于对语音指令样本库的内部的语音指令进行汇总,将汇总后的语音指令反馈给系统平台,用户根据汇总后的语音指令集合对相应设备发送语音指令进行控制;所述采集单元识别指令分析匹配模块包括片段化识别指令匹配率分析子模块和二次识别调整匹配子模块,片段化识别指令匹配率分析子模块按照指令第一语音采集单元和指令第二视频采集单元采集的的分段式录音和录像文件进行识别,将同一时间分段的语音识别和唇语识别的数据进行匹配,对每一分段的语音和唇语识别数据的匹配率分析,二次识别调整匹配子模块用于在首次匹配率不满足要求时,对指令第一语音采集单元和指令第二视频采集单元采集语音文件和视频文件重新按照时间进行分段,对分段后的录音文件和录像文件分别重新进行语音识别和唇语识别,对重新识别的数据进行匹配分析。2.根据权利要求1所述的一种用于语音指令捕捉的信号精确度调节系统,其特征在于:所述片段化识别指令匹配率分析子模块用于对采集的语音文件和录像文件分别进行分段化语音识别和唇语识别,对同一时间分段的语音识别数据和唇语识别数据按照分段内关键词和分段解释内容进行匹配,设定当前不同分段的语音识别数据和唇语识别数据关键词匹配率为F1%,分段解释内容匹配率为F2%,设定关键词匹配率占比为Pm%,分段解释内容匹配率占比为Pn%,设定某一时间分段内语音识别数据和唇语识别数据的综合匹配度为F0,满足公式:计算得出当前时间分段内语音识别数据和唇语识别数据的综合匹配度,逐一计算出采集语音文件和录像文件不同时间分段的综合匹配度为F01、F02、F03、

、F0
n
‑1、F0
n
,设定采集的语音指令总匹配度满足以下公式:
其中,n为所采集不同时间段语音文件和录像文件综合匹配度的个数,F0nmin为所采集语音文件和录像文件综合匹配度的最小值;当采集的语音指令不同分段集合的总匹配度满足上述公式,判定该语音指令匹配度合格,发送至样本库进行匹配,当采集的语音指令不同分段集合的总匹配度不满足上述公式,判定该语音...

【专利技术属性】
技术研发人员:彭玲玲
申请(专利权)人:彭玲玲
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1