语音终点检测装置、系统和方法制造方法及图纸

技术编号:19781241 阅读:16 留言:0更新日期:2018-12-15 12:09
本发明专利技术提供一种语音终点检测装置、系统和方法。该语音终点检测系统包括:处理器,被配置成确定用于检测针对每个用户和针对每个域不同的用户讲话的终点的终点检测时间。语音终点检测系统被配置成执行语音识别,并且数据库(DB)被配置成存储用于由处理器进行的语音识别的数据。

【技术实现步骤摘要】
语音终点检测装置、系统和方法相关申请的交叉引用本申请基于并要求于2017年6月7日向韩国知识产权局提交的申请号为10-2017-0070895的韩国申请的优先权的权益,其内容通过整体引用并入本文。
本公开涉及一种语音终点检测装置、系统和方法,并且更特别地,涉及通过在语音识别时可变地应用终点检测时间来提高语音识别性能的技术。
技术介绍
通常,包括智能手机或平板个人电脑(PC)的各种类型的电子装置利用麦克风识别语音信号输入,并确定语音信号是否是预定的关键字。为了识别语音信号,传统的电子装置识别由用户发起的语音识别。在输入信号被连续接收之后,当信号包括无声音节或者在恒定时间(例如,终点检测时间,例如1秒)期间保持噪声时,传统的电子装置确定没有接收到用户的语音识别的输入并终止接收语音信号。然后,会针对数据分析特定模式和用户的喜好来获得识别的结果。当检测终点的间隔被确定为太短时,例如,当用户口述的细节的后面的部分被省略时,难以正常地获得识别的结果。当检测终点的间隔被确定为太长时,例如,当识别时间增加或者由于在没有输入数据的无声间隔中接收到噪声时,可能提高将发生错误识别的可能性。因此,需要精确地确定用于语音识别的终点检测时间。本部分公开的上述信息仅仅是为了加深对本专利技术背景的理解,因此,其中可包含不构成对本国家中本领域普通技术人员来说是已知的现有技术的信息。
技术实现思路
本公开提供一种通过在语音识别时可变地应用终点检测时间来提高语音识别性能的语音终点检测装置,以及包括该语音终点检测装置的系统和方法。根据本公开的示例性实施例,语音终点检测系统可以包括:处理器,被配置成设置用于检测针对每个用户和针对每个域(domain)不同的用户讲话的终点的终点检测时间并执行语音识别;以及数据库(DB),被配置成存储用于由处理器进行的语音识别的数据。在示例性实施例中,该系统可以进一步包括:显示单元,被配置成在屏幕上显示由处理器执行语音识别的结果。DB可以包括:语音识别DB,被配置成存储用于语音识别的数据;以及终点检测DB,被配置成存储每个用户和每个域的终点检测信息。在其他示例性实施例中,处理器可以包括:输入信号管理单元,被配置成识别讲话的用户和域,并且设置每个用户或每个域的终点检测时间;语音检测单元,被配置成通过应用每个用户或每个域的终点检测时间来检测用户讲话的语音信号;语音识别单元,被配置成对检测到的语音信号执行语音识别;语音识别结果管理单元,被配置成通过搜索执行语音识别的结果来输出搜索结果;以及终点检测管理单元,被配置成基于搜索结果来维持或调节终点检测时间的设置。在一些示例性实施例中,输入信号管理单元可以基于用户语音识别用户和域,并且可以设置每个域的第一终点检测时间和第二终点检测时间。存储在DB中的第一终点检测时间和第二终点检测时间可以按照用户来设置。第一终点检测时间可以被设置成小于第二终点检测时间。在一些示例性实施例中,输入信号管理单元可以包括:用户识别单元,被配置成识别正在讲话的用户;域识别单元,被配置成识别讲话语音信号的域或通过域菜单识别域;以及多个终点检测时间设置单元,被配置成使用关于识别的用户和识别的域的信息来设置为每个用户存储的每个域的终点检测时间。语音检测单元可以被配置成通过应用第一终点检测时间来检测第一语音信号,并且通过应用第二终点检测时间来检测第二语音信号。此外,语音识别单元可以被配置成通过对第一语音信号执行语音识别来输出第一语音识别结果,并且通过对第二语音信号执行语音识别来输出第二语音识别结果。语音识别结果管理单元可以被配置成通过在DB中搜索第一语音识别结果和第二语音识别结果来输出第一搜索结果和第二搜索结果。当不存在针对第一语音识别结果和第二语音识别结果中的每一个的搜索结果时,终点检测管理单元可以被配置成将第一终点检测时间设置为最终终点检测时间。另外,终点检测管理单元可以被配置成将第一搜索结果与第二搜索结果进行比较,并且可以当第一搜索结果与第二个搜索结果相同时将第一终点检测时间设置为最终终点检测时间。终点检测管理单元可以被配置成将第一搜索结果与第二搜索结果进行比较,并且可以被配置成当第一搜索结果与第二搜索结果不同时接收来自用户的对第一搜索结果和第二搜索结果中的一个的选择。当在第一搜索结果和第二搜索结果之间选择第一搜索结果时,终点检测管理单元可以将第一终点检测时间确定为最终终点检测时间。当在第一搜索结果和第二搜索结果之间选择第二搜索结果时,终点检测管理单元可以被配置成将第二终点检测时间设置为最终终点检测时间。根据本公开的另一方面,语音终点检测装置可以包括:输入信号管理单元,被配置成识别用户讲话的该用户和域,并且利用每个用户或每个域终点检测时间DB确定每个用户或每个域的终点检测时间;语音检测单元,被配置成通过应用由针对每个用户或针对每个域确定的多个终点检测时间来检测由用户讲话的每个语音信号;语音识别单元,被配置成对检测到的语音信号中的每一个执行语音识别;语音识别结果管理单元,被配置成通过搜索执行语音识别的每个结果输出每一个搜索结果;以及终点检测管理单元,被配置成基于每一个搜索结果维持或调节终点检测时间的设置。此外,终点检测管理单元可以被配置成比较搜索结果,当搜索结果彼此相同时维持终点检测时间的设置,并且当搜索结果彼此不同时调节终点检测时间的设置。根据本公开的另一方面,语音终点检测方法可以包括:识别用户讲话的该用户和域并利用每个用户或者每个域终点检测时间DB设置每个用户或每个域的终点检测时间;通过对每个用户或对每个域应用多个终点检测时间来检测由用户讲话的每个语音信号;对检测到的语音信号中的每一个执行语音识别;通过搜索执行语音识别的每个结果输出每一个搜索结果;以及基于每一个搜索结果维持或调节终点检测时间的设置。当搜索结果彼此相同时,维持或调节终点检测时间的设置可以包括比较搜索结果并维持终点检测时间的设置。当搜索结果彼此不同时,维持或调节终点检测时间的设置可以进一步包括比较搜索结果并调节终点检测时间的设置。附图说明结合附图通过下面详细描述,本公开的以上和其他目的、特征和优点将变得更加明显:图1是说明根据本公开的示例性实施例的语音终点检测系统的配置的示例性框图;图2是说明根据本公开的示例性实施例的图1的输入信号管理单元的详细配置的示例性框图;图3是说明根据本公开的示例性实施例的终点检测时间的示例性图;图4是说明根据本公开的示例性实施例的图1的语音识别单元的详细配置的示例性框图;图5是说明根据本公开的示例性实施例的图1的语音识别结果管理单元的详细配置的示例性框图;图6是说明根据本公开的示例性实施例的图1的终点检测管理单元的详细配置的示例性框图;图7是说明根据本公开的示例性实施例的语音终点检测方法的示例性流程图;图8是说明根据本公开的示例性实施例的输入信号管理方法的示例性流程图;以及图9是说明根据本公开的示例性实施例的应用了语音终点检测方法的计算系统的配置的示例性框图。具体实施方式在下文中,将参照附图详细描述本公开的示例性实施例。在为每张图的元件添加参考标号时,虽然相同的元件显示在不同的图上,但应该注意的是,相同的元件具有相同的标号。另外,在描述本公开的示例性实施例时,如果确定相关已知配置或功能的详细描述使本公开的本文档来自技高网...

【技术保护点】
1.一种语音终点检测系统,包括:处理器,被配置成设置用于检测针对每个用户和针对每个域不同的用户讲话的终点的终点检测时间并执行语音识别;以及数据库即DB,被配置成存储用于由所述处理器进行的语音识别的数据。

【技术特征摘要】
2017.06.07 KR 10-2017-00708951.一种语音终点检测系统,包括:处理器,被配置成设置用于检测针对每个用户和针对每个域不同的用户讲话的终点的终点检测时间并执行语音识别;以及数据库即DB,被配置成存储用于由所述处理器进行的语音识别的数据。2.根据权利要求1所述的系统,进一步包括:显示单元,被配置成在屏幕上显示由所述处理器执行所述语音识别的结果。3.根据权利要求1所述的系统,其中,所述DB包括:语音识别DB,被配置成存储用于语音识别的数据;以及终点检测DB,被配置成存储每个用户和每个域的终点检测信息。4.根据权利要求2所述的系统,其中,所述处理器包括:输入信号管理单元,被配置成识别讲话的用户和域,并确定每个用户或每个域的终点检测时间;语音检测单元,被配置成通过应用针对每个用户或针对每个域确定的所述终点检测时间来检测用户讲话的语音信号;语音识别单元,被配置成对检测到的语音信号执行语音识别;语音识别结果管理单元,被配置成通过搜索执行语音识别的结果来输出搜索结果;以及终点检测管理单元,被配置成基于所述搜索结果来维持或调节终点检测时间的设置。5.根据权利要求4所述的系统,其中,所述输入信号管理单元被配置成识别当用户讲话时的所述用户和所述域,并确定每个域的第一终点检测时间和第二终点检测时间,并且其中所述第一终点检测时间和所述第二终点检测时间基于所述用户来确定并且被存储在所述DB中。6.根据权利要求5所述的系统,其中,所述第一终点检测时间小于所述第二终点检测时间。7.根据权利要求6所述的系统,其中,所述输入信号管理单元包括:用户识别单元,被配置成识别作为讲话者的所述用户;域识别单元,被配置成识别讲话的语音信号的域或通过域菜单来识别所述域;以及多个终点检测时间设置单元,被配置成基于关于所识别的用户和所识别的域的信息来确定为每个用户存储的每个域的终点检测时间。8.根据权利要求7所述的系统,其中,所述语音检测单元被配置成通过应用所述第一终点检测时间来检测第一语音信号,并且被配置成通过应用所述第二终点检测时间来检测第二语音信号。9.根据权利要求8所述的系统,其中,所述语音识别单元被配置成通过对所述第一语音信号执行语音识别来输出第一语音识别结果,并且被配置成通过对所述第二语音信号执行语音识别来输出第二语音识别结果。10.根据权利要求9所述的系统,其中,所述语音识别结果管理单元被配置成通过在所述DB中搜索所述第一语音识别结果和所述第二语音识别结果来输出第一搜索结果和第二搜索结果。11.根据权利要求10所述的系统,其中,当不存在所述第一语音识别结果和所述第二语音识别结果中的每一个的搜索结果时,所述终点检测管理单元被...

【专利技术属性】
技术研发人员:李京澈赵在珉
申请(专利权)人:现代自动车株式会社起亚自动车株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1