模块化对话查询识别方法和系统技术方案

技术编号:3045418 阅读:156 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种语音识别方法及系统,该方法的步骤包含:(a)显示至少一个其中包含至少一建议选项的提示句与替换选项,以供使用者参考;(b)接收该使用者的语音,并进行该语音的识别;(c)根据该语音来搜寻数据库,以产生至少一查询结果;以及(d)重复步骤(a)至步骤(c),以缩小查询范围,直到该使用者获得其想要的查询结果。如果使用者输入的规格之间冲突,或数据库中没有使用者所要规格的查询结果时,系统也会建议使用者移除哪些规格才能查到东西。本发明专利技术还提出一个以模块方式将数据库建立为查询对话系统的方法及系统,只要将数据库建立为系统指定的格式,并提供系统所指定的领域知识,即可马上建立查询该数据库的查询对话系统。

【技术实现步骤摘要】

本专利技术涉及一种语音识别方法及系统,特别涉及一种以显示器显示提示句的语音识别方法及系统。
技术介绍
目前的对话系统大多以电话为平台,只有少数如娱乐中心会有显示器,多数仅以语音响应使用者来仿真人与人对话的方式运作。缺点是语音提示即使尽可能的引导使用者回答比较确切的答案,速度和完整性都不如用看的又快又清楚,如果在没有充分的提示下对话,计算机毕竟不是人,没办法像人一样,几乎什么问法都听得懂。所以通常需要花费相当长的时间、人力及财力去收集该领域的专业知识(domain knowledge),才能大部分涵盖使用者可能的问题,以及所有可能的问答方式。可是毕竟人可能问的问题太广,可能花上十年,还是有相当比例的问答方式没有收集到。所以一般另一种比较速成的做法是使用关键词提取(keyword spotting),也就是说,评估输入语音的可信度(confidence),把系统没有涵括到的词汇剔除掉,自然语言理解器(Natural Language Understand,NLU)再作比较强健式(robust)的语音理解。无论如何,提示关键词并且采用关键词提取的系统虽然好像也可以自然语言输入,但是没有完整的句型语法的限制,效果还是比不上有句型语法的辅助限制的识别效果来的好。目前市面上有像音魔师或ViaVoice on OS2等声控计算机软件,其利用显示器提示所有可识别的关键词,以单字识别的方式运作。以自然语言输入的系统有像娱乐中心提示可识别的关键词,如歌曲名称,而用关键词提取来进行识别。目前应该还没有提示完整句型并且语音识别采用整句识别配合NLU语音理解的系统。鉴于公知技术的缺点,本专利技术的语音识别方法及系统用以改善上述公知用手段的缺点。
技术实现思路
本专利技术的主要目的是提供一种语音识别方法及系统,以显示器显示提示句来解决使用者不知道该说些什么的问题。本专利技术的另一目的是提供一种语音识别方法及系统,提出三种选项状态供使用者进行查询/确认。根据上述构想,本专利技术提供一种语音识别方法,其步骤包含(a)显示至少一个其中包含至少一建议选项的提示句与替换选项,以供一使用者参考;(b)接收该使用者的语音,并进行该语音的识别;(c)根据该语音来搜寻一数据库,以产生至少一查询结果;以及(d)重复步骤(a)至步骤(c),以缩小查询范围,直到该使用者获得其想要的查询结果。根据本专利技术所述的方法,该提示句与所述替换选项显示于一显示器上。根据本专利技术所述的方法,步骤(a)还包含显示一第一选项状态、一第二选项状态、及一第三选项状态,以供该使用者参考。根据本专利技术所述的方法,该第一选项状态为“要”或“是”或“同意”等。根据本专利技术所述的方法,该第二选项状态为“不要”或“不是”或“不同意”等。根据本专利技术所述的方法,该第三选项状态为“无所谓”。根据本专利技术所述的方法,该数据库经由下列步骤来建立准备好一产品的领域数据库;定义至少一个关于该产品的选项;为每一选项标注所有可能的说法;定义所述选项之间的分类及从属关系;定义所述选项之间的冲突关系;定义该产品的单位名称;定义至少一个提示句;定义缩小查询范围与放宽查询范围的准则;以及建立一语法数据库、一领域知识数据库、及一冲突信息数据库。根据本专利技术所述的方法,所述选项包含所述建议选项与所述替换选项。根据本专利技术所述的方法,该数据库为一特定领域数据库。根据本专利技术所述的方法,其中步骤(d)还包含重复步骤(a)至步骤(c),以放宽查询范围,直到该使用者获得其想要的搜寻结果。根据上述构想,本专利技术还提供一种语音识别系统,用以根据一语音输入而产生一查询结果,其包含一语音识别器,用以识别该语音输入;一语言理解器,连接于该语音识别器,用以解析该语音输入,以产生一语意;一查询对话控制器,连接于该语言理解器,用以根据该语意来进行对话控制及查询,以产生至少一提示句与该查询结果;一语法数据库,连接于该语音识别器与该语言理解器,用以储存多个识别词汇与多个识别语法,以供该语音识别器与该语言理解器进行该语音输入的识别与解析;一领域数据库,连接于该查询对话控制器,用以储存关于一产品的多组数据,而该查询结果是得自所述数据;一领域知识数据库,连接于该查询对话控制器,用以储存关于该产品的领域知识;以及一冲突信息数据库,连接于该查询对话控制器,用以储存关于该产品的至少一个选项间的冲突关系。根据本专利技术所述的系统,还包含一连接于该语音识别器的语音输入装置,用以接收该语音输入。根据本专利技术所述的系统,该语音输入装置可为一麦克风。根据本专利技术所述的系统,还包含一连接于该对话查询控制器的显示器,用以显示该提示句与该查询结果。根据本专利技术所述的系统,还包含一连接于该对话查询控制器的文字-语音转换器。根据本专利技术所述的系统,还可包含一连接于该文字-语音转换器的语音输出装置,用以产生一语音输出。根据本专利技术所述的系统,该语音识别器、该语言理解器、该查询对话控制器、及该文字-语音转换器共同构成一查询对话系统。根据本专利技术所述的系统,该语法数据库、该领域数据库、该领域知识数据库、及该冲突信息数据库共同构成一特定领域数据库。根据上述构想,本专利技术又提供一种语音识别方法,其步骤包含(a)显示至少一个其中包含至少一建议选项的提示句、替换选项及选项状态,以供一使用者参考;(b)接收该使用者的语音,并进行该语音的识别;(c)根据该语音来搜寻一数据库,以产生至少一查询结果;以及(d)重复步骤(a)至步骤(c),以缩小查询范围,直到该使用者获得其想要的查询结果。根据本专利技术所述的方法,该提示句、所述替换选项及所述选项状态显示于一显示器上。根据本专利技术所述的方法,所述选项状态至少包含一第一选项状态、一第二选项状态、及一第三选项状态。根据本专利技术所述的方法,该第一选项状态为“要”或“是”或“同意”等。根据本专利技术所述的方法,该第二选项状态为“不要”或“不是”或“不同意”等。根据本专利技术所述的方法,该第三选项状态为“无所谓”。根据本专利技术所述的方法,步骤(d)还包含重复步骤(a)至步骤(c),以放宽查询范围,直到该使用者获得其想要的搜寻结果。根据上述构想,本专利技术再提供一种建立特定领域数据库的方法,其步骤包含准备好一产品的领域数据库;定义至少一个关于该产品的选项;为每一选项标注所有可能的说法;定义所述选项之间的分类及从属关系;定义所述选项之间的冲突关系;定义该产品的单位名称;定义至少一个提示句;定义缩小查询范围与放宽查询范围的准则;以及建立一语法数据库、一领域知识数据库、及一冲突信息数据库。附图说明图1是本专利技术一较佳实施例的语音识别系统的架构图。图2是本专利技术一较佳实施例的查询过程的流程图。图3是本专利技术一较佳实施例的建立特定领域数据库的流程图。图4(a)~(d)是本专利技术一较佳实施例的实际查询过程的示意图。其中,附图标记说明如下11 查询对话系统 12 特定领域数据库 101语音输出装置102显示器103语音输入装置104语音识别器105语法数据库106语言理解器 107查询对话控制器108领域数据库109领域知识数据库 110冲突信息数据库111文字-语音转换器具体实施方式为了解决公知技术的缺点,本专利技术希望建立一个对话系统,可以配上不同的数据库,很快的建成一个可以查询该数据库的新对话系统。传统上要建立一个对话系统,通常需要相本文档来自技高网
...

【技术保护点】
一种语音识别方法,其步骤包含:    (a)显示至少一个其中包含至少一建议选项的提示句与替换选项,以供一使用者参考;    (b)接收该使用者的语音,并进行该语音的识别;    (c)根据该语音来搜寻一数据库,以产生至少一查询结果;以及    (d)重复步骤(a)至步骤(c),以缩小查询范围,直到该使用者获得其想要的查询结果。

【技术特征摘要】
1.一种语音识别方法,其步骤包含(a)显示至少一个其中包含至少一建议选项的提示句与替换选项,以供一使用者参考;(b)接收该使用者的语音,并进行该语音的识别;(c)根据该语音来搜寻一数据库,以产生至少一查询结果;以及(d)重复步骤(a)至步骤(c),以缩小查询范围,直到该使用者获得其想要的查询结果。2.如权利要求1所述的方法,其特征在于,该提示句与所述替换选项显示于一显示器上。3.如权利要求1所述的方法,其特征在于,步骤(a)还包含显示一第一选项状态、一第二选项状态、及一第三选项状态,以供该使用者参考,其中该第一选项状态为“要”或“是”或“同意”等;该第二选项状态为“不要”或“不是”或“不同意”等;及/或该第三选项状态为“无所谓”。4.如权利要求1所述的方法,其特征在于,该数据库经由下列步骤来建立准备好一产品的领域数据库;定义至少一个关于该产品的选项;为每一选项标注所有可能的说法;定义所述选项之间的分类及从属关系;定义所述选项之间的冲突关系;定义该产品的单位名称;定义至少一个提示句;定义缩小查询范围与放宽查询范围的准则;以及建立一语法数据库、一领域知识数据库、及一冲突信息数据库,其中所述选项包含所述建议选项与所述替换选项;及/或该数据库为一特定领域数据库。5.如权利要求1所述的方法,其特征在于,步骤(d)还包含重复步骤(a)至步骤(c),以放宽查询范围,直到该使用者获得其想要的搜寻结果。6.一种语音识别系统,用以根据一语音输入而产生一查询结果,其包含一语音识别器,用以识别该语音输入;一语言理解器,连接于该语音识别器,用以解析该语音输入,以产生一语意;一查询对话控制器,连接于该语言理解器,用以根据该语意来进行对话控制及查询,以产生至少一提示句与该查询结果;一语法数据库,连接于该语音识别器与该语言理解器,用以储存多个识别词汇与多个识别语法,以供该语音识别器与该语言理解器进行该语音输入的识别与解析;一领域数据库,连接于该查询对话控制器,用以储存关于一产品的多组数据,而该查询结果得自所述数据;一领域知识数据...

【专利技术属性】
技术研发人员:李允文洪健洲
申请(专利权)人:台达电子工业股份有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利