数据收集装置及方法、语音对话装置及方法制造方法及图纸

技术编号:11200794 阅读:83 留言:0更新日期:2015-03-26 08:21
本发明专利技术提供一种数据收集装置及方法、语音对话装置及方法。本发明专利技术的实施方式涉及数据收集装置、语音对话装置、方法以及程序。提供能够高精度地推测读法的数据收集装置、语音对话装置、方法以及程序。本实施方式的数据收集装置与对话的规定的每个分类对应关联地收集在语音对话中使用的数据,包括语音识别部、对话判定部以及储存部。语音识别部对所发言的语音进行语音识别,生成语音的书写字符串和书写字符串的读法。对话判定部使用书写字符串以及读法中的至少某一方来判定语音对话是否成功。储存部在判定为语音对话成功了的情况下,将书写字符串以及读法与分类对应关联起来进行储存。

【技术实现步骤摘要】
【专利摘要】本专利技术提供一种。本专利技术的实施方式涉及数据收集装置、语音对话装置、方法以及程序。提供能够高精度地推测读法的数据收集装置、语音对话装置、方法以及程序。本实施方式的数据收集装置与对话的规定的每个分类对应关联地收集在语音对话中使用的数据,包括语音识别部、对话判定部以及储存部。语音识别部对所发言的语音进行语音识别,生成语音的书写字符串和书写字符串的读法。对话判定部使用书写字符串以及读法中的至少某一方来判定语音对话是否成功。储存部在判定为语音对话成功了的情况下,将书写字符串以及读法与分类对应关联起来进行储存。【专利说明】本申请以日本专利申请2013-196143(申请日:2013年9月20日)为基础,享受该申请的优先的权益。本申请通过参照该申请,而包括该申请的全部内容。
本专利技术的实施方式涉及数据收集装置、语音对话装置、方法以及程序。
技术介绍
近年来,作为在便携电话、智能手机等高功能便携终端中搭载的应用程序,利用语音而与用户进行对话的语音对话系统正在增加。在语音对话系统中,如果用户通过发言而对系统委托询问或者应用程序的执行,则通过语音输出、图像显示来进行针对用户的发言的应答。
技术实现思路
在从系统通过语音输出而向用户进行应答的情况下,一般根据应答文的书写字符串来推测应答文的读法,通过语音合成处理而将读法变换为合成语音来输出。因此,在推测出错误的读法的情况下,有可能无法输出正确的应答语音而传递错误的信息。特别是,I个书写有多个读法的单词的读法区分是困难的。 因此,有如下方法:在进行语音合成处理时,通过使用根据前一个用户的发言的语音识别结果而制作的读法信息,从而防止具有多个读法的单词的读法错误。 但是,在该方法中,设想了将前一个用户发言中包含的人名等单词再次利用于应答文,通过以与用户发言所发出的读法相同的方式宣读再次利用的单词,从而防止读法错误。因此,对于前一个用户发言中未包含的单词,无法防止读法错误。 本专利技术要解决的课题在于,提供一种能够高精度地推测读法的数据收集装置、语音对话装置、方法以及程序。 本专利技术的一个实施方式的数据收集装置,与对话的规定的每个分类对应关联地收集在语音对话中使用的数据,该数据收集装置包括语音识别部、对话判定部以及储存部。语音识别部对所发言的语音进行语音识别,生成与该语音对应的书写字符串和该书写字符串的读法。对话判定部使用所述书写字符串以及所述读法中的至少某一方来判定所述语音对话是否成功。在判定为所述语音对话成功了的情况下,储存部将所述书写字符串以及所述读法与所述分类对应关联起来进行储存。 根据上述结构的装置,能够高精度地推测读法。 【专利附图】【附图说明】 图1是示出第I实施方式的语音对话装置的框图。 图2是示出领域以及对话步骤的概念的图。 图3是示出脚本DB中储存的数据的一个例子的图。 图4是示出书写读法DB中储存的书写读法以及读法的一个例子的图。 图5是示出数据收集装置的动作的流程图。 图6是示出对话判定部中的对话判定处理的具体例的流程图。 图7是示出第I实施方式的语音对话装置的动作的流程图。 图8是示出第2实施方式的语音对话装置的框图。 图9是示出第2实施方式的语音对话装置的动作的流程图。 【具体实施方式】 以下,参照附图,详细说明该公开的一个实施方式的数据收集装置、语音对话装置、方法以及程序。另外,在以下的实施方式中,关于附加了同一编号的部分,设为进行同样的动作,省略重复的说明。 (第I实施方式) 参照图1的框图,说明第I实施方式的语音对话装置。 第I实施方式的语音对话装置100包括语音识别部101、对话判定部102、脚本数据库103 (以下,称为脚本DB103)、书写读法数据库104 (以下,称为书写读法DB104)、应答文生成部105、中间语言化部106以及语音合成部107。 另外,将语音识别部101、对话判定部102、脚本DB103以及书写读法DB104汇总起来还称为数据收集装置。 语音识别部101将由用户所发言的语音作为输入语音来接收,对输入语音进行语音识别处理,生成与输入语音对应的书写字符串和与书写字符串对应的读法。书写字符串和读法既可以按照单词单位来生成,也可以按照分句单位、短文单位来生成。书写字符串在本实施方式中还包括是I个文字的情况。另外,读法也可以是音素串(phoneme string)。在语音识别处理中,例如利用隐马尔可夫模型(Hidden Markov Model:HMM)等,通过一般的方法进行既可,所以此处省略详细的说明。 对话判定部102从语音识别部101接收书写字符串和读法中的至少某一方,参照书写字符串和读法中的至少某一方以及后述的脚本DB103,判定对话是否成功。 关于对话是否成功的判定,例如,如果在成为当前的判定对象的发言的接下来的发言中未包含有预先准备的重说表现则判定为成功,如果包含有预先准备的重说表现则判定为失败既可。作为重说表现,例如,可以举出“不是那样(日文t T< ? )”、“不是(日文:P々P々)”、“不对不对(日文:6 6 # )) ”这样的表现。另外,作为其他判定方法,也可以根据在从语音识别部101接收到的书写字符串中是否包括必要的信息而进行判定。例如,如果在书写字符串中包含有日期时间表现则判定为对话成功,如果未包含有日期时间表现则判定为失败既可。另外,在本实施方式中,示出了使用书写字符串来判定对话是否成功的例子,但不限于此,也可以使用读法来判定对话是否成功。另外,在仅通过利用重说表现的方法来进行对话成功与否的判定的情况下,在判定成功与否时,也可以没有脚本DB103。 脚本DB103储存对用户与装置之间的对话的顺序等进行决定的对话步骤的集合。脚本DB103中储存的对话步骤被分类为I个以上的群组。将该群组称为领域(Domain)。参照图3,在后面详细叙述脚本DB103。 书写读法DB104将单词的书写字符串与单词的I个以上的读法对应关联地进行储存。关于单词的读法,既可以预先给出,也可以从对话判定部102接收在对话判定部102中判定为成功的单词的书写字符串和读法,并分别对应关联地进行储存而积攒。参照图4,在后面详细叙述书写读法DB104。 应答文生成部105从对话判定部102接收判定结果,参照脚本DB103,制作与判定结果对应的向用户的应答文。作为应答文的生成方法,考虑各种方法,但在本实施方式中,参照脚本DB103中的当前判定中的对话步骤来制作应答文。 中间语言化部106从应答文生成部105接收应答文,参照在书写读法DB104中储存的书写字符串以及读法,推测在应答文中包含的单词的读法。 语音合成部107从中间语言化部106接收推测出单词的读法而得到的应答文,对推测出读法而得到的应答文进行语音合成来制作应答语音。另外,在应答语音的制作中,使用一般的语音合成系统既可,所以此处省略说明。 接下来,参照图2,说明在脚本DB103中储存的领域以及对话步骤的概念。 在本实施方式的对话系统中,设想为通过使一个或者多个对话步骤转移来进行用户和系统的对话。 在图2中,作为对话整体的领域即对话整体领域201的下位领域,包括百货店引导本文档来自技高网...

【技术保护点】
一种数据收集装置,与对话的规定的每个分类对应关联地收集在语音对话中使用的数据,其特征在于,具备:语音识别部,对所发言的语音进行语音识别,生成与该语音对应的书写字符串和该书写字符串的读法;对话判定部,使用所述书写字符串以及所述读法中的至少某一方,判定所述语音对话是否成功;以及储存部,在判定为所述语音对话成功了的情况下,将所述书写字符串以及所述读法与所述分类对应关联起来进行储存。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:宮村祐一山崎智弘永江尚义岩田宪治
申请(专利权)人:株式会社东芝
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1