意图估计装置以及意图估计方法制造方法及图纸

技术编号:11854401 阅读:98 留言:0更新日期:2015-08-10 23:58
具有:语素分析部(2),其进行输入语言的语素分析而转换成语素串;以及意图串估计部(3),该意图串估计部(3)具有:意图估计单位提取部(4),其将语素串分割成部分语素,并提取估计意图的单位即意图估计单位;意图估计部(6),其对构成提取出的各意图估计单位的部分语素的意图进行估计;以及意图共现权重计算部(8),其计算基于意图间的关系的意图共现权重,该意图串估计部(3)使用意图估计部(6)估计出的1个或者多个意图生成与输入语言相当的意图串,使用表示所生成的意图串的似然性的评分和针对构成所生成的意图串的意图由意图共现权重计算部(8)计算出的意图共现权重,生成与输入语言对应的意图估计结果。

【技术实现步骤摘要】
【国外来华专利技术】意图估计装置以及意图估计方法
本专利技术涉及对用自然语言输入的文本的内容与预先设计的意图的何种意图相符进行估计的意图估计装置以及意图估计方法。
技术介绍
近年来,语音输入人说出的言语并使用其识别结果来执行操作的方法备受瞩目。该技术已被用作移动电话或汽车导航等的语音接口,作为基本方法有如下方法:预先将系统假定的语音识别结果与操作对应起来,在语音识别结果为假定的内容的情况下执行操作。该方法与以往的手动操作相比,能够通过语音的发话直接操作,因此作为快捷功能有效地发挥作用。另一方面,用户为了执行操作需要发出系统正在等待的言语,当系统处理的功能不断增加时,应该记忆的言语增加。另外,一般而言,在充分理解操作说明书后再使用的用户较少,其结果是存在如下问题:有时用户不清楚为了进行多种操作需要如何发话,实际上除了有限的功能以外无法通过语音进行操作。作为其解决方法公开有如下方法:并不直接将语音识别结果与操作建立联系,而是根据用户的发话内容理解用户的意图进行操作。在其一种实现方法中,先将预先收集到的发话例句与操作(以下,称作学习数据)对应起来,再根据用户的言语通过统计学习方法将用户希望的操作(以下,称作意图)模型化,并利用该模型针对用户输入估计意图(以下,称作统计意图估计)。统计意图估计的具体处理是,首先,从学习数据的发话例句提取用于学习的术语(term);然后,将该术语集合和正确的意图作为输入学习数据,并通过统计学习算法,学习各术语与正确意图的权重并输出模型。用于学习的术语一般是从对发话例句进行语素分析而得到的数据提取出单词或单词串。例如,从“○○駅に行きたい(○○ekiniikitai(想去○○站))”这一发话例句,能够得到“○○駅(○○eki)(专有名词:设施)/に(ni)(助词)/行き(iki)(动词:连用形)/たい(tai)(助动词)”这样的语素分析结果。在得到语素分析结果时,提取“$设施$、行く(iku)”(专有名词的设施转换成$设施$这一特殊符号,动词转换成原形)这样的术语、“$设施$__に(ni)、に__行き(ni_iki)、行き__たい(iki_tai)”这样的2个连续的语素术语。其结果是,针对“$设施$、行く(iku)、$设施$__に(ni)、に__行き(ni_iki)、行き__たい(iki_tai)”的术语,生成以“目的地设定[目的地=$设施$]”(主意图是目的地设定,设定的目的地是$设施$)的方式表现的正确意图,并基于由根据大量的发话数据而生成的术语串和正确意图构成的学习数据生成模型。作为用于生成模型的方式,利用机器学习算法。机器学习算法是针对全部学习数据,以最多地生成正确意图的方式对输入术语与正确意图的权重进行机器学习。因此,对于从与学习数据类似的发话得到的术语组合,能够得到输出正确意图的可能性高的模型。作为该机器学习方式,例如能够使用最大熵法。通过使用基于这样的机器学习算法而生成的模型对用户输入进行意图估计,即使针对并非预先假定的输入的输入,也能够灵活地估计操作意图,因此,即使是不记得正式措辞的用户的发话,也能够适当地理解意图而执行操作。另一方面,通过接受这样的自由输入,系统的灵活性增加,用户进行更多种发话的可能性增大。作为假定的多种发话,大致分成以下2类。(a)针对一个操作使用了更多种单词的输入(b)将由多个操作组成的要求作为一个块输入在上述(a)的情况下,能够通过进一步增加学习数据而处理多种发话。另一方面,在(b)的情况下,由于学习数据本来与一个意图对应,因此,在包含多个意图的情况下,无法进行组合适当意图而成的处理。因此,专利文献1中公开有如下的发话意图识别装置:使用作为一个意图而学习到的模型,针对包含一个或多个意图的输入求出适当的意图串。该发话意图识别装置针对输入语素作为学习数据预先准备成为意图划分的语素串,与上述意图理解同样地估计存在分割可能性的点并使该分割点的分割可能性与各分割要素的意图可能性匹配,从而估计最大似然意图串。现有技术文献专利文献专利文献1:日本特开2000-200273号公报
技术实现思路
专利技术要解决的课题然而,上述专利文献1中公开的技术是针对语素串作为学习数据给予分割点候选,学习其可能性,并针对实际的用户输入进行分割点估计,作为用于学习这些分割点的数据,很难集中多种输入,实际上只是对学习数据中的作为语素串的分割点进行预测,可认为其与基于语言性质判定分割点的可能性的情况并无多大区别。因此,对于基于分割点估计多个意图,不仅要求分割点的正确性,其关键恰恰在于单独估计针对分割后的各部分输入的正确意图后选择最大似然意图,并返回将其连接而成的意图串,但是,存在无法验证该发话整体中的多个意图的妥当性的课题。这意味着无法进行关于意图连续性的评价,由于以下所示的(c)~(e)的原因而无法得到妥当的意图串。(c)在无法大量准备学习数据的情况下,意图估计精度降低,因此,存在整体的意图串的精度降低的可能性。(d)由于有时输入中接受前方的部分而后方的发话被省略,因此,在该情况下,有时后方的发话的意图与用户的意图串不一致。(e)在输入为语音的情况下,由于将语音识别结果作为输入,因此,无法将包含误识别时的估计错误根据意图间的匹配性排除。本专利技术正是为了解决上述课题而完成的,其目的在于,即使在进行了包含多个意图的输入的情况下,通过预先记述意图间的关系,按照意图间的关系来生成最适合的意图串。用于解决课题的手段本专利技术的意图估计装置具有意图串估计部,所述意图串估计部具有:意图估计单位提取部,其从输入语言提取估计意图的单位即1个以上的意图估计单位;意图估计部,其根据意图估计单位提取部提取出的各个意图估计单位估计部分意图,该部分意图是构成意图估计单位的部分的意图;以及意图共现权重计算部,其计算基于意图估计部估计出的部分意图间的关系的意图共现权重,所述意图串估计部使用意图估计部估计出的1个以上的部分意图生成与输入语言相当的意图串,使用表示所生成的意图串的似然性的评分、和针对构成所生成的意图串的部分意图由意图共现权重计算部计算出的意图共现权重,生成与输入语言对应的意图估计结果。专利技术效果根据本专利技术,即使在进行了包含多个意图的输入的情况下,也能够按照该多个意图间的关系来生成最适合的意图串。附图说明图1是示出实施方式1的意图估计装置的构成的框图。图2是示出实施方式1的意图估计装置的意图层次图数据蓄积部蓄积的意图层次图数据的一个例子的图。图3是示出实施方式1的意图估计装置的从输入语音提取意图估计单位的处理的具体例的图。图4是示出实施方式1的意图估计装置的意图估计部的处理的图。图5是示出实施方式1的意图估计装置的意图估计部的处理的图。图6是示出实施方式1的意图估计装置的意图串估计部的处理的图。图7是示出实施方式1的意图估计装置的意图串估计部的处理的图。图8是示出实施方式1的意图估计装置的动作的流程图。图9是示出实施方式2的意图估计装置的构成的框图。图10是示出实施方式2的意图估计装置的意图串转换表蓄积部蓄积的意图串转换表的一个例子的图。图11是示出实施方式2的意图估计装置的从输入语音提取意图估计单位的处理的具体例的图。图12是示出实施方式2的意图估计装置的意图估计部的处理的图。图13是示出实施方式2的意图估计装置的意图串本文档来自技高网
...
意图估计装置以及意图估计方法

【技术保护点】
一种意图估计装置,其根据用户的语言输入估计所述用户的意图,其特征在于,该意图估计装置具有语素分析部和意图串估计部,所述语素分析部进行所述输入的语言的语素分析而转换成语素串,所述意图串估计部具有:意图估计单位提取部,其将所述语素分析部转换后的语素串分割成部分语素,并提取估计所述意图的单位即意图估计单位;意图估计部,其对构成所述意图估计单位提取部提取出的各意图估计单位的部分语素的意图进行估计;以及意图共现权重计算部,其计算基于所述意图估计部估计出的意图间的关系的意图共现权重,所述意图串估计部使用所述意图估计部估计出的1个或者多个意图生成与所述输入的语言相当的意图串,使用表示所生成的所述意图串的似然性的评分、和针对构成所生成的所述意图串的所述意图由所述意图共现权重计算部计算出的意图共现权重,生成与所述输入的语言对应的意图估计结果。

【技术特征摘要】
【国外来华专利技术】2012.11.30 JP 2012-2625931.一种意图估计装置,其根据用户的语言输入估计所述用户的意图,其特征在于,该意图估计装置具有意图串估计部,所述意图串估计部具有:意图估计单位提取部,其从所述输入的语言提取估计所述意图的单位即1个以上的意图估计单位;意图估计部,其根据所述意图估计单位提取部提取出的各个意图估计单位估计部分意图,该部分意图是构成该意图估计单位的部分的意图;以及意图共现权重计算部,其基于所述部分意图之间的关系,计算意图共现权重,所述意图串估计部使用所述意图估计部估计出的1个以上的所述部分意图生成与所述输入的语言相当的意图串,使用表示所生成的所述意图串的似然性的评分、和针对构成所生成的所述意图串的所述部分意图由所述意图共现权重计算部计算出的意图共现权重,生成与所述输入的语言对应的意图估计结果,所述意图共现权重计算部参照根据意图间的关系性将该意图层次化而定义的意图层次图数据,使用对构成各层次的各意图定义的权重来计算所述意图共现权重,其中,所述表示所生成的所述意图串的似然性的评分为整体评分与分割权重的积,所述整体评分为所述部分意图的各部分评分之积,所述分割权重是表示意图分割的可能性的数字。2.根据权利要求1所述的意图估计装置,其特征在于,所述意图层次图数据具有下位意图将上位意图进一步具体化的关系性,所述意图共现权重计算部参照所述意图层次图数据,在构成所述意图串估计部生成的所述意图串的连续的2个部分意图存在共同的上位意图的情况下,使用对该上位意图定义的权重来计算所述意图共现权重。3.根据权利要求1所述的意图估计装置,其特征在于,所述意图层次图数据具有下位意图将上位意图...

【专利技术属性】
技术研发人员:藤井洋一石井纯
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1