语音对话设备、方法和机器人设备技术

技术编号：3045877 阅读：422 留言：0更新日期：2012-04-11 18:40

在传统的语音对话设备中，有着难于与用户进行自然对话的情况。对用户的话音进行话音识别，并根据话音识别的结果，按照预定的场景来控制与用户的对话，并且，如果必要的话，根据用户话音的内容而生成响应句子，从而音频合成一个再现场景的句子或者生成的响应句子。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音对话系统和方法以及机器人设备，例如，适合于娱乐用的机器人。
技术介绍
由语音对话系系统通过语音与人进行对话的方法可以根据内容分为两类。它们是“有场景(scenario)对话”和“无场景对话”。在这两类方法之中，“无场景对话”方法是一种称为“非人工智能”的对话方法，它是通过E1iza为代表的一个简单答复句子产生算法而实现的(见非专利文献1)。在“无场景的对话”方法中，如图36所示，通过重复一个反复的过程来进行处理(步骤SP92)，如果用户说出几句话，语音对话系统就对这些话进行话音识别(步骤SP90)，并根据识别结果来产生答复句子，以及用声音发出此答复句子(步骤SP91)。在“无场景的对话”方法中的问题是如果用户不发声的话，对话就不进行。例如，如果图36的步骤SP91中产生的响应是促使用户说出下一句的内容，那么对话进行，然而，如果不是，例如，如果用户进入“不能说下一句话”的状况，语音对话系统就继续等待用户发声并且不进行对话。进而，在“无场景对话”方法中，由于对话没有场景，因此，有这样的问题，这就是在图36的步骤SP91中，在产生响应时，在对话流中难于产生所考虑的答复句子。例如，难于进行这样的处理，这就是在听到用户的简述过后(profile over)之后，语音对话系统将它反映在对话中。另一方面，“有场景对话”是这样的一个对话方法，其中，通过语音对话系统根据预定的场景连续地发声来进行对话，并且它的进行是通过两轮(turn)的组合来完成的，即，一轮是语音对话系统单方面地讲话，另一轮是语音对话系统询问用户并进而响应用户对问题的答复。应当说明的是...

【技术保护点】
一种语音对话系统，该系统包括：话音识别装置，用于对用户的讲话进行话音识别；对话控制装置，用于根据由所述话音识别装置的话音识别结果、按照以前给定的场景来控制与所述用户的对话；响应产生装置，用于产生与用户的讲话内容相应的答复句子，并响应来自所述对话控制装置的请求；话音合成装置，用于对由所述对话控制装置再现的所述场景中的一个句子或对由所述响应产生装置产生的所述答复句子进行话音合成处理；和所述语音对话系统，其中，所述对话控制装置根据所述用户的讲话内容、请求所述响应产生装置产生作为场合要求的所述答复句子。

【技术特征摘要】
【国外来华专利技术】JP 2003-3-20 078086/20031.一种语音对话系统，该系统包括话音识别装置，用于对用户的讲话进行话音识别；对话控制装置，用于根据由所述话音识别装置的话音识别结果、按照以前给定的场景来控制与所述用户的对话；响应产生装置，用于产生与用户的讲话内容相应的答复句子，并响应来自所述对话控制装置的请求；话音合成装置，用于对由所述对话控制装置再现的所述场景中的一个句子或对由所述响应产生装置产生的所述答复句子进行话音合成处理；和所述语音对话系统，其中，所述对话控制装置根据所述用户的讲话内容、请求所述响应产生装置产生作为场合要求的所述答复句子。2.根据权利要求1的语音对话系统，其中，所述对话控制装置根据由所述响应产生装置产生的所述答复句子的属性来控制与所述用户的所述对话。3.根据权利要求1的语音对话系统，其中，通过按任意顺序组合为与所述用户一轮对话提供的、任意数量的并具有相应预定格式的多种类型的若干块来制作所述场景。4.根据权利要求3的语音对话系统，其中包括，作为所述块之一，第一个块具有第一再现步骤，用于再现所述一个句子，以促使所述用户讲话；第一讲话等待和识别步骤，用于在上述的第一再现步骤之后，等待所述用户的讲话，并在所述用户讲话时，识别上面讲话的内容；第二再现步骤，在所述第一讲话等待和识别步骤之后，根据上面讲话的内容是肯定的还是否定的，来再现以前提供的一个相应的句子。5.根据权利要求4的语音对话系统，包括作为所述块之一，第二块具有第一答复句子请求的产生步骤，当在所述第一讲话等待和识别步骤中所识别的所述用户的讲话内容既非是肯定的也非否定的时，就请求所述响应产生装置产生相应于所述用户讲话的内容的所述答复句子。6.根据权利要求5的语音对话系统，包括作为所述块之一，第三块具有第一循环，其中，如果所述答复句子的属性是第一循环类型，就返回到所述第一讲话等待和识别步骤，所述答复句子是由响应所述第一答复句子请求的产生步骤中的所述请求的响应产生部分产生的。7.根据权利要求5的语音对话系统，其中包括作为所述块之一，第四块具有第二循环，其中，如果所述答复句子的属性是第二循环类型，就等待所述用户的讲话，并且在所述用户讲话时，就识别上面讲话的内容，然后返回到所述答复句子请求的产生步骤，所述答复句子是由响应所述第一产生答复句子的请求步骤中的所述请求的响应产生部分产生的。8.根据权利要求5的语音对话系统，包括作为所述块之一，第五块具有确定步骤，用于确定所述答复句子的属性，该答复句子是由所述第一产生答复句子的请求步骤中的所述请求的响应产生部分产生的。第一循环，其中，如果在上述确定步骤中确定的所述答复句子的所述属性是第一循环类型，就返回到所述第一讲话等待和识别步骤；和第二循环，其中，如果在上述确定步骤中确定的所述答复句子的所述属性是第二循环类型，就等待所述用户的讲话，并在所述用户讲话时，识别上面讲话的内容，然后返回到所述答复句子请求的产生步骤。9.根据权利要求3的语音对话系统，包括作为所述块之一，第六块具有第二再现步骤，用于再现所述一个句子，如果需要，可在所述场景中省略这个句子；第二讲话等待和识别步骤，用于在所述第二再现步骤之后等待所述用户的讲话，并在所述用户讲话时，用于识别上述讲话的内容；和第二答复句子请求的产生步骤，在所述第二讲话等待和识别步骤之后，用于请求所述响应产生装置产生相应于所述用户讲话的内容的所述答复句子。10.根据权利要求9的语音对话系统，其中包括作为所述块之一，第七块具有第三循环，其中，如果答复句子的属性是第三循环类型，就返回到所述第二讲话等待和识别步骤，所述答复句子是由响应所述第二答复句子请求的产生步骤中的所述请求的响应产生部分产生的。11.一种语音对话方法...

【专利技术属性】
技术研发人员：广江厚夫，下村秀树，赫尔穆特勒克，南野活树，加藤晴，
申请(专利权)人：索尼株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人