语音交互系统及其创建方法和装置制造方法及图纸

技术编号:15329870 阅读:84 留言:0更新日期:2017-05-16 13:27
本发明专利技术提供了一种语音交互系统及其创建方法和装置。一种用于创建语音交互系统的方法,包括:接收语音用户交互流程图,所述语音用户交互流程图包括依照预定流程流转的多个流程;基于所述多个流程创建知识库,其中,所述多个流程包括第一流程和位于所述第一流程下游的第二流程,所述第一流程所对应的第一知识点的答案为问句型答案,且与所述第二流程所对应的第二知识点的问题是对所述第一知识点的问句型答案的响应;提供语言模型以用于对用户的语音输入执行语音识别;以及提供所述知识库中的知识点以用于对获得的语音识别结果执行语义识别。本发明专利技术通过建立知识库的方式,利用知识库中知识点的匹配,来实现流程之间的流转,降低了实施难度。

Voice interaction system and method and device for creating the same

The invention provides a voice interactive system and a method and a device for creating the same. A method for creating a voice interactive system includes: receiving voice user interaction flow chart, the flow chart of voice user interaction in multiple process reservation process flow; wherein the plurality of process to create knowledge base, based on the plurality of processes including the first process and located in the downstream of the first process second processes, corresponding to the first process first knowledge of the answer to ask answer sentence, and corresponding to the second process knowledge of the second point is a response to the first question answer sentence knowledge points; provide language model for performing speech recognition speech to the user input; and the knowledge in the knowledge base for the speech recognition results obtained to perform semantic recognition. The invention realizes the flow between the processes by establishing the knowledge base, and utilizes the matching of the knowledge points in the knowledge base, thereby reducing the difficulty of the implementation.

【技术实现步骤摘要】
语音交互系统及其创建方法和装置
本专利技术涉及人机交互
,尤其涉及一种语音交互系统以及创建语音交互系统的方法和装置。
技术介绍
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。语音交互系统是一种特殊的智能问答系统,即用户提出的问题是以语音的形式输入的。因此,语音交互系统中,首先需要将语音形式的用户问题,即语音输入识别为文字形式的用户问题,然后再通过上述语义解析过程理解用户的问题,并给出相应的答案。传统上,设计语音交互系统是基于客户给出的语音用户交互流程图,开发使用者对应的VoiceXML来实现用户语义理解及后续的处理流程。VoiceXML是建立于XML语言规范基础之上,是一种应用于语音浏览的标记语言。利用VoiceXML可以建立基于WEB的语音应用和服务。基于此传统设计方式,将需要识别的语料写入语法,生成语言模型,再将需要理解的语料分好类,生成语义模型。然后在语音交互系统中加载好语言和语义模型,并写好每个语义分类对应的vxml(voiceextensiblemarkuplanguage,话音可扩展标记语言)。语言模型用于识别用户的语音输入,将其转换为文字形式的用户输入。语义模型是用来理解该文字形式的用户输入的含义,以确定后续流程。比如账单查询的分类tag为:bill。vxml中需要写明,当识别语义解析结果为bill时,则走对应的流程,比如接下来的话术为:“你想查询哪个月的账单?”然后等待用户输入再识别,识别为“当月”,当月的分类tag为month.继续往下走对应的流程。此基于VoiceXML的开发方式需要有专门的开发人员写vxml,增加了实施难度,而且需要和写语义模型的人需要约定语义分类tag.才能继续进行,增加了沟通成本。每次增删改流程,都需要在系统中重新载入语言模型、语义模型和vxml,不能实时生效。
技术实现思路
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。本专利技术提供了一种语音交互系统及其创建方法和装置,以解决语音交互系统创建过程中流程之间的流转的开发实施难度高的问题。第一方面,本专利技术提供了一种用于创建语音交互系统的方法,包括:接收语音用户交互流程图,所述语音用户交互流程图包括依照预定流程流转的多个流程;基于所述多个流程创建知识库,所述知识库包括与所述多个流程相对应的多个知识点,每个知识点包括问题及其答案,其中,所述多个流程包括第一流程和位于所述第一流程下游的第二流程,所述第一流程所对应的第一知识点的答案为问句型答案,且与所述第二流程所对应的第二知识点的问题是对所述第一知识点的问句型答案的响应;提供语言模型以用于对用户的语音输入执行语音识别;以及提供所述知识库中的知识点以用于对获得的语音识别结果执行语义识别。第二方面,本专利技术提供了一种用于创建语音交互系统的装置,包括:接收模块,用于接收语音用户交互流程图,所述语音用户交互流程图包括依照预定流程流转的多个流程;知识库创建模块,用于基于所述多个流程创建知识库,所述知识库包括与所述多个流程相对应的多个知识点,每个知识点包括问题及其答案,其中,所述多个流程包括第一流程和位于所述第一流程下游的第二流程,所述第一流程所对应的第一知识点的答案为问句型答案,且与所述第二流程所对应的第二知识点的问题是对所述第一知识点的问句型答案的响应;语言模型训练模块,用于提供语言模型以用于对用户的语音输入执行语音识别;以及知识点分配模块,提供所述知识库中的知识点以用于对获得的语音识别结果执行语义识别。第三方面,本专利技术提供了一种语音交互系统,包括:上述的方法创建的知识库;语音识别模块,用于采用上述的方法所提供的语言模型对用户语音输入执行语音识别;语义识别模块,用于采用所述知识库中的相应知识点对所述语音识别结果执行语义识别;以及输出模块,用于基于语音识别结果向用户提供响应输出。本专利技术通过建立知识库的方式,利用知识库中知识点的匹配,来实现流程之间的流转。这避免了专门开发人员编写vxml,降低了实施难度。关键在于,相比于传统基于VoiceXML的设计,在增删流程时,只需要在知识库中增删相应的知识点即可,可以实时生效,部署灵活。附图说明在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本专利技术的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。图1是示出了根据本专利技术的一方面的用于创建语音交互系统的方法的流程图;图2示出了语音用户交互流程图的一个示例;图3是示出了根据本专利技术的一方面对标准问进行扩展的方法的流程图;图4是示出了根据本专利技术的一方面的用于创建语音交互系统的装置的框图;以及图5是示出了根据本专利技术的另一方面的扩展单元的框图;以及图6示出了根据本专利技术的一方面的语音交互系统的框图。具体实施方式以下结合附图和具体实施例对本专利技术作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本专利技术的保护范围进行任何限制。对于语音交互系统,用户以语音输入的形式提出问题。为了回答用户的问题,语音交互系统的后台处理主要包括两个部分:语音识别部分和语义识别部分。语音识别部分的作用是基于语音模型对用户的语音输入进行语音识别,以获得文字形式的用户问题。语义识别部分是基于语义模型对文字形式的用户问题进行理解,以了解用户意图,进而给出答案。语音识别技术主要由语言模型训练阶段和使用语言模型的识别阶段构成。上述的语音识别部分即为使用语言模型的识别阶段。语言模型训练阶段是通过大量语料的训练进行语言模型的建模,例如采用SRILM工具进行建模。SRILM全称为StanfordResearchInstituteLanguageModelingToolkit(斯坦福研究所语言建模工具),主要目标是支持语言模型的估计和评测。在建立语言模型后,利用该语言模型对用户输入的语音进行识别。语音识别过程中,语言模型准确与否对于识别结果至关重要。越完善的语言模型可以越准确的语音识别结果。在本专利技术中设计了一套用于语义识别的知识库,知识库中包括众多的知识点。知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。在本专利技术中,“标准问”是用来表示某个知识点的文字,主要目标是表达清晰,便于维护。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。因本文档来自技高网
...
语音交互系统及其创建方法和装置

【技术保护点】
一种用于创建语音交互系统的方法,其特征在于,包括:接收语音用户交互流程图,所述语音用户交互流程图包括依照预定流程流转的多个流程;基于所述多个流程创建知识库,所述知识库包括与所述多个流程相对应的多个知识点,每个知识点包括问题及其答案,其中,所述多个流程包括第一流程和位于所述第一流程下游的第二流程,所述第一流程所对应的第一知识点的答案为问句型答案,且与所述第二流程所对应的第二知识点的问题是对所述第一知识点的问句型答案的响应;提供语言模型以用于对用户的语音输入执行语音识别;以及提供所述知识库中的知识点以用于对获得的语音识别结果执行语义识别。

【技术特征摘要】
1.一种用于创建语音交互系统的方法,其特征在于,包括:接收语音用户交互流程图,所述语音用户交互流程图包括依照预定流程流转的多个流程;基于所述多个流程创建知识库,所述知识库包括与所述多个流程相对应的多个知识点,每个知识点包括问题及其答案,其中,所述多个流程包括第一流程和位于所述第一流程下游的第二流程,所述第一流程所对应的第一知识点的答案为问句型答案,且与所述第二流程所对应的第二知识点的问题是对所述第一知识点的问句型答案的响应;提供语言模型以用于对用户的语音输入执行语音识别;以及提供所述知识库中的知识点以用于对获得的语音识别结果执行语义识别。2.如权利要求1所述的方法,其特征在于,每个知识点中的所述问题包括标准问以及该标准问的扩展问。3.如权利要求2所述的方法,其特征在于,所述扩展问采用以下方式建立:提供抽象语义数据库,所述抽象语义数据库包括多个抽象语义表达式,所述抽象语义表达式包括缺失语义成分;根据所述抽象语义数据库对所述标准问进行抽象语义推荐处理,当获得与所述标准问对应的一个或多个抽象语义表达式时,从所述标准问中提取与一个或多个抽象语义表达式的缺失语义成分对应的内容,并将提取的内容填充到对应的缺失语义成分中以得到与所述标准问对应的一个或多个具体语义表达式,所述具体语义表达式作为所述标准问的扩展问。4.如权利要求3所述的方法,其特征在于,所述抽象语义推荐处理包括:对所述标准问进行分词处理,得到若干单词,所述单词为语义规则词或非语义规则词;分别对每个非语义规则词进行词性标注处理,得到每个非语义规则词的词性信息;分别对每个语义规则词进行词类判断处理,得到每个语义规则词的词类信息;根据所述词性信息和词类信息对抽象语义数据库进行搜索处理,得到与所述标准问匹配的抽象语义表达式。5.如权利要求4所述的方法,其特征在于,所述抽象语义表达式还包括语义规则词,与所述标准问匹配的抽象语义表达式满足以下条件:抽象语义表达式的缺失语义成分对应的词性包括标准问对应的填充内容的词性;抽象语义表达式和标准问中对应的语义规则词相同或属于同一词类;抽象语义表达式的顺序与标准问的表达顺序相同。6.如权利要求1所述的方法,其特征在于,所述提供语言模型包括:针对每个流程,训练专用于该流程的下游流程的语言模型,以用来关于所述下游流程执行用户语音输入的语音识别。7.如权利要求6所述的方法,其特征在于,所述训练包括利用与所述下游流程相对应的知识点中的问题作为语音训练语料训练语言模型。8.如权利要求7所述的方法,其特征在于,所述语言模型通过采用SRILM工具进行训练。9.如权利要求1所述的方法,其特征在于,所述提供所述知识库中的知识点包括:针对每个流程,提供与该流程的下游流程所对应的知识点,以用来关于所述下游流程执行语音识别结果的语义识别。10.一种用于创建语音交互系统的装置,其特征在于,包括:接收模块,用于接收语音用户交互流程图,所述语音用户交互流程图包括依照预定流程流转的多个流程;知识库创建模块,用于基于所述多个流程创建知识库,所述知识库包括与所述多个流程相对应的多个知识点,每个知识点包括问题及其答案,其中,所述多个流程包括第一流程和位于所述第一流程下游的第二流程,所述第一流程所对应的第一知识点的答案为问句型答案,且与所述第二...

【专利技术属性】
技术研发人员:曾永梅李波朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1