场景化的语义理解与对话生成方法及系统技术方案

技术编号：14938874 阅读：117 留言：0更新日期：2017-04-01 00:52

本发明专利技术提供一种场景化的语义理解与对话生成方法及系统，通过建立用户场景模型，根据分词系统的结果选择确定当前会话的领域；采用选定的场景语义解析器，基于相应的场景化用户模型对本轮的交互内容进行理解；调用相应的场景下的对话生成器，结合对话管理的中间状态进行对话综合并生成本轮交互后的对话结果。该种场景化的语义理解与对话生成方法及系统，简单高效地实现对句子、短语等的自然语言理解，实现计算机自动对短文本的完全自动理解。实现了计算机对自然语言的句子或短语等的自动深层理解和对话交互，满足了用户需要机器自动精确理解交互语用的目的。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种场景化的语义理解与对话生成方法，属于自然语言分析、处理以及语义理解领域，特别是针对特定场景下的自然语言语义理解方法。
技术介绍
人工智能技术发展由来已久，而作为人工智能领域中最重要方向之一的自然语言理解技术也一直是研究的热点，可以说，让计算机理解自然语言是人类一直以来的梦想。目前，自然语言理解技术主要采用基于规则和基于统计两大类理论技术。基于规则的自然语言理解系统构建相对复杂，主要面对受限领域的理解问题。而基于统计的方法逐步成为自然语言处理领域的主流方法，通常适于在大量数据的基础上进行浅层语义理解，而对于深层语义问题往往无法处理。而针对特定的应用领域，通常所使用的还是基于规则的语义理解。对于一个给定的文本输入，传统的基于规则的自然语言理解其处理流程通常包括以下三个步骤。(1)词义分析：主要目的是对句子中的词汇提取语言学信息，获取词汇的词义。涉及分词、词性标注、命名体识别等等技术，同时在词义处理上需要词义相关的知识库的支持，对此语言专家已经做出了巨大努力，比如已有的知识库“知网”、《同义词词林》等等。(2)句法分析：主要目的是对句子或短语的结构进行分析，获取词汇、短语在句子中的语法功能和相互关系，常用的句法分析方法包括上下文无关文法分析和依存文法分析等等。(3)语义分析：主要目的是要获取句子要表达的实际意义，该部分是自然语言理解系统的核心。深层自然语言理解系统通常需要在该阶段构建相关语义理解的规则，这些规则主要是依赖语言学专家的语言知识和领域知识密切相关。一方面要定义语义项，另一方面要定义从词义、句法结构等信息至语义项的语义转换规则库。对...
场景化的语义理解与对话生成方法及系统

【技术保护点】
一种场景化的语义理解与对话生成方法，其特征在于：包括以下步骤，步骤1、建立用户场景模型，包括用户场景字典模型、场景语义解析模型和用户场景对话模型；步骤2、根据分词系统的结果选择确定当前会话的领域；步骤3、采用选定的场景语义解析器，基于相应的用户场景字典模型、场景语义解析模型对本轮的交互内容进行理解；步骤4、基于用户场景对话模型，创建相应场景下的对话生成器，结合对话管理的中间状态进行对话综合并生成本轮交互后的对话结果；步骤5、重新接收到新的文本输入后，重复步骤2‑4进行语义理解，直到对话系统结束。

【技术特征摘要】
1.一种场景化的语义理解与对话生成方法，其特征在于：包括以下步骤，步骤1、建立用户场景模型，包括用户场景字典模型、场景语义解析模型和用户场景对话模型；步骤2、根据分词系统的结果选择确定当前会话的领域；步骤3、采用选定的场景语义解析器，基于相应的用户场景字典模型、场景语义解析模型对本轮的交互内容进行理解；步骤4、基于用户场景对话模型，创建相应场景下的对话生成器，结合对话管理的中间状态进行对话综合并生成本轮交互后的对话结果；步骤5、重新接收到新的文本输入后，重复步骤2-4进行语义理解，直到对话系统结束。2.如权利要求1所述的场景化的语义理解与对话生成方法，其特征在于：步骤1具体为：步骤1-1、建立用户场景字典模型，通过组合关键字来描述领域特征，以及建立场景语义解析模型，即该特定场景下的语义理解规则；步骤1-2、建立用户场景对话模型，涉及具体场景下的对话交互方式，用于引导用户的对话交互。3.如权利要求1所述的场景化的语义理解与对话生成方法，其特征在于：步骤2具体为：步骤2-1、调用分词系统对当前输入本文进行分词，得到文本的词袋；步骤2-2、将分词结果和用户定义的场景通用模型字典进行匹配，以确定当前对话的应用场景；步骤2-3、根据此轮对话的场景以及对话系统的状态来确定对话最终的语义解析器和对话生成器或者启动新的对话。4.如权利要求3所述的场景化的语义理解与对话生成方法，其特征在于：步骤2-2中，领域模型字典包括领域层和领域特征层，领域层对应不同的应用场景，领域特征层对应该应用场景下的特征向量。5.如权利要求4所述的场景化的语义理解与对话生成方法，其特征在于：步骤2-2中，确定当前对话的应用场景，具体为：步骤2-2-1、针对某个场景的特征向量输入文本的词袋，计算词袋中的单词对特征向量中各个分量的匹配程度mi，其中1≤i≤n；步骤2-2-2、通过加权的方法计算输入文本的词袋与该场景的相关程度：Mj=Σi=1nWi*mi]]>其中，Wi为某个向量的权重；步骤2-2-3、比较各个场景的匹配...

【专利技术属性】
技术研发人员：刘志忠，张亚萍，
申请(专利权)人：南京威卡尔软件有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人