The present invention provides a method for generating semantic expressions for Q in the knowledge base, knowledge base includes a plurality of standard questions, each standard has associated a similar question, the method includes: for each standard and several similar questions asked to obtain a plurality of corresponding similar sentence segmentation results, which each similar sentence segmentation results by the similarity of each word sentence belong to lexical category; for each standard questions, from the standard Q multiple similar sentence segmentation results in the intersection based on frequency selective phrase phrases appear to form the standard questions at least one semantic expression, each phrase consists of a predetermined number of lexical category for all the standard composition; ask all the similar questions, ask for the implementation of standards, processing, ask each semantic expression created for each standard, the judgment of the language Whether the expression is matched to the meaning of the standard asked at least a similar question, if the semantic expression is marked as the first state, otherwise it is labeled as second state; and delete all state semantic expressions of the second state.
【技术实现步骤摘要】
语义表达式生成方法及装置
本专利技术涉及人机交互
,尤其涉及一种用于为知识库中的标准问生成语义表达式的方法及装置。
技术介绍
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。为此,智能问答系统中有一套知识库,里面有大量的问题和与每个问题相对应的答案。智能问答系统首先需要识别用户所提出的问题,即从知识库中找到与该用户问题所对应的问题,然后找出与该问题相匹配的答案。因此,如何高效地维护知识库至关重要。
技术实现思路
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的 ...
【技术保护点】
一种用于为知识库中的标准问生成语义表达式的方法,所述知识库包括多个标准问,每个标准问具有相关联的多个相似问句,所述方法包括:数据获取步骤,针对每个标准问获得与其多个相似问句相应的多个相似问句分词结果,其中每个相似问句分词结果由对应相似问句的各单词所属的词类组成;语义表达式创建步骤,针对每个标准问,从该标准问的多个相似问句分词结果的交集中依据词组出现的频率选择词组以构成该标准问的至少一个语义表达式,每个词组由预定数目个词类组成;检测步骤,针对所有标准问的所有相似问句,执行标准问匹配处理,对于为每个标准问创建的每个语义表达式,判断该语义表达式是否被匹配至其标准问的至少一个相似问 ...
【技术特征摘要】
1.一种用于为知识库中的标准问生成语义表达式的方法,所述知识库包括多个标准问,每个标准问具有相关联的多个相似问句,所述方法包括:数据获取步骤,针对每个标准问获得与其多个相似问句相应的多个相似问句分词结果,其中每个相似问句分词结果由对应相似问句的各单词所属的词类组成;语义表达式创建步骤,针对每个标准问,从该标准问的多个相似问句分词结果的交集中依据词组出现的频率选择词组以构成该标准问的至少一个语义表达式,每个词组由预定数目个词类组成;检测步骤,针对所有标准问的所有相似问句,执行标准问匹配处理,对于为每个标准问创建的每个语义表达式,判断该语义表达式是否被匹配至其标准问的至少一个相似问句,若是,则该语义表达式被标记为第一状态,否则被标记为第二状态;以及删除步骤,删除所有状态为第二状态的语义表达式。2.如权利要求1所述的方法,其特征在于,在所述语义表达式创建步骤中,针对每个标准问,从该标准问的多个相似问句分词结果的交集中选择出现频率最高的词组,将选出的词组作为该标准问的一个语义表达式,然后从该标准问的未包括该词组的相似问句分词结果的交集中选择出现频率最高的词组,将选出的词组继续作为该标准问的一个语义表达式,重复此过程直至该标准问下没有其余的相似问句分词结果或者剩余的相似问句分词结果之间没有达到所述预定数目个词类的交集。3.如权利要求1所述的方法,其特征在于,在所述检测步骤中,针对每个相似问句,所述执行标准问匹配处理包括将该相似问句与针对所有标准问生成的所有语义表达式执行语义相似度计算,并将该相似问句匹配至具有最高语义相似度且该最高语义相似度高于阈值的语义表达式。4.如权利要求1所述的方法,其特征在于,所述检测步骤还包括:在执行所述标准问匹配处理之后,对于每个标准问的每个相似问句,判断该相似问句是否被匹配至与之相关联的标准问所属的语义表达式,若是将该相似问句标记为第四状态,否则将该相似问句标记为第三状态,其中,所述方法还包括循环执行所述语义表达式创建步骤、所述检测步骤、和所述删除步骤预定次数,其中,所述语义表达式创建步骤中组成所述词组的词类的所述预定数目随着循环依次递增,且在后续循环中只有状态为第三状态的相似问句参与语义表达式创建。5.如权利要求4所述的方法,其特征在于,在每个循环周期中,在执行所述删除步骤之后,再次针对所有标准问的所有相似问句,执行标准问匹配处理,然后若是有状态为第三状态的相似问句被匹配至与之相关联的标准问所属的语义表达式,则该相似问句的状态由第三状态改为第四状态。6.如权利要求4所述的方法,其特征在于,以所述预定次数的循环为一个例程,重复执行所述例程若干次,后续每次例程中,只有状态为第三状态的相似问句参与语义表达式创建。7.如权利要求1所述的方法,其特征在于,所述预定数目大于等于1。8.如权利要求1所述的方法,其特征在于,在所述语义表达式创建步骤中,按照复杂度由低到高的顺序为各标准问创建语义表达式,在创建过程中,若为在后的标准问生成的语义表达式与在前的标准问的已生成语义表达式重复,则该重复的语义表达式不作为该在后的标准问的语义表达式保存。9.如权利要求8所述的方法,其特征在于,所述复杂度基于标准问的字数,字数越少复杂度越低。10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9中任一项所述方法的步骤。11.一种用于为知识库中的标准问生成语义表达式的装置,所述知识库包括多个标准问,每个标准...
【专利技术属性】
技术研发人员:李陟,朱频频,
申请(专利权)人:上海智臻智能网络科技股份有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。