本发明专利技术公开一种人机对话的语义分析方法及系统,方法包括:获取训练语料,通过所述训练语料训练出情感函数,所述情感函数对输入的语句计算对应的情感值;获取用户输入语句,将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值;从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。本发明专利技术通过函数训练得到计算情感值的情感函数,从而能够将用户输入语句计算出相应的情感值,从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,从而能够更好地回答用户的输入。
【技术实现步骤摘要】
本专利技术涉及人机对话相关
,特别是一种人机对话的语义分析方法及系 统。
技术介绍
现在的人机对话问答系统中,当用户输入问题后,识别用户所要询问的意图是整 个问答系统中核心的部分,意图识别正确但准确率太低,会造成后期给用户返回答案时,答 案太多而无法选择最优答案的问题;意图识别错误会造成无法理解用户的意思,从而会给 用户提供其不想要的答案或者直接无法给出答案。现有的技术做法是: 模型预测:该方法主要是先由人工进行分类和语料的标注,然后通过决策树或者 分类算法来训练出一个模型,当用户输入一句话后,进行分词、实体抽取和向量转化后,把 处理后的信息输入到模型中来进行预测判断,给出一个用户意图预测的结果。 现有意图识别的方法都是基于人工标注大量的语料来进行训练和预测,由于需要 大量的人工标注,会存在很多的不可控因素,比如每个标注人员对于语料理解的不同会导 致不同的标注结果,对相同的问题会有重复标注的结果,以及不同的分类标注里有相同语 料的标注;而且当需要添加新的意图分类的时候,必须由相关人员进行商讨、确定,再培训 标注人员才能开始进行标注工作,机器无法自动添加新的分类。在整个训练模型的过程中 会消耗大量的人力物力,并且由于诸多的不可控因素会影响函数训练的速度和进度。 在实际过程中模型预测也很难区分用户是在询问问题还是和问答系统进行聊天, 用户在实际使用时是不会提示机器自己的意图是什么,所以需要问答系统来识别和区分, 如果光靠模型的预测就需要在语料里加入大量的聊天语料来进行训练,大量聊天语料的存 在势必会造成其他分类语料权重的降低,从而影响其他意图分类的准确性,而不加入聊天 语料则又会影响到意图识别的最终效果。最终整个系统的效果也会大打折扣。
技术实现思路
基于此,有必要针对现有技术中无法对用户进行语义分析,从而对用户的意图识 别不准确的技术问题,提供一种人机对话的语义分析方法及系统。 -种人机对话的语义分析方法,包括: 函数训练步骤,包括:获取包括多个训练语句的训练语料,通过所述训练语料训练 出情感函数,所述情感函数对输入的语句计算对应的情感值; 情感值计算步骤,包括:获取用户输入语句,将所述用户输入语句输入所述情感函 数后得出关于所述用户输入语句的情感值作为用户情感值; 情感执行步骤,包括:从与所述用户输入语句相关的多个回答答案中,选择满足所 述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。 一种人机对话的语义分析系统,包括: 函数训练模块,用于:获取包括多个训练语句的训练语料,通过所述训练语料训练 出情感函数,所述情感函数对输入的语句计算对应的情感值; 情感值计算模块,用于:获取用户输入语句,将所述用户输入语句输入所述情感函 数后得出关于所述用户输入语句的情感值作为用户情感值; 情感执行模块,用于:从与所述用户输入语句相关的多个回答答案中,选择满足所 述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。 本专利技术通过函数训练得到计算情感值的情感函数,从而能够将用户输入语句计算 出相应的情感值,并根据情感值选择回答用户的方式,从而能够更好地回答用户的输入。【附图说明】 图1为本专利技术一种人机对话的语义分析方法的工作流程图; 图2为本专利技术最佳实施例的工作流程图; 图3为本专利技术一种人机对话的语义分析系统的结构模块图。【具体实施方式】 下面结合附图和具体实施例对本专利技术做进一步详细的说明。 如图1所示为本专利技术一种人机对话的语义分析方法的工作流程图,包括: 步骤S101,包括:获取包括多个训练语句的训练语料,通过所述训练语料训练出 情感函数,所述情感函数对输入的语句计算对应的情感值; 步骤S102,包括:获取用户输入语句,将所述用户输入语句输入所述情感函数后 得出关于所述用户输入语句的情感值作为用户情感值; 步骤S103,包括:从与所述用户输入语句相关的多个回答答案中,选择满足所述 用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。 用户的各种意图识别其实也是用模型去拟合用户的问题,语义分析就是用函数拟 合出合适的模型的方式,最后可以得到的可以比较意图类别的情感函数,则可以直接得出 用户的意图。 本专利技术通过步骤S101训练情感函数,并在步骤S102对用户输入语句在情感函数 中计算得到对应的用户情感值。在步骤S103中,根据用户情感值选择对应的回答答案并显 不〇 本专利技术由于采用训练模型获取用户情感值,因此使实体识别的准确率得到了明显 提高,并且也大大提高了模型迭代速度和节省了人力成本;更重要的是当用户量大的时候, 对于同一个问题会有多种的问法,当初始训练的样本不足时,可能无法得到用户的意图,然 而通过不断的训练则可以提高获取用户意图的可能性。经过一段时间后,可以将获得的用 户输入语句对情感函数进行输入,从而对算法的参数和语料进行自动的补充和调优。 计算情感值,可以通过在训练语料中,预先对每个训练语句设定相应的情感值,然 后通过函数拟合的方式,拟合出一条能对输入的语句计算出相应的情感值的函数。然而,采 用预先设定情感值的方式,需要人工大量的打分,因此会导致出现比较大量的主观判断,从 而影响实际的语义分析结果。 在其中一个实施例中: 所述步骤101,具体包括:获取包括多个训练语句的训练语料,每个训练语句与一 种情感类型关联,对所述训练语料进行训练,得到用于对情感类型进行分类的情感函数,所 述情感值用于表示输入情感函数的语句所属的情感类型; 所述步骤102,具体包括:根据所述用户情感值确定对应的情感类型为用户情感 类型,从与所述用户输入语句相关的多个回答答案中,选择所述用户情感类型所对应的回 答答案作为语义分析答案,显示所述语义分析答案。 本实施例中情感函数是对情感类型进行分类,因此无需对训练语句进行打分,只 要预先将训练语句进行分类,使得最终的语义分析结果更加具有客观性。 在其中一个实施例中: 所述步骤S101,还包括:将所述训练语句进行向量化处理得到训练向量值,对多 个所述训练向量值进行训练得到情感函数,所述训练向量值包括多个维度,且每个维度与 一个单词关联,在所述训练向量值中将所述训练语句所包括的单词所对应的维度置1 ; 所述步骤S102,还包括:将所述用户输入语句进行向量化处理得到用户输入向量 值,,所述用户输入向量值包括多个维度,且每个维度与一个单词关联,在所述用户输入向 量值中将所述用户输入语句所包括的单词所对应的维度置1。 在其中一个实施例中: 所述情感类型包括第一情感类型和第二情感类型,所述训练语料包括第一训练语 料和第二训练语料,所述第一训练语料包括多个预先选定的与第一情感类型关联的第一训 练语句,所述第二训练语料包括多个预先选定的与第二情感类型关联的第二训练语句; 所述步骤S101中,分别对第一训练语料进行训练得到第一情感函数,对第二训练 语料进行训练得到第二情感函数; 所述第一情感函数采用【主权项】1. 一种人机对话的语义分析方法,其特征在于,包括: 函数训练步骤,包括:获取包括多个训练语句的训练语料,通过所述训练语料训练出情 感函数,所述情感函数对输入的语句计算对应的情感值; 情感值计算步骤,包括:获取用户输入语句,将所述用户输入语句输本文档来自技高网...

【技术保护点】
一种人机对话的语义分析方法,其特征在于,包括:函数训练步骤,包括:获取包括多个训练语句的训练语料,通过所述训练语料训练出情感函数,所述情感函数对输入的语句计算对应的情感值;情感值计算步骤,包括:获取用户输入语句,将所述用户输入语句输入所述情感函数后得出关于所述用户输入语句的情感值作为用户情感值;情感执行步骤,包括:从与所述用户输入语句相关的多个回答答案中,选择满足所述用户情感值的回答答案作为语义分析答案,显示所述语义分析答案。
【技术特征摘要】
【专利技术属性】
技术研发人员:陶玮,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。