The present application provides a method and device for an intelligent response. Including the method of intelligent response provided by the application server: according to the questions sent by the terminal, the first keyword text language form corresponding standard questions, questions for the user language; if the candidate standard problem of multiple standard problems, including second key words text server gets the questions of all keywords, standard standard language; server according to the first keyword text and candidate standard respective VSM vector, second key words and text candidate standards their subject distribution vector, to answer questions and get the similarity of each candidate standard; the server according to the similarity questions and each candidate standard problem, get answers to questions. Method and apparatus for the application of the intelligent response, reduced when the user language and standard language are not the same, do not answer questions related with the probability of obtaining the server.
【技术实现步骤摘要】
智能应答的方法和装置
本申请涉及智能应答技术,尤其涉及一种智能应答的方法和装置。
技术介绍
智能应答(QuestionandAnswering,简称QA)技术,可以根据用户输入的自然语言的问题给出准确人性化的回答,目前在医疗、通信等领域都有着广泛的应用,智能办公、智能客服机器人已经能够代替部分人工工作。比较常见的智能问答系统为基于知识库的问答系统,现阶段最常用的知识库为常见问题库(FrequentlyAskedQuestions,简称FAQ),FAQ库是通过收集整理一些常见的标准问题和对应的标准答案建立的知识库。基于FAQ库的智能应答的方法一般为:服务器获取用户通过终端输入的待答问题,若待答问题的语言为用户语言,FAQ库中存储的标准问题的语言为标准语言,用户语言和标准语言不相同,则服务器先将待答问题机器翻译成标准语言形式的问题,称为处理后的待答问题。接着提取处理后的待答问题的所有关键词,得到关键词文本。若FAQ库中存在候选标准问题,候选标准问题为包括处理后的待答问题的至少一个关键词的标准问题,则获取关键词文本和各候选标准问题的向量空间模型(VectorSpaceM ...
【技术保护点】
一种智能应答的方法,待答问题的语言为用户语言,服务器中预存的多个标准问题的语言为标准语言,所述用户语言和所述标准语言不相同,其特征在于,包括:服务器根据终端发送的待答问题,得到所述待答问题对应的第一关键词文本,所述第一关键词文本包括处理后的待答问题的所有关键词,所述处理后的待答问题为将所述待答问题转化为标准语言形式后的问题;若所述多个标准问题中存在至少一个候选标准问题,所述候选标准问题为包括所述第一关键词文本中至少一个关键词的标准问题,则所述服务器获取所述待答问题对应的第二关键词文本,所述第二关键词文本包括所述待答问题的所有关键词;所述服务器根据所述第一关键词文本和所述候选 ...
【技术特征摘要】
1.一种智能应答的方法,待答问题的语言为用户语言,服务器中预存的多个标准问题的语言为标准语言,所述用户语言和所述标准语言不相同,其特征在于,包括:服务器根据终端发送的待答问题,得到所述待答问题对应的第一关键词文本,所述第一关键词文本包括处理后的待答问题的所有关键词,所述处理后的待答问题为将所述待答问题转化为标准语言形式后的问题;若所述多个标准问题中存在至少一个候选标准问题,所述候选标准问题为包括所述第一关键词文本中至少一个关键词的标准问题,则所述服务器获取所述待答问题对应的第二关键词文本,所述第二关键词文本包括所述待答问题的所有关键词;所述服务器根据所述第一关键词文本和所述候选标准问题各自的空间向量模型VSM向量,所述第二关键词文本和所述候选标准问题各自的主题分布向量,得到所述待答问题与每个所述候选标准问题的相似度;所述VSM向量为文本的各关键词各自在所述文本中的权重值组成的向量,所述主题分布向量为各预设主题在文本中各自出现的概率组成的向量;所述服务器根据所述待答问题与每个候选标准问题的相似度,获取所述待答问题的答案;所述待答问题的答案为所有候选标准问题中与所述待答问题的相似度最大、且与所述待答问题的相似度大于预设阈值的候选标准问题的标准答案;所述服务器将所述待答问题的答案发送至所述终端。2.根据权利要求1所述的方法,其特征在于,若预设的多个标准问题中不存在候选标准问题,则所述服务器获取所述待答问题对应的第二关键词文本;所述服务器根据所述第一关键词文本的VSM向量和所述第二关键词文本的主题分布向量,得到特定相似度;所述服务器根据所述特定相似度,得到预设答案,所述预设答案用于指示所述多个标准问题各自对应的标准答案中不存在所述待答问题的答案;所述服务器将所述预设答案发送至所述终端。3.根据权利要求1所述的方法,其特征在于,若预设的多个标准问题中不存在候选标准问题,则所述服务器获取预设答案,所述预设答案用于指示所述多个标准问题各自对应的标准答案中不存在所述待答问题的答案;所述服务器将所述预设答案发送至所述终端。4.根据权利要求1所述的方法,其特征在于,所述服务器根据所述第一关键词文本和所述候选标准问题各自的VSM向量,所述第二关键词文本和所述候选标准问题各自的主题分布向量,得到所述待答问题与每个所述候选标准问题的相似度,包括:对于每个候选标准问题,所述服务器根据所述第一关键词文本的VSM向量和所述候选标准问题的VSM向量的余弦距离,得到VSM相似度;所述服务器根据所述第二关键词文本的主题分布向量和所述候选标准问题的主题分布向量的相对熵,得到语义相似度;所述服务器根据所述VSM相似度和语义相似度的线性加权和,得到所述待答问题和所述候选标准问题的相似度。5.根据权利要求1所述的方法,其特征在于,所述服务器根据终端发送的待答问题,得到所述待答问题对应的第一关键词文本,包括:所述服务器将所述待答问题转换为所述标准语言形式的问题,得到处理后的待答问题;所述服务器提取所述处理后的待答问题的所有关键词,得到所述第一关键词文本。6.根据权利要求1所述的方法,其特征在于,在所述服务器根据所述第一关键词文本和所述候选标准问题各自的VSM向量,所述第二关键词文本和所述候选标准问题各自的主题分布向量,得到所述待答问题与每个所述候选标准问题的相似度之前,还包括:对于每个所述候选标准问题,所述服务器根据所述候选标准问题的所有关键词和主题-词语共现频率矩阵,得到所述候选标准问题的主题分布向量;所述主题-词语共现频率矩阵为各所述预设主题采用各训练词语的概率组成的矩阵,是所述服务器对多个训练文档训练得到的;每个训练文档包括多个训练问题,每个训练文档包括的各训练问题对应的答案的语义相同,且每个训练文档包括的各训练问题的语言不同,多个所述训练词语为多个所述训练文档对应的所有训练问题的关键词;所述服务器根据所述第二关键词文本和所述主题-词语共现频率矩阵,得到所述第二关键词文本的主题分布向量。7.根据权利要求6所述的方法,其特征在于,所述服务器根据所述候选标准问题的所有关键词和主题-词语共现频率矩阵,得到所述候选标准问题的主题分布向量,包括:所述服务器根据所述主题-词语共现频率矩阵,通过吉布斯采样的方法,对所述候选标准问题包括的各关键词进行主题采样,得到所述候选标准问题的主题分布向量。8.根据权利要求6所述的方法,其特征在于,所述服务器根据所述第二关键文本和所述主题-词语共现频率矩阵,得到所述第二关键词文本的主题分布向量,包括:所述服务器根据所述主题-词语共现频率矩阵,通过...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。