一种智能应答方法及其系统技术方案

技术编号:17779891 阅读:29 留言:0更新日期:2018-04-22 08:29
本发明专利技术公开了一种智能应答方法及其系统,包括:建立物流问题字典,为所述物流问题设置答案并记录在物流问题字典中;将用户提出的未知物流问题与所述录入物流问题字典中处理后的物流问题进行模糊匹配;物流问题字典得到不断学习和完善并建立多语种的所述物流问题字典以及为所述物流问题设置对应答案;根据用户选择的目标语种给用户语音输出所述答案,实现智能应答。本发明专利技术针对物流行业用户经常提问的问题,采用语义分析技术处理这类问题并有针对性地为用户设置问题答案,形成物流问题答案字典,改善了现有技术中软件在自动应答时准确率较低,无法满足用户多种提问方式、用户体验较差以及用户可选择语言单一等问题。

【技术实现步骤摘要】
一种智能应答方法及其系统
本专利技术涉及一种智能应答方法及其系统,属于人机交互

技术介绍
目前,市场上关于物流运输业的智能应答系统存在较大的问题,最普遍的一个问题就是这些软件识别问题太过机械,识别度较低,经常会出现答非所问的情形,另外现有软件可选语言比较单一,无法满足业务辐射周边国家的物流运输需求。这些软件大部分采用的是基于字符串层面匹配的关键词匹配,即关键词和答案构建特征向量的方法,没有对用户的问题进行语义分析,问题中出现多义词的情况时软件会理解错误,最终给出了错误的答案,所以这类准确率较低,无法解决用户多种提问方式以及一个问题对应多个关键字的问题,用户体验较差。现有技术中的搜索方式速度快、易操作但准确率却很低,无法满足物流行业真实场景下智能、准确、多次使用的需求。
技术实现思路
本专利技术为解决现有技术中存在的不足,提出一种智能应答方法及其系统,本专利技术针对物流行业用户经常问的问题,采用语义分析技术处理用户物流问题并对用户提出的问题设置针对性的答案,形成物流问题答案字典,该方案解决了现有技术中大多采用基于字符串层面匹配的关键词匹配并且答案是直接到互联网中进行搜索出现的问题,以改善现有技术中软件在自动应答时准确率较低,无法满足用户多种提问方式用户体验较差以及用户可选择语言单一的问题。为了解决上述技术问题,本专利技术提供了一种智能应答方法,包括以下步骤:步骤1、建立物流问题字典,为物流问题设置答案并记录在物流问题字典中;步骤2、将用户提出的未知物流问题与所述物流问题字典中的物流问题进行模糊匹配,若两者相似度超过预设阈值,则录入物流问题字典中物流问题所对应的答案;否则,将所述未知问题加入物流问题字典中并设置该未知物流问题对应的答案;步骤3、给用户输出相应答案;其中,所述步骤1包括以下步骤:步骤101、收集用户提出的物流相关问题并进行语音转换;步骤102、将语音转换后的物流问题进行分词和词性标注、预处理、语义分析后录入物流问题字典中;步骤103、为录入物流问题字典中的物流问题设置答案;其中,步骤102中的预处理包括:采用停用词表去除分词后跟物流行业问题无关的词语。进一步的,在步骤3之前还包括重复步骤2,完善物流问题字典并建立多语种;根据用户选择的目标语种语音为用户输出相应答案。进一步的,步骤102中,所述语义分析包括:a.构造词类模型,将所述物流问题字典中的词语表示在词类模型空间上;b.使用文本聚类算法对物流问题字典进行文本聚类,将物流问题字典进行分类。其中,步骤a中的构造词类模型包括:词义消歧和词义聚类,采用Bayes模型进行词义消歧,采用BisectingK-means聚类算法进行词义聚类。进一步的,文本聚类算法采用基于K-means聚类算法,主要步骤包括:步骤1、随机选取k条物流问题字典生成k个聚类,所述k条物流问题字典分别对应k个聚类的聚类起始中心点为{u1,u2,u3,...,uk};步骤2、采用NIST标准计算每条物流问题字典与每个聚类起始中心点对应问题文本的相似度,根据与聚类起始中心点的问题文本的相似程度将其分配到最近的一类中,获得新的聚类结果{U1,U2,U3,...,Uk},其中Ui(1≤i≤k)是若干物流问题字典的集合;步骤3、重新计算每个Ui(1≤i≤k)的中心其中,m是所述集合Ui(1≤i≤k)中数据的总数,cj是指Ui(1≤i≤k)中第j个数据;步骤4、当下面的目标函数收敛时,终止迭代,否则重复步骤2和步骤3,判断是否终止迭代的目标函数表示为:其中,E函数代表某一条物流问题字典所属类别到其聚类起始中心点的距离平方和。进一步的,步骤2中的模糊匹配,通过相似度计算来将用户提出的未知物流问题与录入物流问题字典中处理后的物流问题关联,相似度计算采用Shingle算法、距离编辑算法、余弦定理、Sunday算法中的任一种。本专利技术还公开了一种智能应答系统,包括:字典创建模块,用于建立物流问题字典,为所述物流问题设置答案并记录在物流问题字典模块中;问题查找模块,用于将用户提出的未知物流问题与录入物流问题字典中处理后的物流问题进行模糊匹配,若两者相似度超过预设阈值,则录入物流问题字典中处理后的物流问题对应的答案;否则,将所述未知问题加入所述物流问题字典中并设置所述物流问题对应的答案;学习训练模块,用于利用字典创建模块和问题查找模块将所述物流问题字典不断学习和完善并建立多语种的所述物流问题字典以及为所述物流问题设置对应答案;应答输出模块,用于根据用户选择的目标语种语音输出所述答案给用户,实现智能应答。进一步的,字典创建模块包括:语音转换模块,用于将收集到的用户提出的物流相关问题进行语音转换;语义分析模块,用于将语音转换后的物流问题进行分词和词性标注、预处理、语义分析后录入所述字典创建模块中;答案设置模块,用于为处理后的录入物流问题字典中的物流问题设置答案。进一步的,语义分析模块还包括:模型构造模块,用于将所述物流问题字典中的词语表示在词类模型空间上;文本聚类模块,用于使用文本聚类算法对所述物流问题字典进行文本聚类,将所述物流问题字典分成多类。有益效果:本专利技术与现有技术相比,具有以下优点:本专利技术采用改进后的K-Means算法进行聚类,K-Means方法可用来处理大量的数据,而且效率较高,操作简单,因此用该算法来处理大量数据的聚类难题是比较有效的;利用词类模型代替VSM模型来表示文本,该方案解决了由于同义词和多义词等语义问题导致的用户多种提问方式以及软件应答准确率低,用户语言选择单一的问题,满足了智能、准确、多次使用的需求,提高了用户体验。附图说明图1为本专利技术的一种智能应答方法的流程图;图2为本专利技术的构造词类模型的结构图;图3是本专利技术的K-Means聚类算法流程图;图4是本专利技术一种智能应答系统结构图。具体实施方式如图1所示,本专利技术提供了一种智能应答方法,主要包括四个部分:建立物流问题字典、问题查找、学习训练、应答输出。物流问题字典创建阶段包括为物流问题设置答案并记录在物流问题字典中;问题查找阶段包括将用户提出的未知物流问题与录入物流问题字典中处理后的物流问题进行模糊匹配,由两者相似度与预设阈值的大小关系决定是否添加到物流问题字典还是直接输出答案;学习训练阶段包括学习和完善物流问题字典并建立多语种的物流问题字典以及设置对应答案;问题输出阶段包括根据用户选择的目标语种语音输出对应问题答案给用户,实现智能应答。一、创建物流问题字典该阶段又分为3个阶段,分别为语音转换、语义分析和答案设置。语音转换任务是收集用户提出的物流相关问题并进行语音转换;语音分析的任务是语音转换后的物流问题进行分词、词性标注、预处理和语义分析后录入物流问题字典中;答案设置的任务是为物流问题字典中的物流问题设置答案。1、语音转换主要通过建立识别基本单元的声学模型以及语言模型,再将输入的目标语音的特征参数和模型进行比较,从而得到识别结果。2、语义分析包括:语音转换后得到有限条物流问题,由于程序的局限性,会得到无关行业的问题,先要对这些问题文本集进行预处理,分词是预处理中的重点,现在最经典的分词技术包括两种:基于字符串匹配分词方法以及基于统计的分词方法。本实施例采用ICTCLAS分词工具,ICTCLAS为InstituteofComput本文档来自技高网...
一种智能应答方法及其系统

【技术保护点】
一种智能应答方法,其特征在于,包括以下步骤:步骤1、建立物流问题字典,为物流问题设置答案并记录在物流问题字典中;步骤2、将用户提出的未知物流问题与所述物流问题字典中的物流问题进行模糊匹配,若两者相似度超过预设阈值,则录入物流问题字典中物流问题所对应的答案;否则,将所述未知问题加入物流问题字典中并设置该未知物流问题对应的答案;步骤3、给用户输出相应答案;其中,所述步骤1包括以下步骤:步骤101、收集用户提出的物流相关问题并进行语音转换;步骤102、将语音转换后的物流问题进行分词和词性标注、预处理、语义分析后录入物流问题字典中;步骤103、为录入物流问题字典中的物流问题设置答案;其中,步骤102中的预处理包括:采用停用词表去除分词后跟物流行业问题无关的词语。

【技术特征摘要】
1.一种智能应答方法,其特征在于,包括以下步骤:步骤1、建立物流问题字典,为物流问题设置答案并记录在物流问题字典中;步骤2、将用户提出的未知物流问题与所述物流问题字典中的物流问题进行模糊匹配,若两者相似度超过预设阈值,则录入物流问题字典中物流问题所对应的答案;否则,将所述未知问题加入物流问题字典中并设置该未知物流问题对应的答案;步骤3、给用户输出相应答案;其中,所述步骤1包括以下步骤:步骤101、收集用户提出的物流相关问题并进行语音转换;步骤102、将语音转换后的物流问题进行分词和词性标注、预处理、语义分析后录入物流问题字典中;步骤103、为录入物流问题字典中的物流问题设置答案;其中,步骤102中的预处理包括:采用停用词表去除分词后跟物流行业问题无关的词语。2.根据权利要求1所述的一种智能应答方法,其特征在于:在步骤3之前还包括重复步骤2,完善物流问题字典并建立多语种;根据用户选择的目标语种语音为用户输出相应答案。3.根据权利要求1所述的一种智能应答方法,其特征在于:所述步骤102中,所述语义分析包括:a.构造词类模型,将所述物流问题字典中的词语表示在词类模型空间上;b.使用文本聚类算法对物流问题字典进行文本聚类,将物流问题字典进行分类。其中,步骤a中的构造词类模型包括:词义消歧和词义聚类,采用Bayes模型进行词义消歧,采用BisectingK-means聚类算法进行词义聚类。4.根据权利要求3所述的一种智能应答方法,其特征在于:所述文本聚类算法采用基于K-means聚类算法,主要步骤包括:步骤1、随机选取k条物流问题字典生成k个聚类,所述k条物流问题字典分别对应k个聚类的聚类起始中心点为{u1,u2,u3,...,uk};步骤2、采用NIST标准计算每条物流问题字典与每个聚类起始中心点对应问题文本的相似度,根据与聚类起始中心点的问题文本的相似程度将其分配到最近的一类中,获得新的聚类结果{U1,U2,U3,...,Uk},其中Ui(1≤i≤k)是若干物流问题字典的集合;步骤3、重新计...

【专利技术属性】
技术研发人员:施文进施俊
申请(专利权)人:惠龙易通国际物流股份有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1