【技术实现步骤摘要】
一种基于FSM多轮问答的语义相似度计算方法
本专利技术涉及一种在电信智能客服系统中用于提高问答对匹配速度和精度的方法——基于FSM多轮问答的语义相似度计算方法。
技术介绍
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。由于传统的人工客服系统在面对服务峰值人数不足,低谷人数不足的情况下,往往会消耗大量人力资源。因此,自然语言处理在智能客服问答系统中的应用,一方面能够提高用户获取相关领域中常见问题的答案的效率,另一方面能够解决传统人工客服响应速度慢,成本高等问题。深度学习中一种基于数据进行表征学习的方法,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。它能通过组合低层特征形成更加抽象的高层特征表示属性类别或特征,以发现数据的分布式特征表示。在智能客服问答系统中,对于电信领域来说,由于存在大量常见问题及其对应答案的数 ...
【技术保护点】
1.一种基于FSM多轮问答的语义相似度计算方法,其特征在于,通过使用FSM多轮问答加DSSM语义相似度计算模型来提供问题匹配的效率和精度。/n
【技术特征摘要】
1.一种基于FSM多轮问答的语义相似度计算方法,其特征在于,通过使用FSM多轮问答加DSSM语义相似度计算模型来提供问题匹配的效率和精度。
2.根据权利要求1所述的一种基于FSM多轮问答的语义相似度计算方法,其特征在于,通过将传统DSSM表示层的双向RNN模型换成能够对输入数据进行并行处理的Transformer,从而加快了模型训练和计算速度。
3.根据权利要求1所述的一种基于FSM多轮问答的语义相似度计算方法,其特征在于,提出一种更灵活的迁移框架,基于权利要求1所述的问答流程,可用于不同垂直领域的智能客服系统,在迁移时,只需要提前整理好该利于常见问答对数据存入知识库,并根据知识库中的数据对DSSM模型进行训练。
4.一种基于FSM多轮问答的语义相似度计算方法,其特征在于,包括如下
步骤1、用户向系统输入所提问题,系统根据输入问题进行场景判断,根据判断结果调用知识库中相应数据集,使用预先训练好的词向量及DSSM模块,进行语义相似度计算,并将计算结果返回给用户;
步骤2、用户根据所提问题判断是否是其需要的答案,如果是,则结束问答对匹配过程,否则继续后续操作;
步骤3、如果返回答案不是用户需要的,则询问用户是否是想寻找某个具体类型的问题,如果是该类型,则输出该类型的问题关键字,由用户选择关键字;如果不是该类型,则返回若干问题候选类型,由用户进行选择,并输入问题关键字;
步骤4、根据选择问题类型和关键字,进一步缩小待匹配问答对数据,并将用户的问题进行语义相似度计算,返回候选答案给用户;
步骤5、如果所返回答案是用户需要,则结束问答过程,否则返回到步骤1继续进行,或者由用户自行退出。
5.根据权利要求4所述的基于FSM多轮问答的语义相似度计算方法,其特征在于,
所述DSSM模块包括:
输入层,用于将用户问题和知识库待匹配问题分别转为由字向量表示的三维数组,并将其作为表示层的输入,其中,字向量由网上公开文本数据训练得到,且向量空间为768维;
表示层,采用Transformer的编码器部分,分别对由输入层输出的用户问题特征向量和知识库待匹配问题特征向量进行编码,从而提取出句子中每个单词的更抽象特征,通过global-attention将原本由每个字向量组成的句子特征表示转换为由一个768维向量表示的新的句子特征;Transformer编码器一共分为6个小Encoder,其中每个Encod...
【专利技术属性】
技术研发人员:王黎成,高阳,
申请(专利权)人:中博信息技术研究院有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。