一种基于文本相似度的意图识别方法技术

技术编号：21895656 阅读：21 留言：0更新日期：2019-08-17 16:00

本发明专利技术公开了一种基于文本相似度的意图识别方法，解决了ASR转为文本出现错误时产生的意图识别的错误问题，其技术方案要点是通过文本相似度算法来对用户语音进行识别，避免ASR在语音转为文本的过程中出现错误转换的问题。采用相似度算法来进行意图识别，从而提高意图识别的准确率。同时，若通过相似度算法识别失败，则将用户语音输入到深度学习网络训练的意图识别模型进行识别，进一步提高意图识别的准确率。

An Intention Recognition Method Based on Text Similarity

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文本相似度的意图识别方法
本公开涉及智能识别领域，尤其涉及一种基于文本相似度的意图识别方法。
技术介绍
目前，在智能对话领域，意图识别一般是单一的将语音信号通过ASR技术转成文本，而ASR转为文本存在一定的错误率，再对错误的文本进行单纯的文本识别会使意图识别的错误率大大提高。现有技术中，使用深度学习网络训练的模型来识别意图的方法非常之多，但这种意图识别方法略为单一，识别的准确率有待进一步提高。
技术实现思路
本公开的目的是提供一种基于文本相似度的意图识别方法，解决通过ASR转为文本存在错误而导致的意图识别错误的问题。本公开的上述技术目的是通过以下技术方案得以实现的：一种基于文本相似度的意图识别方法，包括：预定义意图类别，获取话术文本数据，将所述话术文本数据与所述意图类别进行相似度计算得到意图识别知识库；将用户语音转成用户问题文本，将所述用户问题文本与所述意图识别知识库进行相似度计算，得到意图识别结果；其中，所述相似度计算方法包括基于字符的相似度算法和基于词向量的相似度算法。进一步地，所述基于字符的相似度算法为基于编辑距离的相似度算法，包括：，其中q为所述用户问题文本，S为所述意图识别知识库中的句子，为q与S之间的最小编辑距离，len(q)为所述用户问题文本的文本长度，len(S)为所述意图识别知识库中句子的字符长度。进一步地，所述基于字符的相似度算法为基于相同词典的相似度算法，包括：，其中，为所述用户问题文本q分词之后的序列，为所述意图识别知识库中的句子S分词之后的序列，为序列qw中词的个数，len(Su)为序列Su中词的个数，为序列qw中与序列Su中...

【技术保护点】
1.一种基于文本相似度的意图识别方法，其特征在于，包括：预定义意图类别，获取话术文本数据，将所述话术文本数据与所述意图类别进行相似度计算得到意图识别知识库；将用户语音转成用户问题文本，将所述用户问题文本与所述意图识别知识库进行相似度计算，得到意图识别结果；其中，所述相似度计算方法包括基于字符的相似度算法和基于词向量的相似度算法。

【技术特征摘要】
1.一种基于文本相似度的意图识别方法，其特征在于，包括：预定义意图类别，获取话术文本数据，将所述话术文本数据与所述意图类别进行相似度计算得到意图识别知识库；将用户语音转成用户问题文本，将所述用户问题文本与所述意图识别知识库进行相似度计算，得到意图识别结果；其中，所述相似度计算方法包括基于字符的相似度算法和基于词向量的相似度算法。2.如权利要求1所述的基于文本相似度的意图识别方法，其特征在于，所述基于字符的相似度算法为基于编辑距离的相似度算法，包括：，其中q为所述用户问题文本，S为所述意图识别知识库中的句子，为q与S之间的最小编辑距离，len(q)为所述用户问题文本的文本长度，len(q)为所述意图识别知识库中句子的字符长度。3.如权利要求2所述的基于文本相似度的意图识别方法，其特征在于，所述基于字符的相似度算法为基于相同词典的相似度算法，包括：，其中，为所述用户问题文本q分词之后的序列，为所述意图识别知识库中的句子S分词之后的序列，为序列qW中词的个数，len(Su)为序列Su中词的个数，为序列qW中与序列Su中词义相同的词的个数。4.如权利要求3所述的基于文本相似度的意图识别方法，其特征在于，所述相似度计算结果为：；当时，得...

【专利技术属性】
技术研发人员：司马华鹏，姚奥，
申请(专利权)人：南京硅基智能科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人