基于文本分类的意图识别方法、装置、设备及存储介质制造方法及图纸

技术编号：21914038 阅读：19 留言：0更新日期：2019-08-21 12:27

本发明专利技术公开了一种基于文本分类的意图识别方法、装置、计算机设备及存储介质，所述方法包括：获取用户的语音信息，并将语音信息转换为待识别文本信息；对待识别文本信息进行预处理，得到待分类数据，其中，预处理用于过滤待识别文本信息中的冗余信息；使用预先训练好的N个分类模型对待分类数据进行识别，并将每个分类模型识别出的用户意图组成待确定用户意图集合，其中，N为大于1的整数；按照预设带权选举方式，对待确定用户意图集合中的用户意图进行置信度计算，并根据计算结果确定与待识别文本信息匹配的用户意图。本发明专利技术的技术方案在基于文本分类的意图识别中，提高了用户意图识别的准确率。

Intention Recognition Method, Device, Equipment and Storage Media Based on Text Classification

全部详细技术资料下载

【技术实现步骤摘要】
基于文本分类的意图识别方法、装置、设备及存储介质
本专利技术涉及信息处理领域，尤其涉及基于文本分类的意图识别方法、装置、设备及存储介质。
技术介绍
基于文本分类的意图识别是自然语言处理领域中一个很重要的分支。随着人工智能技术的不断发展，基于基于文本分类的意图识别的应用场景也越来越多。在智能客服、智能问答、智能助理等应用中均有基于文本分类的意图识别处理的身影。以苹果手机中的智能助理Siri为例，Siri就是一项具有智能语音控制功能的应用，它可以理解用户所说的话和表达的意图。其中，“用户说的话”就是文本，“意图”就是分类模型的标签。分类问题，作为机器学习领域中的常见问题，通常可以用传统的监督学习分类方法去解决。常用的分类模型有逻辑回归、支持向量机、决策树等。然而，由于基于文本分类的意图识别问题具有特殊性，即一方面，文本是由很多词组成的，每个词之间有很强的前后关联；另一方面，分类模型通常是基于特定的算法，而单一算法难以全面覆盖词之间的前后关联；因此，采用基于单一分类模型的意图识别方法进行识别时，具有一定的局限性，使得对用户意图的识别准确率不高，应用范围有限。
技术实现思路
本专利技术实施例提供一种基于文本分类的意图识别方法、装置、设备及存储介质，以解决在基于文本分类的意图识别中，用户意图识别的准确率不高的问题。一种基于文本分类的意图识别方法，包括：获取用户的语音信息，并将所述语音信息转换为待识别文本信息；对所述待识别文本信息进行预处理，得到待分类数据，其中，所述预处理用于过滤所述待识别文本信息中的冗余信息；使用预先训练好的N个分类模型对所述待分类数据进行识别，并将每...

【技术保护点】
1.一种基于文本分类的意图识别方法，其特征在于，所述基于文本分类的意图识别方法包括：获取用户的语音信息，并将所述语音信息转换为待识别文本信息；对所述待识别文本信息进行预处理，得到待分类数据，其中，所述预处理用于过滤所述待识别文本信息中的冗余信息；使用预先训练好的N个分类模型对所述待分类数据进行识别，并将每个所述分类模型识别出的用户意图组成待确定用户意图集合，其中，N为大于1的整数；按照预设带权选举方式，对所述待确定用户意图集合中的所述用户意图进行置信度计算，并根据计算结果确定与所述待识别文本信息匹配的用户意图。

【技术特征摘要】
1.一种基于文本分类的意图识别方法，其特征在于，所述基于文本分类的意图识别方法包括：获取用户的语音信息，并将所述语音信息转换为待识别文本信息；对所述待识别文本信息进行预处理，得到待分类数据，其中，所述预处理用于过滤所述待识别文本信息中的冗余信息；使用预先训练好的N个分类模型对所述待分类数据进行识别，并将每个所述分类模型识别出的用户意图组成待确定用户意图集合，其中，N为大于1的整数；按照预设带权选举方式，对所述待确定用户意图集合中的所述用户意图进行置信度计算，并根据计算结果确定与所述待识别文本信息匹配的用户意图。2.如权利要求1所述的基于文本分类的意图识别方法，其特征在于，所述对所述待识别文本信息进行预处理，得到待分类数据，包括：对所述待识别文本信息进行分词处理，得到分词集合；对所述分词集合中的标点符号和语助词进行过滤，得到所述待分类数据。3.如权利要求2所述的基于文本分类的意图识别方法，其特征在于，所述对所述分词集合中的标点符号和语助词进行过滤，得到所述待分类数据之后，所述基于文本分类的意图识别方法，还包括：根据所述预设深度学习模型的类型，对所述待分类数据进行词嵌入处理，得到以词向量表示的所述待分类数据。4.如权利要求3所述的基于文本分类的意图识别方法，其特征在于，所述根据所述预设深度学习模型的类型，对所述待分类数据进行词嵌入处理，得到以词向量表示的所述待分类数据，包括：根据所述预设深度学习模型的类型，确定词嵌入长度；将所述待分类数据转换成词向量，并根据所述词嵌入长度对所述词向量进行填充，得到所述以词向量表示的所述待分类数据。5.如权利要求1所述的基于文本分类的意图识别方法，其特征在于，所述用户意图包括意图标签和所述意图标签对应的概率值，所述按照预设带权选举方式，对所述待确定用户意图集合中的所述用户意图进行置信度计算，并根据计算结果确定与所述待识别文本信息匹配的用户意图，包括：按照预设的权重分配方式，为每个所述分类模型分配权值，得到每个所述分类模型的权值；将所述待确定用户意图集合中，具有...

【专利技术属性】
技术研发人员：于凤英，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人