一种基于网约车对话文本的多意图识别方法技术

技术编号：38624729 阅读：15 留言：0更新日期：2023-08-31 18:26

本发明专利技术提供一种基于网约车对话文本的多意图识别方法，包括以下步骤：S1：建立多意图数据集，所述多意图数据集包括单意图线上数据、线上文本多意图标注数据、先验内容处理的组合多意图数据；S2：接收对话文本，从模型层面进行识别，将对话文本存在的多意图问题转化成多个单意图问题，结合场景标签，基于设定的逻辑设定，进行问句回复；S3：对于模型层面不能分析出结果的，则将对话文本从规则层面进行识别，结合场景标签，然后基于设定的逻辑设定，进行问句回复。句回复。句回复。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于网约车对话文本的多意图识别方法

[0001]本专利技术涉及一种网约车沟通方法，尤其是涉及一种基于网约车对话文本的多意图识别方法。

技术介绍

[0002]伴随的全球AI大力发展，深度学习在各个领域得到了广泛的应用。伴随着人们生活质量的提高，出门打车已经成为了一种生活方式。基于这样的背景，积累了海量的网约车对话数据。在算力、数据、算法都具备的条件下，能够进行深度模型在网约车的尝试，选择的研究方向是意图识别。
[0003]目前市面上的意图识别往往只是局限于单意图识别，这种识别的方式会造成意图语义的缺失，只理解了部分说话人的意图，而丢失了另外一部分的语义。有一部分的多意图识别研究有三类方式，一种是通过标点进行分句，分成单句之后，再对单句进行单意图识别，识别出每一句的单意图后，再组装成多意图标签。另一种方式是通过信息抽取的方式来进行切句，分成单句之后，再对单句进行单意图识别，识别出每一句的单意图后，再组装成多意图标签。还有一种方式是还可以直接通过信息抽取打出意图标签，给出最后的多意图。这些方式能够解决一部分多意图的情况，比如每个单独的句子是一个意图，如果一个单独的句子存在多意图，这些方式可能就无法进行识别。
[0004]单意图识别：单意图识别就是通过分析用户的文本，文本中表达的含义只有一个含义，也就是本句话只有一个意图标签。比如：
[0005]我想订一家酒店。意图：订酒店
[0006]我想订一张火车票。意图：订火车票
[0007]我想订一张飞机票。意图：订飞机票
[000...

【技术保护点】

【技术特征摘要】
1.一种基于网约车对话文本的多意图识别方法，包括以下步骤：S1：建立多意图数据集，所述多意图数据集包括单意图线上数据、线上文本多意图标注数据、先验内容处理的组合多意图数据；S2：接收对话文本，从模型层面进行识别，将对话文本存在的多意图问题转化成多个单意图问题，结合场景标签，基于设定的逻辑设定，进行问句回复；S3：对于模型层面不能分析出结果的，则将对话文本从规则层面进行识别，结合场景标签，然后基于设定的逻辑设定，进行问句回复。2.根据权利要求1所述的基于网约车对话文本的多意图识别方法，其特征在于：步骤S1中，单意图线上数据的收集是基于线上的faq数据，在经过收集并分类处理后，形成单意图数据集，然后将单意图数据集加入到多意图数据集中。3.根据权利要求2所述的基于网约车对话文本的多意图识别方法，其特征在于：所述单意图线上数据收集后进行分类，包括以下步骤：S111：将网约车的场景进行分类，包括预约、上车、乘车、下车、结束和评价；S112：对分类的各个场景进行标签化处理，使得单意图线上数据按照标签进行分类，在同一标签内的重复对话内容只保留其中一组；S113：对于分类后的单意图线上数据，形成单意图数据集，所述单意图数据集的数据带有场景标签，将单意图数据集加入到多意图数据集中。4.根据权利要求1所述的基于网约车对话文本的多意图识别方法，其特征在于：步骤S1中，线上文本多意图标注数据是将文本通过BIE信息抽...

【专利技术属性】
技术研发人员：潘昊杰，田鹏飞，
申请(专利权)人：北京云行在线软件开发有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人