【技术实现步骤摘要】
一种意图标签的标注方法、装置、服务器及存储介质
本专利技术涉及数据处理
,尤其涉及一种意图标签的标注方法、装置、服务器及存储介质。
技术介绍
随着科学技术的不断发展,人工智能(ArtificialIntelligence)技术已广泛应用于各种产品中。人工智能的一大特点是智能设备可以与用户进行人机交互。例如聊天机器人,用户可以与聊天机器人进行聊天,也可以按照自己的意愿以及习惯的方式输入语音指令,以控制聊天机器人执行相应的动作。在这类人机交互过程中,智能设备的关键在于对用户的意图进行识别。因此,事先需要利用大量的标注意图标签的训练数据对智能设备进行训练。目前,通常是针对训练数据进行人工标注意图标签,但人工标注意图标签的效率低并且准确率也较低。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种意图标签的标注方法、装置、服务器及存储介质,可以实现标注意图标签的自动化,有效提高标注意图标签的效率和准确率。第一方面,本专利技术实施例提供了一种意图标签的标注方法,该方法包括:获取第一 ...
【技术保护点】
1.一种意图标签的标注方法,其特征在于,所述方法包括:/n获取第一数据集合和第二数据集合,所述第一数据集合包括第一数量个未标注意图标签的数据,所述第二数据集合包括第二数量个已标注意图标签的数据,所述第二数量个已标注意图标签的数据所标注的意图标签对应着多个意图;/n利用相似度计算模型对所述第一数据集合和所述第二数据集合进行处理得到第三数据集合,所述第三数据集合包括多个标注第一意图标签的数据;/n利用分类模型对所述第二数据集合和所述第三数据集合进行处理,以从所述第三数据集合中确定出所述多个意图对应的目标数据集合。/n
【技术特征摘要】
1.一种意图标签的标注方法,其特征在于,所述方法包括:
获取第一数据集合和第二数据集合,所述第一数据集合包括第一数量个未标注意图标签的数据,所述第二数据集合包括第二数量个已标注意图标签的数据,所述第二数量个已标注意图标签的数据所标注的意图标签对应着多个意图;
利用相似度计算模型对所述第一数据集合和所述第二数据集合进行处理得到第三数据集合,所述第三数据集合包括多个标注第一意图标签的数据;
利用分类模型对所述第二数据集合和所述第三数据集合进行处理,以从所述第三数据集合中确定出所述多个意图对应的目标数据集合。
2.根据权利要求1所述的方法,其特征在于,所述利用相似度计算模型对所述第一数据集合和所述第二数据集合进行处理得到第三数据集合,包括:
将所述第一数据集合和所述第二数据集合中的数据输入相似度计算模型中进行处理,确定第一目标数据对应的多个意图标签,所述第一目标数据为所述第一数据集合中的任意一个数据;
检测所述多个意图标签中相同意图标签的数量是否大于或等于预设数量;
若是,则将所述第一目标数据加入第三数据集合中,并将所述相同意图标签作为所述第一目标数据对应的第一意图标签。
3.根据权利要求2所述的方法,其特征在于,所述相似度计算模型包括第一相似度计算模型和第二相似度计算模型,所述将所述第一数据集合和所述第二数据集合中的数据输入相似度计算模型中进行处理,确定第一目标数据对应的多个意图标签,包括:
将所述第一数据集合和所述第二数据集合中的数据输入所述第一相似度计算模型中进行处理,确定第一目标数据与第二目标数据之间的第一相似度,所述第一目标数据为所述第一数据集合中的任意一个数据,所述第二目标数据为所述第二数据集合中的任意一个数据;
按照所述第一相似度从大到小的顺序对各个第二目标数据进行排序,并获取排序排在前N位的第二目标数据对应的N个意图标签,所述N为正整数;
将所述第一数据集合和所述第二数据集合中的数据输入所述第二相似度计算模型中进行处理,确定所述第一目标数据与所述第二目标数据之间的第二相似度;
按照所述第二相似度从大到小的顺序对各个第二目标数据进行排序,并获取排序排在前M位的第二目标数据对应的M个意图标签,所述M为正整数,所述M等于所述N;
将所述N个意图标签和所述M个意图标签确定为所述第一目标数据对应的多个意图标签。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述分类模型包括第一分类模型和第二分类模型,所述利用分类模型对所述第二数据集合和所述第三数据集合进行处理,以从所述第三数据集合中确定出所述多个意图对应的目标数据集合,包括:
将所述第二数据集合和所述第三数据集合中的数据输入所述第一分类模型中进行处理,以从所述第三数据集合中确定出第四数据集合,所述第一分类模型是基于所述第二数据集合训练得到的,所述第四数据集合包括多个标注所述第一意图标签的数据;
将所述第三数据集合中的数据输入所述第二分类模型中进行处理,以从所述第三数据集合中确定出第五数据集合,所述第二分类模型是基于所述第四数据集合训练得到的,所述第五数据集合包括多个标注所述第一意图标签的数据;
将所述第四数据集合和所述第五数据集合作为所述多个意图对应的目标数据集合。...
【专利技术属性】
技术研发人员:张欢韵,杨全,杨泾,
申请(专利权)人:重庆小雨点小额贷款有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。