【技术实现步骤摘要】
一种基于bert的文本多意图识别方法
本专利技术涉及医美领域、自然语言处理
,尤其是一种基于bert的文本多意图识别方法。
技术介绍
医疗仿真营销机器人的回复机制是,依据访客问题的和项目进行答复。实际运行中,文本常常存在歧义,或者文本本身确实存在多种意图,导致无法准确选择唯一的类别。另一方面,在制定智能对话系统等领域确实存在着对文本多意图识别的需求,需要根据文本所包含不同的意图来定制综合回复。因此,文本的多意图识别问题成了急需解决的问题。解决文本多意图识别的问题,一般有人工标注方法和机器标注方法。人工标注方法即由标注人员逐条读取语料然后理解其中的多个含义并进行标注。人工标注的优点是稳健,准确率相对较高,但是存在效率低下,耗费人力和时间资源的问题。如果是由多人分工进行标注,还可能出现由于标注人员理解能力差别导致的系统性错误。若使用机器进行标注,也存在以下几个问题:1.机器学习模型只能给出正确率较高的最优解,难以输出次优解(其他意图),因此只适合进行单意图识别;2.利用深度学习模型进行多意图的标注可以解决输出多意图 ...
【技术保护点】
1.一种基于bert的文本多意图识别方法,其特征在于,包括以下步骤:/nS1:获取待识别文本并进行去重和删除停用词,得到训练语料;/nS2:获取句向量;/nS3:利用lightgbm模型训练用于识别意图的的句向量模型,得到意图类别,输出所有的主意图;/nS4:选取标准向量;/nS5:计算标准向量的马氏距离,输出子类别意图。/n
【技术特征摘要】
1.一种基于bert的文本多意图识别方法,其特征在于,包括以下步骤:
S1:获取待识别文本并进行去重和删除停用词,得到训练语料;
S2:获取句向量;
S3:利用lightgbm模型训练用于识别意图的的句向量模型,得到意图类别,输出所有的主意图;
S4:选取标准向量;
S5:计算标准向量的马氏距离,输出子类别意图。
2.根据权利要求1所述的一种基于bert的文本多意图识别方法,其特征在于,步骤S2进一步为:搭建bert生成embeddeding服务bert-as-service,输入训练语料到bert-as-service中,获取句子的句向量。
3.根据权利要求1所述的一种基于bert的文本多意图识别方法,其特征在于...
【专利技术属性】
技术研发人员:黄友福,肖龙源,蔡振华,李稀敏,刘晓葳,谭玉坤,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。