【技术实现步骤摘要】
一种意图识别方法及装置
本专利技术涉及一种意图识别方法及装置,属于人工智能
技术介绍
意图识别技术是指针对用户反馈的文本数据进行分析从而识别出该用户意图的技术,意图就是指用户想要表达的意愿或者想要做的事情。例如,在客服机器人的应用场景中,用户输入一段文本想询问商品价格,后台程序使用意图识别技术识别出用户的该意图,并查找到相应的商品价格返回给用户作为回答,如此,用户与客服机器人可以实现持续对话。现有意图识别技术主要采用如下两种方式:方式1:基于规则的识别这种方式需要人工从以往的大量用户反馈数据中总结出规则,然后基于该规则针对当前应用场景进行意图识别。例如:当一句话中包含某三个关键词时,则表明用户具体是某种意图。这种方式的缺点是,要使总结出的规则达到一定的精确率就需要人工做大量的工作,成本高效率低;而且,规则对于一些复杂的包含上下文的语境很难准确识别。2、基于文本特征的识别这种方式由软件进行意义切词,从中挑选出最能代表文本特征的特征词与用户输入的反馈数据进行匹配,据此来进行意图识 ...
【技术保护点】
1.一种意图识别方法,其特征在于,包括:/n对文本数据进行符号处理和切词处理得到切分后的语句片段;/n对所述语句片段标注词性标记;/n将所述语句片段中包含在预设的特定语词典中的语句片段的词性标记替换成特定词性标记;/n根据所述特定词性标记删除所述语句片段中的冗余片段;/n对删除冗余片段后剩余的所述语句片段标注位置信息生成文本特征;/n对所述文本特征进行意图识别。/n
【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:
对文本数据进行符号处理和切词处理得到切分后的语句片段;
对所述语句片段标注词性标记;
将所述语句片段中包含在预设的特定语词典中的语句片段的词性标记替换成特定词性标记;
根据所述特定词性标记删除所述语句片段中的冗余片段;
对删除冗余片段后剩余的所述语句片段标注位置信息生成文本特征;
对所述文本特征进行意图识别。
2.根据权利要求1所述的方法,其特征在于,将所述词性标记替换成所述特定词性标记包括:
将表示相同意图的多个语句片段的词性标记替换成同义词标记,将表示兴趣点名称后缀的语句片段的词性标记替换成后缀词标记。
3.根据权利要求2所述的方法,其特征在于,根据所述特定词性标记删除所述语句片段中的冗余片段包括:
对于所述特定词性标记为后缀词标记的语句片段,删除位于该语句片段之前的词性标记为名词的语句片段;
删除所述词性标记为形容词和/或副词的语句片段;
使用所述特定词性标记替换所述语句片段并删除所述词性标记。
4.根据权利要求1~3中任一项所述的方法,其特征在于,对所述文本特征进行意图识别包括:
根据所述文本特征判断所述文本数据的意图类型;
当所述意图类型为适用于线性学习模型的意图时,使用线性SVM模型进行所述意图识别;
当所述意图类型为不适用于线性学习模型的意图时,使用加高斯核的SVM模型进行所述意图识别。
5.一种意图识别装置,其特征在于,包括:
词语处理模块,用于对文本数据进行符号处理和切词处理得到切分后的语句片段;
词性标记标注模块,用于对对所述语句片段标注词性标...
【专利技术属性】
技术研发人员:武东旭,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。