【技术实现步骤摘要】
一种基于Word2Vec和RNN的用户意图识别方法及装置
本专利技术涉及互联网
,尤其涉及一种基于Word2Vec和RNN的用户意图识别方法及装置。
技术介绍
随着移动通讯技术的发展和电子商务的普及,人们开始习惯于在网上购物。在移动电子商务虚拟环境中,商家已经能够在线上提供海量的产品种类,这就导致虽然用户选择的范围越来越大,但想找到自己感兴趣的产品却愈发困难。因此,电子商务平台需要提供一种类似于导购员的服务来主动地帮助用户选购产品,并能根据用户的兴趣和爱好,个性化地给每个用户推荐他可能感兴趣且满意的产品。这就需要电子商务平台能够理解客户需求的智能导购模式解决以上问题。在目前的智能导购方案主要还是通过二分类法以及基于二分类基础上实现的多分类法来分析用户输入对话框的语句,需要精确确认用户的意图,就需要向用户提出的更多的问题,目前的方案中,只要没有用到神经网络,则一般还是采用二分类,以及基于二分类基础上实现的多分类。尤其是在购物聊天过程中,往往需要先区分用户是否需要购物,导致精确确认用户意图时,需要进行繁复的交互操作,向用户提出大量问题。且随着应答模型训练用的语料 ...
【技术保护点】
1.一种基于Word2Vec和RNN的用户意图识别方法,其特征在于,包括:从聊天语料数据中提取问法语句,并对所得问法语句添加意图标识,所述语料数据包括:输入聊天工具的聊天语料;利用所得的问法语句训练意图分类模型;对用户输入的语料进行分词处理,并通过Word2Vec对分词处理后的语句进行向量化;将向量化的语句作为输入,通过所述意图分类模型获取用户意图。
【技术特征摘要】
1.一种基于Word2Vec和RNN的用户意图识别方法,其特征在于,包括:从聊天语料数据中提取问法语句,并对所得问法语句添加意图标识,所述语料数据包括:输入聊天工具的聊天语料;利用所得的问法语句训练意图分类模型;对用户输入的语料进行分词处理,并通过Word2Vec对分词处理后的语句进行向量化;将向量化的语句作为输入,通过所述意图分类模型获取用户意图。2.根据权利要求1所述的方法,其特征在于,所述从聊天语料数据中提取问法语句,并对所得问法语句添加意图标识,包括:从所述聊天语料数据中,筛选客服聊天记录中的语料作为Word2Vec的训练语料,所述客服聊天记录中的语料还作为所述意图分类模型的语料词典;对所述客服聊天记录中的语料进行数据清洗,再进行文本处理;从所述聊天语料数据中选取用户提问的语料,并通过训练后的Word2Vec将所述用户提问的语料向量化,之后对向量化的所述用户提问的语料添加意图标识。3.根据权利要求1所述的方法,其特征在于,所述利用所得的问法语句训练意图分类模型,包括:对已添加意图标识的问法语句进行分词处理;利用分词处理的结果,通过RNN训练所述意图分类模型。4.根据权利要求1所述的方法,其特征在于,所述对所述用户输入的语料进行分词处理,并通过Word2Vec对分词处理后的语句进行向量化,包括:实时获取用户输入的语料,并从中剔除无关的内容,再进行文本处理;通过训练后的Word2Vec将用户实时输入的语料向量化。5.根据权利要求1所述的方法,其特征在于,所述将向量化的语句作为输入,通过所述意图分类模型获取用户意图,包括:通过所述意图分类模型,获取作为输入的向量化的语句在各个意图中的识别概率;提取概率值最高的意图,当最...
【专利技术属性】
技术研发人员:潘影波,陈子骁,冀怀远,刘谦,杨阳,
申请(专利权)人:苏宁易购集团股份有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。