当前位置: 首页 > 专利查询>五邑大学专利>正文

基于用户遗忘曲线的消费者意图识别方法技术

技术编号:14916012 阅读:140 留言:0更新日期:2017-03-30 04:50
本发明专利技术公开了基于用户遗忘曲线的消费者意图识别方法,每个用户都有一个ID存储其相应的用户数据,其中存储有用户的意图网络信息,用户语句输入,基于LDA技术提取关键词之后通过Word2vec工具进行语义分析,将内容映射到网络中形成对用户的描绘;通过Word2vec计算初始时刻t0提取的关键词集合K和消费者谈及商品的集合P之间的相关性得到消费者的初始意图强度值S0,再将S0代入基于用户遗忘曲线的意图强度模型计算出消费者在时刻tn的意图强度值Sn,客服机器人通过此较消费者对不同商品的意图强度值Sn,来准确识别消费者想要获取的商品信息。本发明专利技术有效避免了网络客服机器人答非所问的情况,有利于网络购物的推广。

【技术实现步骤摘要】

本专利技术涉及一种消费者意图识别方法,特别是一种基于用户遗忘曲线的消费者意图识别方法。
技术介绍
随着网络的发展,网络购物已经悄然兴起,人们通过网络来选购各种物品已经越来越成为一种时尚,这也直接导致了对网络客服人员的大量需求,网络客服机器人由此应用而生,但是传统的网络客服机器人常常对消费者的意图了解不清楚,出现答非所问的情况,这就会阻碍消费者对商品信息的获取,不利于网络购物的发展。而现有客服机器人对消费者意图不了解的主要原因是因为现有系统对消费者意图的识别没有参考时间参数和遗忘参数,因为消费者对商品进行询问的时候往往会询问多个商品,并且常常是问了一个问题以后,隔几个小时,甚至几天或者更长时间再来问下一个问题,这时候机器人对消费者的购买意图的识别就会产生混乱,出现答非所问的情况。
技术实现思路
为解决上述问题,本专利技术的目的在于提供一种基于用户遗忘曲线的消费者意图识别方法。本专利技术解决其问题所采用的技术方案是:基于用户遗忘曲线的消费者意图识别方法,每个用户都有一个ID存储其相应的用户数据,其中存储有用户的意图网络信息,用户语句输入,基于LDA技术提取关键词之后通过Word2vec工具进行语义分析,将内容映射到网络中形成对用户的描绘;通过Word2vec计算初始时刻t0提取的关键词集合K和消费者谈及商品的集合P之间的相关性得到消费者的初始意图强度值S0,再将S0代入基于用户遗忘曲线的意图强度模型计算出消费者在时刻tn的意图强度值Sn,客服机器人通过比较消费者对不同商品的意图强度值Sn,来准确识别消费者想要获取的商品信息。本专利技术中每个消费者均有一个ID,所述ID存储有相应的用户数据,这样不但便于消费者意图的分析而且方便相应数据的提取和存储。进一步,所述基于用户遗忘曲线的意图强度模型包括单阶段模型和多阶段模型,单阶段模型在客服机器人与消费者进行短时间交流的时候使用,客服机器人与消费者的短时间交流是指消费者前后两次询问的间隔时间不大于T1;多阶段模型在客服机器人与消费者进行长时间联系的时候使用,长时间联系是指消费者在对某一商品的前后两次询问的时间间隔大于T2。进一步,单阶段模型的计算公式为其中Sn为消费者在时刻tn的意图强度值,S0为消费者在初始时刻t0的初始意图强度值,K为消费者的意图强度值的衰减速率,Sn′为在时刻tn消费者意识强度值的增加值,n+1为消费者的询问次数,n=0时,即t0时刻消费者第一次询问,S0通过Word2vec计算t0时刻提取的关键词集合和消费者谈及商品的集合之间的相关性得出,Sn′通过Word2vec计算tn时刻提取的关键词集合K和消费者谈及商品的集合P之间的相关性得出,tn、t0以及n通过实时数据以及客服记录得出,k通过对艾宾浩斯——遗忘曲线进行数学拟合得出,在以上数据得出的基础上可以得出消费者在时刻tn的意图强度值Sn。进一步,多阶段模型的计算公式为其中Sn为消费者在时刻tn的意图强度值,Sn-1为消费者在时刻tn-1的意图强度值,kn为消费者在第n+1次询问时的意图强度值的衰减速率,Sn′为在时刻tn消费者意识强度值的增加值,Sn-1、tn、tn-1以及n通过实时数据以及客服记录得出,Sn′通过Word2vec计算tn时刻提取的关键词集合和消费者谈及商品的集合之间的相关性得出,n+1为消费者的询问次数,n=0时,即t0时刻消费者第一次询问,kn的计算公式为其中θ为引入的惰性因子为已知参数,K0通过对艾宾浩斯——遗忘曲线进行数学拟合得出,通过以上数据可以得出消费者在时刻tn的意图强度值Sn。进一步,由于用户对产品产生兴趣之后随着时间的推移会存在一个现象,即相同的刺激对用户兴趣度的影响会逐渐减小,并逐渐趋于一个稳定值,因此在Sn′为时刻tn消费者意识强度值的增加值的基础上通过e-n来调节关键词对商品的刺激增加值。进一步,惰性因子θ为正数,惰性因子θ的值越大,逼过公式计算出来的Kn越准确。本专利技术的有益效果是:本专利技术是基于用户遗忘曲线的消费者意图识别方法,本专利技术通过艾宾浩斯——遗忘曲线在消费者意图识别系统中引入时间参数和遗忘参数来计算出消费者的意图强度值Sn,客服机器人通过比较消费者对不同商品的意图强度值Sn,来准确识别消费者想要获取的商品信息,使得网络客服机器人对消费者的意图识别更加准确,有效避免了网络客服机器人答非所问的情况,有利于网络购物的推广。附图说明下面结合附图和实例对本专利技术作进一步说明。图1是用户商品意图多阶段变化图。具体实施方式对电商客服机器人而言,准确地度量用户对商品的意图是重点之一。用户对商品意图的心理变化和人类学习遗忘具有相似性,在问答系统中,用户语句中不断谈到商品和涉及商品相关问题等则表明用户对商品的意图强度较强,随着谈话的增多,不再谈及则对商品的意图逐渐衰退至较低强度状态。德国心理学家艾宾浩斯发现了人类的遗忘规律,他描述了随着时间的推移人们记忆量的变化,并根据这一变化可以画出描述这一变化的曲线,称为“艾宾浩斯遗忘曲线”。如果对知识点反复学习则会调整记忆衰减速度,巩固次数越多衰减越慢,最终人们的记忆量会逐渐趋于一个稳定值。客服机器人和用户聊天是一个“短时间频繁”和“长时间”联系的过程,实际中用户对某一商品产生兴趣之后会和机器人沟通询问一些相关信息,对话时间可以分为两种状态:(1)对话过程持续时间短的只有几分钟,可能中途会有间隔,从开始到结束历时几小时;(2)用户对商品的兴趣不是很强烈的时候,用户会聊一下,然后隔好几天都没有信息,但是突然有天又询问这一商品,这样用户对商品兴趣就历时比较久,时间单位能达到星期或更久。依据这一特点,本专利技术结合遗忘曲线建立用户商品意图识别“单阶段+多阶段”模型。对遗忘曲线进行数学拟合可以得到其函数表达式:P(t,k)=p0e-kt(t>0),其中k是衰减的速率,其值越大表示记忆遗忘或衰减得越快,p0为记忆的初始值。在用户和机器人的短时间频繁对话中,用户对商品的意图强度的衰减被认为是衰减速率不变,即用户商品意图强度的衰减符合单条记忆曲线衰减规律,用户商品意图强度为:式5.1中SA(tn,pj)表示用户A在第n个时刻tn下对商品pj的意图强度,式5.2表示用户A在初始的t0时刻对商品pj的意图强度。用户的意图强度值,通过Word2vec计算t0时刻提取的关键词集合K和顾客谈及商品集合P之间的相关性计算得到,这里用户的遗忘速率为k(A)。由于用户对产品产生兴趣之后随着时间的推移会存在一个现象,即相同的刺激对用户兴趣度的影响会逐渐减小,并逐渐趋于一个稳定值,在刺激的基础上通过e-n来调节关键词对商品的刺激增加值,其中n∈(0,1,2,…),累计语句输入次数为N,n=N-1。图1是用户商品意图多阶段变化图,如图1所示,当用户和机器人的交流时间跨度比较久,则将用户和机器人的交流看作是多阶段模型,用户语句中呈现的对某一商品刺激相当于人们重复学习某一知识,用户的遗忘速率会随着时间段进行变化,例如在时间tn-1,tn下其遗忘速率分别为k(A,n-1),k(A,n),如图所示用户的商品意图强度分很多阶段,第n个阶段用户的最初商品意图强度表示为式5.3:对多阶段模型,最重要的是要寻找衰减速率k(A,n-1)和k(A,n)之间的关系,得到k(A,n)的表示,从本文档来自技高网...

【技术保护点】
基于用户遗忘曲线的消费者意图识别方法,其特征在于:每个用户都有一个ID存储其相应的用户数据,其中存储有用户的意图网络信息,用户语句输入,基于LDA技术提取关键词之后通过Word2vec工具进行语义分析,将内容映射到网络中形成对用户的描绘;通过Word2vec计算初始时刻t0提取的关键词集合K和消费者谈及商品的集合P之间的相关性得到消费者的初始意图强度值S0,再将S0代入基于用户遗忘曲线的意图强度模型计算出消费者在时刻tn的意图强度值Sn,客服机器人通过比较消费者对不同商品的意图强度值Sn,来准确识别消费者想要获取的商品信息。

【技术特征摘要】
1.基于用户遗忘曲线的消费者意图识别方法,其特征在于:每个用户都有一个ID存储其相应的用户数据,其中存储有用户的意图网络信息,用户语句输入,基于LDA技术提取关键词之后通过Word2vec工具进行语义分析,将内容映射到网络中形成对用户的描绘;通过Word2vec计算初始时刻t0提取的关键词集合K和消费者谈及商品的集合P之间的相关性得到消费者的初始意图强度值S0,再将S0代入基于用户遗忘曲线的意图强度模型计算出消费者在时刻tn的意图强度值Sn,客服机器人通过比较消费者对不同商品的意图强度值Sn,来准确识别消费者想要获取的商品信息。2.根据权利要求1所述的基于用户遗忘曲线的消费者意图识别方法,其特征在于:所述基于用户遗忘曲线的意图强度模型包括单阶段模型和多阶段模型,单阶段模型在客服机器人与消费者进行短时间交流的时候使用,客服机器人与消费者的短时间交流是指消费者前后两次询问的间隔时间不大于T1;多阶段模型在客服机器人与消费者进行长时间联系的时候使用,长时间联系是指消费者在对某一商品的前后两次询问的时间间隔大于T2。3.根据权利要求2所述的基于用户遗忘曲线的消费者意图识别方法,其特征在于:单阶段模型的计算公式为其中Sn为消费者在时刻tn的意图强度值,S0为消费者在初始时刻t0的初始意图强度值,K为消费者的意图强度值的衰减速率,Sn′为在时刻tn消费者意识强度值的增加值,n+1为消费者的询问次数,n=0时,即t0时刻消费者第一次询问,S0通过Word2vec计算t0时刻提取的关键词集合和消费者谈及商品的集合之间的相关性得出,S...

【专利技术属性】
技术研发人员:彭敏晶秦颜威岳芸
申请(专利权)人:五邑大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1