【技术实现步骤摘要】
一种线上家装场景下用户流失预警模型的建模方法
本专利技术属于用户流失预警模型建模
,尤其涉及一种基于线上聊天用户词分布的线上家装场景下用户流失预警模型的建模方法。
技术介绍
用户流失预警系统对于以流量换取利润的互联企业非常重要,通过它可以快速筛选出即将流失的用户,之后通过一些运营手段加以挽回,从而降低了流量上的损失。构建一个用户流失预警系统的主体思路是对用户的行为进行数据分析并建立模型,通过模型筛选出即将流失的用户。在进行用户行为分析时使用的数据维度通常包括用户的登录、浏览、消费等交互行为。由于线上家装行业的订单金额高、服务周期长、个性化要求多、专业化程度高、业主与施工方存在严重的信息不对称等情况,每一笔订单都需要客服人员与用户进行长期的沟通,沟通的主要手段是基于企业自主开发的IM(InstantMessaging即时通信)软件,而这也成为了企业与用户的主要交互行为,而用户的登录、浏览、消费等行为发生频次低,采集不到足以支撑建模与分析的数据量,因此对客服人员与用户沟通的聊天记录进行数据分析建立模型成为了实现用户 ...
【技术保护点】
1.一种线上家装场景下用户流失预警模型的建模方法,其特征在于:具体包含如下步骤;/n步骤1,确定停用词表,停用词包括助词、连词、介词、地名、人名、人称代词、数字、标点符号;/n步骤2,标注数据:拉取所有交易成功的用户和流失用户的聊天记录,并将所有交易成功的用户的聊天记录打上标签0,且作为正向数据样本集合A,并将所有流失用户的聊天记录打上标签1,做为反向数据样本集合B;/n步骤3,计算并保存所有用户发出的全部聊天文本中出现在关键词库W中的词的idf值,具体计算公式为/n
【技术特征摘要】
1.一种线上家装场景下用户流失预警模型的建模方法,其特征在于:具体包含如下步骤;
步骤1,确定停用词表,停用词包括助词、连词、介词、地名、人名、人称代词、数字、标点符号;
步骤2,标注数据:拉取所有交易成功的用户和流失用户的聊天记录,并将所有交易成功的用户的聊天记录打上标签0,且作为正向数据样本集合A,并将所有流失用户的聊天记录打上标签1,做为反向数据样本集合B;
步骤3,计算并保存所有用户发出的全部聊天文本中出现在关键词库W中的词的idf值,具体计算公式为
步骤4,对正向数据样本集合A与反向数据样本集合B中每个用户发出的全部聊天文本内容进行处理,先将文本分词,再去除停用词,得到该用户聊天关键词集合,进而计算集合中每个词的tf*idf值;
其中,idf为步骤3计算出的idf值,tf*idf值即为tf与idf的值的乘积;创建该聊天的文本向量,向量长度为N,向量的第m位对应的是聊天关键词库W中编号为m的词在该聊天中的tf*idf值,对于聊天中未曾出现的词,其tf为0,且该位的值为0;记录该向量对应的标签,若该聊天属于集合A,标签为0,否则为1;全部的聊天数据经过处理后,得到一个每条数据是一个文本向量和一个标签的数据样本集T;
步骤5,构建浅层神经网络结构。
2.根据权利...
【专利技术属性】
技术研发人员:陈旋,王冲,张平,付虹源,
申请(专利权)人:江苏艾佳家居用品有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。