一种基于LightGBM和文本挖掘的社群精准营销方法及装置制造方法及图纸

技术编号:24579568 阅读:33 留言:0更新日期:2020-06-21 00:53
本发明专利技术适用于基于大数据的用户精准定位领域,提供了一种基于LightGBM和文本挖掘的社群精准营销方法及装置,社群精准营销装置包括预处理模块、特征提取模块、训练集构建模块和模型训练模块,通过用户的生日信息衍生出对应的年龄和星座,对用户发言文本提取用户发言文本熵、发言情感得分、易读指数、名词动词停用词比例的特征,并构造交叉特征,通过对交叉特征进行采样,并生成训练集,通过用Wrapper法递归消除,找到保证模型效果的最小特征子集,利用样本特征在训练集上使用LightGBM算法进行模型训练,构建基于LightGBM的社群精准定位模型,从而能够能够在非均衡样本下达到较好的命中率和召回率,提供更准确的精准定位和营销。

A method and device of community precise marketing based on lightgbm and text mining

【技术实现步骤摘要】
一种基于LightGBM和文本挖掘的社群精准营销方法及装置
本专利技术属于基于大数据的用户精准定位领域,尤其涉及一种基于LightGBM和文本挖掘的社群精准营销方法及装置。
技术介绍
传统的营销方式,一般是以电话、微信、各式各样的广告的形式,对客户进行宣传,通常宣传手段较为暴力,不考虑客户的需求,使得客户对于产品产生了抵触感,成为营销中的被动接受者,使得对于产品了解程度严重不足,无论产品好坏,都会对销售质量产生很大的影响。因为没有与客户间进行互动,无法根据形式改进产品和销售策略.大数据技术相较于传统的数据分析,首先在顾客信息采集方面有着巨大的优势,比起以前单纯的评价和问卷调查,大数据技术能够更好的分析消费者的消费需求和消费特征,能够全面的将消费人群的信息进行分类和归纳,以满足消费者的个性化要求。在以社群运营为主的营销中,相较于结构化数据,用户在社群中的发言蕴含着更多精准的用户需求。结合文本挖掘来实现精准营销,能够更准确的定位用户的细粒度需求。
技术实现思路
本专利技术提供一种基于LightGBM和文本挖掘的社群精准营本文档来自技高网...

【技术保护点】
1.一种基于LightGBM和文本挖掘的社群精准营销方法,其特征在于:包括以下步骤:/nS1、对用户基本属性进行概化,对于类别指标进行woe编码,缺失值用众数进行填充;/nS2、对用户的听课过程中的行为的缺失值用0进行填充;/nS3、将用户的发言转换成文本,对文本进行清洗;/nS4、通过用户的生日信息衍生出对应的年龄和星座;/nS5、对用户发言文本提取用户发言文本熵、发言情感得分、易读指数、名词动词停用词比例的特征,其中百分比类变量取均值,其他变量取累积值,空值用0来填充;/nS6、构建文本分类,以用户发言的购课概率值作为一列特征;/nS7、取用户id和是否购买之外的字段作为训练样本对训练样本...

【技术特征摘要】
1.一种基于LightGBM和文本挖掘的社群精准营销方法,其特征在于:包括以下步骤:
S1、对用户基本属性进行概化,对于类别指标进行woe编码,缺失值用众数进行填充;
S2、对用户的听课过程中的行为的缺失值用0进行填充;
S3、将用户的发言转换成文本,对文本进行清洗;
S4、通过用户的生日信息衍生出对应的年龄和星座;
S5、对用户发言文本提取用户发言文本熵、发言情感得分、易读指数、名词动词停用词比例的特征,其中百分比类变量取均值,其他变量取累积值,空值用0来填充;
S6、构建文本分类,以用户发言的购课概率值作为一列特征;
S7、取用户id和是否购买之外的字段作为训练样本对训练样本进行标准化和归一化;
S8、对特征重要度位于前5的特征构造交叉特征;
S9、对步骤S8获取的交叉特征进行采样,并生成训练集;
S10、用Wrapper法递归消除,找到保证模型效果的最小特征子集,利用样本特征在训练集上使用LightGBM算法进行模型训练,构建基于LightGBM的社群精准定位模型;
S11、模型训练完成后,依次执行步骤S1~S10以对用户进行精准定位。


2.如权利要求1所述的一种基于LightGBM和文本挖掘的社群精准营销方法,其特征在于:步骤S9中,通过5折分层采样对交叉特征进行处理。


3.如权利要求1所述的一种基于LightGBM和文本挖掘的社群精准营销方法,其特征在于:所述对文本进行清洗具体为:去掉文本中的非中文、英文以及数字的...

【专利技术属性】
技术研发人员:张铭
申请(专利权)人:上海昌投网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1