一种社交电商用户画像的建立方法技术

技术编号:26171181 阅读:21 留言:0更新日期:2020-10-31 13:42
本发明专利技术提供了一种社交电商用户画像的建立方法,它解决了现有技术存在的干扰噪音多的问题。其方法包括:步骤S1:在中文语料库中进行自监督训练得到预训练模型;步骤S2:对社交电商公开文本数据集预处理后进行分类标注;步骤S3:将预训练模型在类别标注完成的数据集上进行微调训练,得到用户画像模型。本发明专利技术优点在于有效减少干扰噪音,合理使用社交电商专业领域文本信息,提升用户画像建立的精准度。

【技术实现步骤摘要】
一种社交电商用户画像的建立方法
本专利技术涉及数据处理
,具体涉及一种社交电商用户画像的建立方法。
技术介绍
随着社交工具和移动互联网设施的不断完善,社交电商作为一种依托社交关系进行商品交易存在的电商将处于井喷式发展时期。社交电商有别于淘宝等电商平台式运营,社交销售员处于网络零售末端通过社交软件进行交易活动。同时,社交工具软件也有别于传统电商软件,没有对销售员进行统一化注册和管理以及没有对售卖产品进行系统化分类,并且对商品的描述也没有规范化术语。这导致服务商对用户(即社交电商)缺乏全面了解,不能很好地通过用户需求和市场环境对用户提供优质服务,也无法疏导商品流通渠道起到产业路由的作用。因此,如何建立高效为社交电商建立用户画像模型已经成为了业内关注的焦点问题之一.目前现有的用户画像建立方案多是基于用户在社交网站上的行为信息。然而,此类数据只能反应该用户自身作为买家的兴趣爱好,无法反应该用户作为社交电商卖家时的用户画像。例如,专利公布号CN106021337A公开了一种智能推荐方法,通过用户在电商应用或信息平台的行为数据进行分析本文档来自技高网...

【技术保护点】
1.一种社交电商用户画像的建立方法,其特征在于,包括以下步骤:/n步骤S1:在中文语料库中进行自监督训练得到预训练模型;/n步骤S2:对社交电商公开文本数据集预处理后进行分类标注;/n步骤S3:将预训练模型在类别标注完成的数据集上进行微调训练,得到用户画像模型。/n

【技术特征摘要】
1.一种社交电商用户画像的建立方法,其特征在于,包括以下步骤:
步骤S1:在中文语料库中进行自监督训练得到预训练模型;
步骤S2:对社交电商公开文本数据集预处理后进行分类标注;
步骤S3:将预训练模型在类别标注完成的数据集上进行微调训练,得到用户画像模型。


2.根据权利要求1所述的一种社交电商用户画像的建立方法,其特征在于,S2所述的公开文本数据集预处理为通过正则表达式删除文本中的表情、数字、空格和制表符。


3.根据权利要求1所述的一种社交电商用户画像的建立方法,其特征在于,S1所述对中文语料库的预训练是基于Transformer的双向神经网络模型在中文语料库中进行自监督学习。


4.根据权利要求1所述的一种社交电商用户画像的建立方法,其特征在于,S1中的中文语料库选用数据由通用领域公开文本和社交电商领域专业文本组成。


5.根据权利要求1所述的...

【专利技术属性】
技术研发人员:张文崔浩亮陈轶牛少彰王让定
申请(专利权)人:东南数字经济发展研究院
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1