【技术实现步骤摘要】
一种电商评价信息处理方法、系统、设备及介质
[0001]本专利技术涉及电商大数据处理
,具体而言,涉及一种电商评价信息处理方法、系统、设备及介质。
技术介绍
[0002]经济社会的不断发展也真正意义上改变了人们的生活方式,随着在京东、拼多多、淘宝等电商平台购物消费变成人们主流的生活方式,而用户是否选购商品的重中之重就在于商品的评价信息。由于现阶段电商购物的迅速发展导致市场过于庞大,刷评价亦或随意差评的事件也伴随着商家的各种竞争手段屡见不鲜。因此如何在电商平台上快速准确的看到真实的商品评价信息,成为了平台方为优化用户体验亟需解决的问题。
技术实现思路
[0003]本专利技术的目的在于提供一种电商评价信息处理方法、系统、设备及介质,其通过相应的多特征融合和双向LSTM情感分析处理,可以便于使用者能够看到更加真实可靠的商品评价信息。
[0004]本专利技术的实施例是这样实现的:
[0005]第一方面,本申请实施例提供一种电商评价信息处理方法,包括以下步骤:
[0006]步骤S101:获 ...
【技术保护点】
【技术特征摘要】
1.一种电商评价信息处理方法,其特征在于,包括以下步骤:步骤S101:获取用户评价文本信息,并对文本信息进行预处理,得到预处理文本信息;步骤S102:基于预处理文本信息进行文本特征提取,得到评价文本特征;步骤S103:基于预处理文本信息进行评论行为特征提取,得到评论行为特征;步骤S104:基于评价文本特征和评论行为特征进行归一化处理,得到对应的归一化特征向量集;步骤S105:基于归一化特征向量集利用异常检测算法获取对应的异常分数,并基于异常分数生成对应的异常信息分数特征;步骤S106:基于预设拼接规则将评价文本特征、评论行为特征和异常信息分数特征进行拼接为对应的拼接特征,并基于信息增益筛选算法对拼接特征进行筛选处理,得到最终评论特征;步骤S107:将最终评论特征送入预置的XGBoost分类器进行处理,得到对应的异常评价信息预测结果信息;步骤S108:基于预处理文本信息构建对应的语料词典,并基于语料词典和预处理文本信息获取输入词向量;步骤S109:将输入词向量送入预置的Bi
‑
LSTM模型进行处理,得到对应的情感分析预测结果信息。2.如权利要求1所述的一种电商评价信息处理方法,其特征在于,所述预处理包括数据去噪、数据过滤、数据分词、去停用词或删除非法字符中的至少一种。3.如权利要求1所述的一种电商评价信息处理方法,其特征在于,所述步骤S102具体包括:基于预处理文本信息利用Bigram分词算法进行捕捉前后比对信息,得到评论文本序列信息;将评论文本序列信息对应的One
‑
Hot词向量送入预置的Word2vec模型中通过Skip
‑
gram算法得到分布式词向量,并基于所有分布式词向量去平均值得到评价文本特征。4.如权利要求1所述的一种电商评价信息处理方法,其特征在于,所述基于预处理文本信息进行评论行为特征提取包括:基于预处理文本信息提取评论文本长度、分词后的单词平均长度、评论所含文字个数、评论所含句子个数、评论所含各词性的单词个数、评论的情感极性、评分评论的一致性、极端评分比例、消费者的活跃程度或消费者的总评论数中的至少一种特征。5.如权利要求1所述的一种电商评价信息处理方法,其特征在于,所述异常检测算法包括利用AutoEncoder自动编码器、Recurrent AutoEncoder循环自动编码器、IsolationForest隔离森林、Local Outlier Factor(LOF)局部离群因子、KNN近邻算法或PCA主成分...
【专利技术属性】
技术研发人员:梁千葳,张维杰,
申请(专利权)人:天翼电子商务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。