描述信息处理方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:26891880 阅读:26 留言:0更新日期:2020-12-29 16:11
本发明专利技术提供一种描述信息处理方法、装置、设备及计算机可读存储介质。本发明专利技术的方法,通过对目标物品的描述信息进行预处理,确定目标物品的有效描述及其权重信息;提取目标物品的有效描述的描述特征数据;将目标物品的有效描述的权重信息和描述特征数据输入描述质量预测模型,计算得到目标物品的有效描述的描述质量信息,可以充分挖掘描述信息的有效特征,综合多个维度的描述信息特征,准确预测目标物品的有效描述的描述质量信息,根据目标物品的有效描述的描述质量信息,对目标物品的有效描述进行排序,实现对物品的有效描述的精准地排序,在此基础上可以按照重排序之后顺序将目标物品的有效描述展示给用户,可以提高描述信息带来的订单转化率。

【技术实现步骤摘要】
描述信息处理方法、装置、设备及计算机可读存储介质
本专利技术涉及计算机
,尤其涉及一种描述信息处理方法、装置、设备及计算机可读存储介质。
技术介绍
随着互联网的飞速发展,越来越多的用户从单纯的信息受众,变为信息制造的参与者,电商网站的评论是记录用户对某个物品或物流服务的评价,也就是用户购买一件物品以后可以发表对该物品的评论等描述信息,其他消费者在购买该物品时,可以浏览对物品的描述信息作为决策参考。挖掘物品的有效描述并进行排序能够让用户看到最有参考价值的信息。现有技术中,为了筛选出对物品的优质且客观的描述信息,往往采用逻辑回归算法预测描述信息质量。但是,逻辑回归算法为线性模型,无法挖掘出大量描述信息之间潜在的语义联系,无法对描述信息进行准确地排序。
技术实现思路
本专利技术提供一种描述信息处理方法、装置、设备及计算机可读存储介质,用以解决现有技术中描述质量预测模型无法挖掘出大量描述信息之间潜在的语义联系,无法对描述信息进行准确地排序的问题。本专利技术的一个方面是提供一种描述信息处理方法,包括:获取目标物品本文档来自技高网...

【技术保护点】
1.一种描述信息处理方法,其特征在于,包括:/n获取目标物品的描述信息;/n对所述目标物品的描述信息进行预处理,确定所述目标物品的有效描述及其权重信息;/n提取所述目标物品的有效描述的描述特征数据;/n将所述目标物品的有效描述的权重信息和描述特征数据,输入训练好的描述质量预测模型,计算得到所述目标物品的有效描述的描述质量信息;/n根据所述目标物品的有效描述的描述质量信息,对所述目标物品的有效描述进行排序。/n

【技术特征摘要】
1.一种描述信息处理方法,其特征在于,包括:
获取目标物品的描述信息;
对所述目标物品的描述信息进行预处理,确定所述目标物品的有效描述及其权重信息;
提取所述目标物品的有效描述的描述特征数据;
将所述目标物品的有效描述的权重信息和描述特征数据,输入训练好的描述质量预测模型,计算得到所述目标物品的有效描述的描述质量信息;
根据所述目标物品的有效描述的描述质量信息,对所述目标物品的有效描述进行排序。


2.根据权利要求1所述的方法,其特征在于,所述将所述目标物品的有效描述的权重信息和描述特征数据,输入训练好的描述质量预测模型,计算得到所述目标物品的有效描述的描述质量信息之前,还包括:
获取所有样本物品的描述信息;
对所述样本物品的描述信息进行预处理,确定所述样本物品的有效描述及其权重信息;
提取所述样本物品的有效描述的描述特征数据;
根据所述样本物品的有效描述的标签指标信息,确定所述样本物品的有效描述的质量标签;
根据所述样本物品的有效描述的权重信息、描述特征数据和质量标签,训练基于深度学习的预测模型,得到描述质量预测模型。


3.根据权利要求1或2所述的方法,其特征在于,对某一物品的描述信息进行预处理,确定该物品的有效描述,包括:
对该物品的描述信息中对同一物品的相同描述信息进行去重过滤,保留所述对同一物品的相同描述信息中的一条;
过滤掉该物品的描述信息中包含敏感词汇的垃圾描述信息;
过滤掉该物品的描述信息中描述信息文本字数不在预设字数范围内的描述信息。


4.根据权利要求3所述的方法,其特征在于,对某一物品的描述信息进行预处理,确定该物品的有效描述的权重信息,包括:
为该物品的有效描述设定初始权重;
根据该物品的有效描述的文本内容和图片,调整该物品的有效描述的权重。


5.根据权利要求4所述的方法,其特征在于,所述根据该物品的有效描述的文本内容和图片,调整该物品的有效描述的权重,包括:
计算该物品的每条有效描述的文本内容与预设古诗词库中的古诗词文本的相似度;
减小文本内容与预设古诗词库中任一古诗词文本的相似度达到第一相似度阈值的有效描述的权重。


6.根据权利要求4所述的方法,其特征在于,所述根据该物品的有效描述的文本内容和图片,调整该物品的有效描述的权重,包括:
对于包含图片的有效描述,采用预设文本图片匹配模型确定该有效描述的文本内容与...

【专利技术属性】
技术研发人员:王颖帅李晓霞苗诗雨
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1