基于评论数据的跨平台电商欺诈检测方法和系统技术方案

技术编号：20025844 阅读：33 留言：0更新日期：2019-01-06 04:41

本发明专利技术公开了一种基于评论数据的跨平台电商欺诈行为检测方法，包括以下步骤：从相关电商网站获取商品的评论数据，并对所述的评论数据对应的商品属性进行人工标注，并从中提取单词级别特征、评论语义特征和评论结构特征，构建训练集；以提取的特征为输入，利用训练集训练二元分类器；从相关电商网站获取目标商品的评论数据，提取目标商品的特征，输入到训练好的二元分类器对目标商品的属性进行识别。本发明专利技术还公开了跨平台电商欺诈行为检测系统。本发明专利技术的检测方法从电商评论的词汇、语义和结构这三个方面提取平台无关的商品特征，基于这些特征来判别商品是否存在欺诈嫌疑，检测结果比较准确。

全部详细技术资料下载

【技术实现步骤摘要】
基于评论数据的跨平台电商欺诈检测方法和系统
本专利技术涉及电商大数据挖掘
，尤其涉及一种基于评论数据的跨平台电商欺诈行为检测方法和系统。
技术介绍
如今，电商已经成为消费者和工厂、零售商之间的高效纽带，为消费者提供一个快速、便捷和可靠的购物环境。电商的众多优势导致了越来越多消费者倾向于线上购物，使得电商蓬勃发展，电商零售额也随之快速增长，这给工厂、零售商和电商服务商带来了巨大的经济收益。例如，阿里巴巴年报显示，其电商平台淘宝网2017年交易总额达到22020亿人民币；亚马逊年报显示，其电商平台2016年的交易总额达到9700亿人民币；易贝年报显示，其电商平台2016年交易总额达到6580亿人民币。自然的，电商在取得巨大经济效益的同时也带来了一些安全问题。例如，为了取得更高的经济收益，一些恶意的第三方零售商会采用灰色的手段来推广他们的商品。在实际的购物场景中，消费者倾向于购买一些销量高、评分高或者好评多的商品。因此，一些恶意的第三方零售商通过虚假购买、虚假评价、虚假评论等手段来推广他们的商品，以获取更高的经济收益，这些非法的推广行为称为电商欺诈。据相关报道，电商欺诈现象普遍存在于各类大规模电商平台中，如亚马网、淘宝网、京东商城等。电商欺诈会破坏健康的电商环境，造成不公平的商业竞争，例如电商欺诈给消费者提供了一些不准确的购物信息，诱导消费者进行消费。理解和检测电商欺诈，尤其是欺诈商品，对于学术界和工业界而言，仍然是一个挑战。对于电商服务商而言，他们在某种程度上受到了隐私保护和伦理问题的限制，无法很好地检测欺诈商品。即使某些电商服务商愿意主动地、负责任去维...

【技术保护点】
1.一种基于评论数据的跨平台电商欺诈行为检测方法，其特征在于，包括以下步骤：(1)从相关电商网站获取商品的评论数据，并对所述的评论数据对应的商品属性进行人工标注；(2)对评论数据进行预处理，并从中提取单词级别特征、评论语义特征和评论结构特征，构建训练集；(3)以单词级别特征、评论语义特征和评论结构特征为输入，利用训练集训练二元分类器；(4)从相关电商网站获取目标商品的评论数据，提取目标商品评论数据的单词级别特征、评论语义特征和评论结构特征，输入到训练好的二元分类器对目标商品的属性进行识别。

【技术特征摘要】
1.一种基于评论数据的跨平台电商欺诈行为检测方法，其特征在于，包括以下步骤：(1)从相关电商网站获取商品的评论数据，并对所述的评论数据对应的商品属性进行人工标注；(2)对评论数据进行预处理，并从中提取单词级别特征、评论语义特征和评论结构特征，构建训练集；(3)以单词级别特征、评论语义特征和评论结构特征为输入，利用训练集训练二元分类器；(4)从相关电商网站获取目标商品的评论数据，提取目标商品评论数据的单词级别特征、评论语义特征和评论结构特征，输入到训练好的二元分类器对目标商品的属性进行识别。2.根据权利要求1所述的跨平台电商欺诈行为检测方法，其特征在于，步骤(2)中，所述的单词级别特征包括平均积极词数量、平均消极词数量、平均高频n-gram词组含量和平均高频n-gram词组比例。3.根据权利要求2所述的跨平台电商欺诈行为检测方法，其特征在于，平均积极词数量和平均消极词数量的提取方法，包括：(a1)采用爬取的评论数据训练一个word2vec模型；(a2)采用训练好的word2vec模型从评论数据中寻找与积极种子词相似的词语，构建积极词库；采用训练好的的...

【专利技术属性】
技术研发人员：纪守领，翁海琴，段辅正，陈建海，何钦铭，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人