The invention provides a deep learning business anomaly recognition method based on financial products, to solve the traditional recognition method is very difficult to carry out accurate segmentation of the text often tamper with the change, lead to the problem of poor accuracy, the method comprises the following steps: A, collect goods search keywords; in the electronic business platform B, through the anomaly keywords commodity; C, D, cribble; manual annotation; E, for normal goods and goods abnormal proportion adjustment; F, the use of deep learning framework to build the model, G; training model; H model. The invention does not need segmentation, directly input the whole text, and carries out the end to end model training and recognition, which can save manpower, and quickly output the model to improve production efficiency.
【技术实现步骤摘要】
基于深度学习的电商异常金融商品识别方法
本专利技术涉及基于深度学习的电商异常金融商品识别方法。
技术介绍
电商很多涉黑、涉灰、金融类商品,比如套现,代缴流水,很多带有明显作弊行为,对于个人信用属于减分项。在征信领域,这是一个很有用的信用补充数据。抓取分析购买这些异常商品人群就非常重要。传统的识别方法存在以下缺陷:传统的识别方法是通过设置关键词去匹配文本,这些方法在初期比较有效,但是随着此类商品被电商平台打压,这些商品已经被下架或者通过文本修改逃避监管,变得没法用简单的关键词方法识别。并且这种简单模型需要涉及到分词,而一般的分词工具对于这种经常篡改变动的文本很难进行准确分词,导致模型错误百出。
技术实现思路
本专利技术提供了基于深度学习的电商异常金融商品识别方法,旨在解决传统的识别方法对经常篡改变动的文本很难进行准确分词,导致识别准确率较差的问题。为了解决以上技术问题,本专利技术通过以下技术方案实现:基于深度学习的电商异常金融商品识别方法,依次包括以下步骤:A、关键词整理:人工整理异常商品的关键词,形成异常商品的关键词词库。B、原始数据采集:通过异常商品的关键词在电商平 ...
【技术保护点】
基于深度学习的电商异常金融商品识别方法,其特征是,依次包括以下步骤:A、关键词整理:人工整理异常商品的关键词,形成异常商品的关键词词库;B、原始数据采集:通过异常商品的关键词在电商平台进行搜索,通过随机采样的方式从电商平台爬取不同品类的商品数据,从而搜集到用于方法研究的原始数据;C、数据清洗和标注:对原始数据进行清洗和人工标注;人工识别为异常商品标注为负样本,正常商品标注为正样本;D、模型训练样本数据集构造:采用亚采样法均衡正负样本比例,形成样本数据集;E、样本数据特征抽取:利用商品分类模型分别对商品名以及商品图片进行特征抽取;F、分类模型训练:将样本数据集划分为训练集与测 ...
【技术特征摘要】
1.基于深度学习的电商异常金融商品识别方法,其特征是,依次包括以下步骤:A、关键词整理:人工整理异常商品的关键词,形成异常商品的关键词词库;B、原始数据采集:通过异常商品的关键词在电商平台进行搜索,通过随机采样的方式从电商平台爬取不同品类的商品数据,从而搜集到用于方法研究的原始数据;C、数据清洗和标注:对原始数据进行清洗和人工标注;人工识别为异常商品标注为负样本,正常商品标注为正样本;D、模型训练样本数据集构造:采用亚采样法均衡正负样本比例,形成样本数据集;E、样本数据特征抽取:利用商品分类模型分别对商品名以及商品图片进行特征抽取;F、分类模型训练:将样本数据集划分为训练集与测试集,基于训练集样本的文本特征和图片特征,利用深度学习框架训练商品分类模型,根据模型训练的结果,更新异常关键词词库,不断优化分类模型,直到模型训练稳定;G、模型测试:用训练后的模型对测试集样本进行分类测试,输出测试集样本属于正常商品和异常商品的概率,将测试集样本分类至概率较大的一类;同时依据测试集样本的标注判断测试集样本分类是否准确;如果测试集样本分类错误,则更新关键词词库,并再次训练模型,直到模型测试准确,得到最优模型。H、模型预测:利用得到的最优模型预测模型输出商品是负样本的概率,当此概率大于经验阈值时,商品标记为负样本,否则为正样本;对标记为负样本的商品进行人工校验并入库。2.根据权利要求1所述的基于深度学习的电商...
【专利技术属性】
技术研发人员:张林江,刘婷,王睿通,
申请(专利权)人:成都知数科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。