【技术实现步骤摘要】
数据的处理方法、装置及设备
本专利技术涉及互联网
,尤其涉及一种数据的处理方法、装置及设备。
技术介绍
随着科学技术的飞速发展,电商业务平台为千万的商家提供了线上零售交易的机会。并且,为了能给消费者提供诚信、活跃、快速的网络交易环境,电商业务平台会以各种激励政策鼓励商家提升商品品质和服务质量。但是,在对电商业务平台的实际运营过程中,仍然会存在一些商家为了短期利益,通过一些违规操作,影响平台的正常运营秩序,危害消费者的利益。例如:引流站外就是一种非常恶劣的风险操作行为,即商家通过在店铺透出各类的私人联系方式(通过IM通信软件、邮件等等),并引导脱离平台进行交易,从而实现绕开平台的正常交易流程和管理体系,以达到发布广告信息、销售假货、甚至诈骗的目的。这不仅会严重影响消费者的感受,并且利用这种方式将整个交易过程引导出平台的安全支付体系,让消费者面临潜在的交易风险。
技术实现思路
本专利技术实施例提供一种数据的处理方法、装置及设备,用以保证电商业务平台中交易的安全可靠性,降低消费者所面临的交易风险。 ...
【技术保护点】
1.一种数据的处理方法,其特征在于,包括:/n获取待处理的第一数据和第二数据,所述第一数据包括第一文本信息,所述第二数据包括第二文本信息和图片信息;/n确定所述第二数据中的第二文本信息以及与所述图片信息相对应的图片特征信息;/n对所述第一文本信息、第二文本信息以及图片特征信息进行分析处理,确定所述第一数据和第二数据存在引走用户流量的风险信息。/n
【技术特征摘要】
1.一种数据的处理方法,其特征在于,包括:
获取待处理的第一数据和第二数据,所述第一数据包括第一文本信息,所述第二数据包括第二文本信息和图片信息;
确定所述第二数据中的第二文本信息以及与所述图片信息相对应的图片特征信息;
对所述第一文本信息、第二文本信息以及图片特征信息进行分析处理,确定所述第一数据和第二数据存在引走用户流量的风险信息。
2.根据权利要求1所述的方法,其特征在于,对所述第一文本信息、第二文本信息以及图片特征信息进行分析处理,确定所述第一数据和第二数据存在引走用户流量的风险信息,包括:
将所述第一文本信息与所述第二文本信息进行融合处理,获得融合文本信息;
利用数据处理模型对所述融合文本信息和图片特征信息进行分析处理,确定所述第一数据和第二数据存在引走用户流量的风险信息。
3.根据权利要求2所述的方法,其特征在于,所述数据处理模型包括deep子模型和/或wide子模型;利用数据处理模型对所述融合文本信息和图片特征信息进行分析处理,确定所述第一数据和第二数据存在引走用户流量的风险信息,包括:
利用所述deep子模型对所述融合文本信息和图片特征信息进行分析处理,确定所述第一数据和第二数据存在引走用户流量的风险信息;或者,
获取待处理的用户的行为特征;利用所述wide子模型对所述融合文本信息、图片特征信息以及用户的行为特征进行分析处理,确定所述第一数据和第二数据存在引走用户流量的风险信息;或者,
获取待处理的用户的行为特征;利用所述deep子模型对所述融合文本信息和图片特征信息进行分析处理,获得数据处理结果;利用所述wide子模型对所述数据处理结果和所述用户的行为特征进行分析处理,获得所述第一数据和第二数据存在引走用户流量的风险信息。
4.根据权利要求3所述的方法,其特征在于,所述用户的行为特征包括以下至少之一:用户操作网络行为、用户登录网络行为、用户访问网络行为。
5.根据权利要求1-4中任意一项所述的方法,其特征在于,在确定所述第一数据和第二数据存在引走用户流量的风险信息之后,所述方法还包括:
若所述风险信息大于或等于预设的风险阈值,则禁止对所述待处理数据进行发布;或者,
若所述风险信息小于预设的风险阈值,则允许对所述待处理数据进行发布。
6.根据权利要求5所述的方法,其特征在于,在所述风险信息大于或等于预设的风险阈值之后,所述方法还包括:
根据所述风险信息获取与所述待处理数据相对应的风险词提示信息;
向用户显示所述风险词提示信息。
7.根据权利要求1-4中任意一项所述的方法,其特征在于,确定所述第二数据中的第二文本信息,包括:
利用光学字符识别OCR算法对所述第二数据进行识别,获得所述第二数据中的第二文本信息。
8.根据权利要求1-4中任意一项所述的方法,其特征在于,确定与所述图片信息相对应的图片特征信息,包括:
利用深度神经网络Inception-V3算法对所述第二数据进行分析处理,获得与所述第二数据中图片信息相对应的图片特征信息。
9.一种数据的处理方法,其特征在于,包括:
获取在线样本数据,所述在线样本数据包括用于标识存在引走用户流量风险的第一样本集合和用于标识无引走用户流量风险的第二样本集合;
针对所述第一样本集合和所述第二样本集合,提取第一样本数据、第二样本数据以及用户的样本行为特征,其中,所述第一样本数据包括第一样本文本,所述第二样本数据包括第二样本文本和样本图片信息;
根据所述第一样本数据、第二样本数据和用户的样本行为特征建立数据处理模型,所述数据处理模型用于识别数据存在引走用户流量的风险。
10.根据权利要求9所述的方法,其特征在于,根据所述第一样本数据、第二样本数据和用户的样本行为特征建立数据处理模型,包括:
确定所述第二样本数据中的第二样本文本以及与所述样本图片信息相对应的样本图片特征;
将所述第一样本文本与所述第二样本文本进行融合处理,获得样本融合信息;
根据所述样本融合信息、样本图片特征和用户的样本行为特征建立所述数据处理模型。
11.根据权利要求10所述的方法,其特征在于,根据所述样本融合信息、样本图片特征和用户的样本行为特征建立所述数据处理模型,包括:
对所述样本融合信息进行变异词检测;
利用自注意力算法对检测后的所述样本融合信息进行处理,获得与所述样本融合信息相对应的样本文本向量;
对所述样本文本向量、样本图片特征和用户的样本行为特征进行训练,获得所述数据处理模型。
12.根据权利要求11所述的方法,其特征在于,对所述样本融合信...
【专利技术属性】
技术研发人员:董颖,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。