假冒商品风险识别方法、装置及设备制造方法及图纸

技术编号:38533733 阅读:7 留言:0更新日期:2023-08-19 17:05
本申请公开了假冒商品风险识别方法,以及其它相关方法、装置及设备。其中,假冒商品风险识别方法通过获取目标商品的描述信息;获取假冒商品风险点的风险识别语句,该语句是根据假冒商品风险识别规则、算子类型标识符和算子结果约束标识符生成的,该规则包括至少一个算子条件,算子条件包括识别主体、算子和结果项;若结果项为变量,则所述条件还包括算子结果约束;执行所述语句,以判断目标商品是否符合对应的风险识别规则。采用这种处理方式,使得基于面向内容风险域的领域特定语言(DSL,风险定义脚本语言),支持对假冒商品风险防控标准的描述,运营专家通过定义DSL及更新知识,可以实现对内容风险识别能力的更新升级,更新过程可以实现分钟级时效。以实现分钟级时效。以实现分钟级时效。

【技术实现步骤摘要】
假冒商品风险识别方法、装置及设备


[0001]本申请涉及数据处理
,具体涉及假冒商品风险识别方法和装置,假冒商品风险识别语句生成方法和装置,假冒商品风险识别规则构建方法和装置,假冒商品风险算子构建方法和装置,假冒商品风险知识库更新方法和装置,以及电子设备。

技术介绍

[0002]随着互联网技术广泛应用于各个行业,每天生产内容的用户量已达到上亿级。海量的大数据积累,极大地丰富了人们的精神和物质生活,但互联网内容风险和隐患越来越突出。为了有效控制内容风险,可通过内容风险识别技术从海量数据中快速识别存在风险的内容。
[0003]目前,内容风险识别技术主要分为两类,一类是基于神经网络的方法,另一类是基于规则的方法。这两种方法有各自的优缺点,基于规则的方法擅长逻辑推理,具有很强的可解释性,但它对自然语言的多义性和变化性鲁棒性不强,对噪声数据的识别效果不佳;相反,神经网络具有很强的容错性,能够利用嵌入向量学习抽象语义,而不只是实体和关系之间的字面意义,但存在着鲁棒差、可解释差、更新慢等问题。
[0004]综上所述,在商品风险控制场景中,如何弥补神经网络方法和规则方法之间的鸿沟,使得在保证高召回高准确的同时,能够快速迭代人工提供的先验知识,是亟需进行研究和攻关的问题。

技术实现思路

[0005]本申请提供假冒商品风险识别方法,以解决现有技术存在的无法兼具算法模型的高泛化性和规则策略的高时效性的问题。本申请另外提供假冒商品风险识别装置,假冒商品风险识别语句生成方法和装置,假冒商品风险识别规则构建方法和装置,假冒商品风险算子构建方法和装置,假冒商品风险知识库更新方法和装置,以及电子设备。
[0006]本申请提供一种假冒商品风险知识点构建方法,包括:
[0007]根据品牌信息,生成品牌实体;
[0008]根据商品型号信息,生成商品型号实体,所述商品型号信息包括商品所属品牌;
[0009]将所述品牌实体和所述商品型号实体作为假冒商品风险知识库的实体;
[0010]获取品牌的风险相关信息和商品型号的风险相关信息;
[0011]根据所述品牌的风险相关信息,设置所述品牌实体的风险相关信息;
[0012]根据所述商品型号的风险相关信息,设置所述商品型号实体的风险相关信息。
[0013]可选的,所述商品型号的风险相关信息包括以下之一:折扣率,价格上限值,价格下限值。
[0014]本申请提供一种假冒商品风险知识库更新方法,包括:
[0015]确定目标实体,所述实体包括品牌实体和/或商品型号实体,所述品牌实体包括风险相关信息,所述商品型号实体包括风险相关信息;
[0016]获取所述目标实体的更新信息;
[0017]根据所述更新信息,更新所述目标实体的信息。
[0018]本申请提供一种假冒商品风险算子构建方法,包括:
[0019]根据假冒商品风险算子的类型,构建假冒商品风险算子的模型结构;
[0020]获取训练数据集;
[0021]从所述训练数据集内学习得到所述模型结构的参数。
[0022]可选的,所述风险算子的类型包括实体识别模型算子;所述实体识别模型算子的输入数据包括商品描述信息和实体集合,所述实体识别模型算子的输出数据包括所述商品描述信息包括的实体。
[0023]可选的,所述风险算子的类型包括提取模型算子;所述提取模型算子的输入数据包括商品描述信息,所述提取模型算子的输出数据包括商品属性。
[0024]可选的,所述风险算子的类型包括分类模型算子;所述分类模型算子的输入数据包括商品描述信息,所述提取模型算子的输出数据包括所述商品描述信息的文本分类信息。
[0025]本申请提供一种假冒商品风险识别规则构建方法,包括:
[0026]获取假冒商品风险算子信息和风险识别类别信息;
[0027]根据所述算子信息,构建假冒商品风险算子的条件,所述条件包括识别主体、算子和结果项;其中,若所述结果项为变量,则所述条件还包括根据所述风险识别类别信息确定的算子结果约束;
[0028]根据算子条件,生成假冒商品风险识别规则。
[0029]本申请提供一种假冒商品风险识别语句生成方法,包括:
[0030]获取假冒商品风险识别规则,所述规则包括至少一个算子条件,所述算子条件包括识别主体、算子和结果项;其中,若所述结果项为变量,则所述条件还包括算子结果约束;
[0031]获取算子类型标识符和算子结果约束标识符;
[0032]根据所述算子类型标识符和算子结果约束标识符,生成与所述规则对应的假冒商品风险识别语句。
[0033]本申请提供一种假冒商品风险识别方法,包括:
[0034]获取目标商品的描述信息;
[0035]获取假冒商品风险点的风险识别语句,所述风险识别语句是根据假冒商品风险识别规则、算子类型标识符和算子结果约束标识符生成的,所述规则包括至少一个算子条件,所述算子条件包括识别主体、算子和结果项;其中,若所述结果项为变量,则所述条件还包括算子结果约束,所述约束与假冒商品风险知识库的实体相关,所述实体包括品牌实体和商品实体;
[0036]执行所述语句,以判断目标商品是否符合对应的风险识别规则。
[0037]可选的,所述执行所述语句,包括:
[0038]通过所述算子结果约束,获取目标实体集;
[0039]通过实体识别模型算子,获取所述描述信息包括的目标实体。
[0040]本申请提供一种电子设备,包括:
[0041]处理器;以及
[0042]存储器,用于存储实现上述任一项所述的方法的程序,该设备通电并通过所述处理器运行该方法的程序。
[0043]本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各种方法。
[0044]本申请还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各种方法。
[0045]与现有技术相比,本申请具有以下优点:
[0046]本申请实施例提供的假冒商品风险知识库构建方法,通过根据品牌信息,生成品牌实体;根据商品型号信息,生成商品型号实体,所述商品型号信息包括商品所属品牌;将所述品牌实体和所述商品型号实体作为假冒商品风险知识库的实体;获取品牌的风险相关信息和商品型号的风险相关信息;根据所述品牌的风险相关信息,设置所述品牌实体的风险相关信息;根据所述商品型号的风险相关信息,设置所述商品型号实体的风险相关信息。采用这种处理方式,使得通过构建风险知识库,可以将假冒商品风险控制领域知识进行体系化建模,实现结构化表示和存储,从而实现知识的沉淀和转移,可实现自动化知识构建,提升人工创建知识的效率。
[0047]本申请实施例提供的假冒商品风险知识点更新方法,通过确定目标实体,所述实体包括品牌实体和/或商品型号实体,所述品牌实体包括风险相关信息,所述商品型号本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种假冒商品风险知识库构建方法,其特征在于,包括:根据品牌信息,生成品牌实体;根据商品型号信息,生成商品型号实体,所述商品型号信息包括商品所属品牌;将所述品牌实体和所述商品型号实体作为假冒商品风险知识库的实体;获取品牌的风险相关信息和商品型号的风险相关信息;根据所述品牌的风险相关信息,设置所述品牌实体的风险相关信息;根据所述商品型号的风险相关信息,设置所述商品型号实体的风险相关信息。2.一种假冒商品风险知识库更新方法,其特征在于,包括:确定目标实体,所述实体包括品牌实体和/或商品型号实体,所述品牌实体包括风险相关信息,所述商品型号实体包括风险相关信息;获取所述目标实体的更新信息;根据所述更新信息,更新所述目标实体的信息。3.一种假冒商品风险算子构建方法,其特征在于,包括:根据假冒商品风险算子的类型,构建假冒商品风险算子的模型结构;获取训练数据集;从所述训练数据集内学习得到所述模型结构的参数。4.根据权利要求3所述的方法,其特征在于,所述风险算子的类型包括实体识别模型算子;所述实体识别模型算子的输入数据包括商品描述信息和实体集合,所述实体识别模型算子的输出数据包括所述商品描述信息包括的实体。5.根据权利要求3所述的方法,其特征在于,所述风险算子的类型包括提取模型算子;所述提取模型算子的输入数据包括商品描述信息,所述提取模型算子的输出数据包括商品属性。6.根据权利要求3所述的方法,其特征在于,所述风险算子的类型包括分类模型算子;所述分类模型算子的输入数据包括商品描述信息,所述提取模型算子的输出数据包括所述商品描述信息的文本分类信息。7.一种假冒商品风险识别规则构建方法,其...

【专利技术属性】
技术研发人员:肖鹏
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1