假冒商品风险识别方法、装置及设备制造方法及图纸

技术编号：38533733 阅读：7 留言：0更新日期：2023-08-19 17:05

本申请公开了假冒商品风险识别方法，以及其它相关方法、装置及设备。其中，假冒商品风险识别方法通过获取目标商品的描述信息；获取假冒商品风险点的风险识别语句，该语句是根据假冒商品风险识别规则、算子类型标识符和算子结果约束标识符生成的，该规则包括至少一个算子条件，算子条件包括识别主体、算子和结果项；若结果项为变量，则所述条件还包括算子结果约束；执行所述语句，以判断目标商品是否符合对应的风险识别规则。采用这种处理方式，使得基于面向内容风险域的领域特定语言(DSL，风险定义脚本语言)，支持对假冒商品风险防控标准的描述，运营专家通过定义DSL及更新知识，可以实现对内容风险识别能力的更新升级，更新过程可以实现分钟级时效。以实现分钟级时效。以实现分钟级时效。

全部详细技术资料下载

【技术实现步骤摘要】
假冒商品风险识别方法、装置及设备

[0001]本申请涉及数据处理
，具体涉及假冒商品风险识别方法和装置，假冒商品风险识别语句生成方法和装置，假冒商品风险识别规则构建方法和装置，假冒商品风险算子构建方法和装置，假冒商品风险知识库更新方法和装置，以及电子设备。

技术介绍

[0002]随着互联网技术广泛应用于各个行业，每天生产内容的用户量已达到上亿级。海量的大数据积累，极大地丰富了人们的精神和物质生活，但互联网内容风险和隐患越来越突出。为了有效控制内容风险，可通过内容风险识别技术从海量数据中快速识别存在风险的内容。
[0003]目前，内容风险识别技术主要分为两类，一类是基于神经网络的方法，另一类是基于规则的方法。这两种方法有各自的优缺点，基于规则的方法擅长逻辑推理，具有很强的可解释性，但它对自然语言的多义性和变化性鲁棒性不强，对噪声数据的识别效果不佳；相反，神经网络具有很强的容错性，能够利用嵌入向量学习抽象语义，而不只是实体和关系之间的字面意义，但存在着鲁棒差、可解释差、更新慢等问题。
[0004]综上所述，在商品风险控制场景中，如何弥补神经网络方法和规则方法之间的鸿沟，使得在保证高召回高准确的同时，能够快速迭代人工提供的先验知识，是亟需进行研究和攻关的问题。

技术实现思路

[0005]本申请提供假冒商品风险识别方法，以解决现有技术存在的无法兼具算法模型的高泛化性和规则策略的高时效性的问题。本申请另外提供假冒商品风险识别装置，假冒商品风险识别语句生成方法和装置，假冒商品风险识别规则构建...

【技术保护点】

【技术特征摘要】
1.一种假冒商品风险知识库构建方法，其特征在于，包括：根据品牌信息，生成品牌实体；根据商品型号信息，生成商品型号实体，所述商品型号信息包括商品所属品牌；将所述品牌实体和所述商品型号实体作为假冒商品风险知识库的实体；获取品牌的风险相关信息和商品型号的风险相关信息；根据所述品牌的风险相关信息，设置所述品牌实体的风险相关信息；根据所述商品型号的风险相关信息，设置所述商品型号实体的风险相关信息。2.一种假冒商品风险知识库更新方法，其特征在于，包括：确定目标实体，所述实体包括品牌实体和/或商品型号实体，所述品牌实体包括风险相关信息，所述商品型号实体包括风险相关信息；获取所述目标实体的更新信息；根据所述更新信息，更新所述目标实体的信息。3.一种假冒商品风险算子构建方法，其特征在于，包括：根据假冒商品风险算子的类型，构建假冒商品风险算子的模型结构；获取训练数据集；从所述训练数据集内学习得到所述模型结构的参数。4.根据权利要求3所述的方法，其特征在于，所述风险算子的类型包括实体识别模型算子；所述实体识别模型算子的输入数据包括商品描述信息和实体集合，所述实体识别模型算子的输出数据包括所述商品描述信息包括的实体。5.根据权利要求3所述的方法，其特征在于，所述风险算子的类型包括提取模型算子；所述提取模型算子的输入数据包括商品描述信息，所述提取模型算子的输出数据包括商品属性。6.根据权利要求3所述的方法，其特征在于，所述风险算子的类型包括分类模型算子；所述分类模型算子的输入数据包括商品描述信息，所述提取模型算子的输出数据包括所述商品描述信息的文本分类信息。7.一种假冒商品风险识别规则构建方法，其...

【专利技术属性】
技术研发人员：肖鹏，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人