用于审核文本的方法和装置制造方法及图纸

技术编号:30414008 阅读:27 留言:0更新日期:2021-10-24 16:15
本公开的实施例公开了用于审核文本的方法和装置。该方法的一具体实施方式包括:获取物品预先关联的待审核文本,获取用于表征物品的目标属性的属性信息;响应于确定待审核文本中存在敏感词,提取敏感词所在的子文本作为待审核子文本;确定用于表征属性信息的第一特征向量和用于表征待审核子文本的第二特征向量;将第一特征向量和第二特征向量输入至预先训练的文本审核模型,得到用于指示待审核子文本是否通过审核的审核结果,其中,文本审核模型为Wide And Deep模型;响应于确定得到的审核结果指示待审核子文本未通过审核,生成用于提示待审核文本未通过审核的提示信息。该实施方式实现了包含敏感词的文本的快速审核。式实现了包含敏感词的文本的快速审核。式实现了包含敏感词的文本的快速审核。

【技术实现步骤摘要】
用于审核文本的方法和装置


[0001]本公开的实施例涉及计算机
,具体涉及用于审核文本的方法和装置。

技术介绍

[0002]电子商务的快速发展对人们的生活带来了极大的改变。目前,许多电商平台都可以提供海量的物品以供用户挑选和购买。一般地,电商平台在向用户展示物品时,通常都展示有物品的简要或详细地各种介绍信息(如物品的说明书、功能介绍、宣传语等等)。
[0003]由于一些物品的展示信息中,可能会出现违规或不合法的用语,也可能出现一些虚假信息。例如,对于化妆品来说,在电商平台上展示的化妆品的说明书中或宣传语等中可能存在违法的医疗用语(如抗炎、疏通经络、治疗失眠、排毒等等)。因此,电商平台通常在上架各种物品前,需要对物品的展示信息进行审核,以避免出现上述等违规或违法等情况。
[0004]目前,许多电商平台对于物品的展示信息的审核通常需要使用人工审核的方法。但是随着电商平台所上架的物品的飞速增长,人工审核的方式很难及时地覆盖到所有的物品。

技术实现思路

[0005]本公开的实施例提出了用于审核文本的方法和装置。...

【技术保护点】

【技术特征摘要】
1.一种用于审核文本的方法,包括:获取物品预先关联的待审核文本,以及获取用于表征所述物品的目标属性的属性信息;响应于确定所述待审核文本中存在敏感词,提取敏感词所在的子文本作为待审核子文本;确定用于表征所述属性信息的第一特征向量和用于表征所述待审核子文本的第二特征向量;将所述第一特征向量和第二特征向量输入至预先训练的文本审核模型,得到用于指示所述待审核子文本是否通过审核的审核结果,其中,所述文本审核模型为Wide And Deep模型,所述第一特征向量作为Wide模型的输入,所述第二特征向量作为Deep模型的输入;响应于确定得到的审核结果指示所述待审核子文本未通过审核,生成用于提示所述待审核文本未通过审核的提示信息。2.根据权利要求1所述的方法,其中,所述属性信息包括用于表征所述物品的类目的类目信息。3.根据权利要求1所述的方法,其中,所述提取敏感词所在的子文本作为待审核子文本,包括:提取所述敏感词所在的、目标长度的子文本作为待审核子文本。4.根据权利要求1所述的方法,其中,所述确定用于表征所述属性信息的第一特征向量和用于表征所述待审核子文本的第二特征向量,包括:基于独热one-hot编码技术确定用于表征所述属性信息的第一特征向量;利用预先训练的Word2vec模型确定用于表征所述待审核子文本的第二特征向量。5.根据权利要求1所述的方法,其中,所述第一特征向量的维度和所述第二特征向量的维度相同。6...

【专利技术属性】
技术研发人员:周彬李银锋刘婷婷赖晨东黄明星
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1