文本校验方法、装置、电子设备和存储介质制造方法及图纸

技术编号:43877129 阅读:23 留言:0更新日期:2024-12-31 18:59
本公开提供了一种文本校验方法、装置、电子设备和存储介质,将待校验文本输入至分类模型,得到待校验文本对应的文本类别;将待校验文本分别输入至多个判别模型中,得到每个判别模型对应的输出结果,输出结果用于指示待校验文本内是否包含敏感信息;从预设多个判定等级中确定与待校验文本对应的文本类别相匹配的目标判定等级,以及目标判定等级对应的目标判定规则;基于目标判定规则和判别模型对应的输出结果,确定待校验文本是否为合规文本。该方式使用先判定文本所属类别,再判定是否合规的方式,实现了针对类别指定判定标准,且使用不同模型进行判别的方式来确定判别标准,模型鲁棒性更强,提高了文本判别的灵活性。

【技术实现步骤摘要】

本公开涉及数据处理,尤其是涉及一种文本校验方法、装置、电子设备和存储介质


技术介绍

1、线上游戏产品中,经常需要对用户输入和发布的文本进行校验,判断是否含有不合规的内容。相关技术中,通常使用词表进行校验,只要用户输入的文本中包含词表中的关键词就人为存在不合规内容,需要进行拦截,但是该方式识别灵活性较差,仅能针对固定场景进行合规判断。


技术实现思路

1、本公开的目的在于提供一种文本校验方法、装置、电子设备和存储介质,以针对不同的应用场景调整文本判定规则,提高文本判别的灵活性和鲁棒性。

2、第一方面,本公开提供了一种文本校验方法,该方法包括:获取待校验文本,将待校验文本输入至预先训练完成的分类模型中,得到待校验文本对应的文本类别;其中,文本类别为预设的多个检测类别中的检测类别;将待校验文本分别输入至预先训练完成的多个判别模型中,得到每个判别模型对应的输出结果,输出结果分别用于指示待校验文本内是否包含文本类别对应的敏感信息;从预设多个判定等级中,确定与待校验文本对应的文本类别相匹配的目标判定等级,以及本文档来自技高网...

【技术保护点】

1.一种文本校验方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取待校验文本,将所述待校验文本输入至预先训练完成的分类模型中,得到所述待校验文本对应的文本类别的步骤之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述从预设多个判定等级中,确定与所述待校验文本对应的文本类别相匹配的目标判定等级,以及所述目标判定等级对应的目标判定规则的步骤,包括:

4.根据权利要求1所述的方法,其特征在于,所述目标判定规则包括:在所述多个判别模型对应的输出结果中指示所述待校验文本内包含所述文本类别对应的敏感信息的输出结果...

【技术特征摘要】

1.一种文本校验方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取待校验文本,将所述待校验文本输入至预先训练完成的分类模型中,得到所述待校验文本对应的文本类别的步骤之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述从预设多个判定等级中,确定与所述待校验文本对应的文本类别相匹配的目标判定等级,以及所述目标判定等级对应的目标判定规则的步骤,包括:

4.根据权利要求1所述的方法,其特征在于,所述目标判定规则包括:在所述多个判别模型对应的输出结果中指示所述待校验文本内包含所述文本类别对应的敏感信息的输出结果的数量小于预设数量阈值时,确定所述待校验文本为合规文本;

5.根据权利要求4所述的方法,其特征在于,不同判定等级对应的判定规则中配置的预设数量阈值不同,所述判定等级的高低与所述预设数量阈值呈反比。

6.根据权利要求4所述的方法,其特征在于,所述确定所述多个判别模型对应的输出结果中指示所述待校验文本内包含所述文本类别对应的敏感信息的输出结果的目标数量的步骤,包括:

【专利技术属性】
技术研发人员:樊乘源杨柳
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1