【技术实现步骤摘要】
本申请涉及自然语言处理技术,尤其涉及一种异常文本检测方法、装置、设备及计算机可读存储介质。
技术介绍
1、自然语言处理(nature language processing,nlp)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
2、以游戏场景为例,为检测游戏内的异常文本以及基于异常文本生成的变种文本,传统基于关键词匹配的文本检测系统成本过高且准确率低,而基于深度学习的文本检测系统效率和召回率较低。相关技术暂无较好的方案对异常文本进行自动收集和高准确率高效率检测。
技术实现思路
1、本申请实施例提供一种异常文本检测方法、装置、电子设备、计算机程序产品及计算机可读存储介质,能够自动收
...【技术保护点】
1.一种异常文本检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求2所述的方法,其特征在于,所述从所述多个信息中识别出多个变种信息,包括:
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述查询与所述异常种子信息的相似度大于相似度阈值的异常信息,包括:
6.根据权利要求5所述的方法,其特征在于,所述确定所述异常种子信息和所述候选信息之间的编辑距离,包括:
7.根据权利要求1至6任一项所述的方法,
...【技术特征摘要】
1.一种异常文本检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求2所述的方法,其特征在于,所述从所述多个信息中识别出多个变种信息,包括:
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述查询与所述异常种子信息的相似度大于相似度阈值的异常信息,包括:
6.根据权利要求5所述的方法,其特征在于,所述确定所述异常种子信息和所述候选信息之间的编辑距离,包括:
7.根据权利要求1至6任一项所述的方法,其特征在于,所述查询与所述异常种子信息的相似度大于相似度阈值的异常信息,包括:
8.根据权利要求1至6任一项所述的方法,其特征在于...
【专利技术属性】
技术研发人员:刘庭辉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。