一种屏蔽处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:29402786 阅读:36 留言:0更新日期:2021-07-23 22:40
本发明专利技术实施例提供的一种屏蔽处理方法、装置、电子设备及存储介质,方法包括:确定待处理文本中的候选词;比较所述候选词与屏蔽库中的屏蔽词;当所述候选词与所述屏蔽库中的屏蔽词匹配时,对所述候选词进行屏蔽处理;其中,所述屏蔽库包括:第一屏蔽词以及与所述第一屏蔽词具有相关性的第二屏蔽词,所述第一屏蔽词为所述屏蔽库中预先设置的屏蔽词。由于所述屏蔽库中不仅包括预先设置的第一屏蔽词,还包括与所述第一屏蔽词具有相关性的第二屏蔽词,因此能够实现对屏蔽词的全面屏蔽,优化了屏蔽词的屏蔽效果。

【技术实现步骤摘要】
一种屏蔽处理方法、装置、电子设备及存储介质
本专利技术涉及计算机领域,尤其涉及一种屏蔽处理方法、装置、电子设备及存储介质。
技术介绍
现有屏蔽词技术一般根据系统预置屏蔽中文词库、拼音词库、谐音词库,对待展示信息进行屏蔽。但是一旦这些词库更新不及时,就可能导致部分系统想屏蔽的内容屏蔽不掉。因此,如何对屏蔽词进行全面屏蔽是当下需要解决的技术问题。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种屏蔽处理方法、装置、电子设备及存储介质。第一方面,本专利技术实施例提供一屏蔽处理方法,包括:确定待处理文本中的候选词;比较所述候选词与屏蔽库中的屏蔽词;当所述候选词与所述屏蔽库中的屏蔽词匹配时,对所述候选词进行屏蔽处理;其中,所述屏蔽库包括:第一屏蔽词以及与所述第一屏蔽词具有相关性的第二屏蔽词,所述第一屏蔽词为所述屏蔽库中预先设置的屏蔽词。可选的,上述处理方法还包括:根据设定时间内的历史数据,确定候选屏蔽词;当所述候选屏蔽词不属于第一屏蔽词时,判本文档来自技高网...

【技术保护点】
1.一种屏蔽处理方法,其特征在于,包括:/n确定待处理文本中的候选词;/n比较所述候选词与屏蔽库中的屏蔽词;/n当所述候选词与所述屏蔽库中的屏蔽词匹配时,对所述候选词进行屏蔽处理;其中,/n所述屏蔽库包括:第一屏蔽词以及与所述第一屏蔽词具有相关性的第二屏蔽词,所述第一屏蔽词为所述屏蔽库中预先设置的屏蔽词。/n

【技术特征摘要】
1.一种屏蔽处理方法,其特征在于,包括:
确定待处理文本中的候选词;
比较所述候选词与屏蔽库中的屏蔽词;
当所述候选词与所述屏蔽库中的屏蔽词匹配时,对所述候选词进行屏蔽处理;其中,
所述屏蔽库包括:第一屏蔽词以及与所述第一屏蔽词具有相关性的第二屏蔽词,所述第一屏蔽词为所述屏蔽库中预先设置的屏蔽词。


2.根据权利要求1所述的屏蔽处理方法,其特征在于,方法还包括:
根据设定时间内的历史数据,确定候选屏蔽词;
当所述候选屏蔽词不属于第一屏蔽词时,判断所述候选屏蔽词与至少一个所述第一屏蔽词之间是否具有相关性;
当所述候选屏蔽词与至少一个第一屏蔽词之间具有相关性时,将所述候选屏蔽词作为第二屏蔽词添加到屏蔽库中。


3.根据权利要求2所述的屏蔽处理方法,其特征在于,所述判断所述候选屏蔽词与至少一个所述第一屏蔽词之间是否具有相关性,包括:
使用所述候选屏蔽词进行搜索,得到搜索结果;
将所述第一屏蔽词和所述搜索结果进行字符串匹配,确定第三屏蔽词;所述第三屏蔽词为所述第一屏蔽词中与所述候选屏蔽词存在关联的屏蔽词;
确定所述第三屏蔽词在所述搜索结果出现的次数;
若所述第三屏蔽词在所述搜索结果出现的次数大于第一阈值,则确定所述候选屏蔽词与至少一个所述第一屏蔽词之间具有相关性。


4.根据权利要求2所述的屏蔽处理方法,其特征在于,所述判断所述候选屏蔽词与至少一个所述第一屏蔽词之间是否具有相关性,包括:
对任意一个所述第一屏蔽词进行部首拆分,得到第一拆分内容;
将所述第一拆分内容和所述候选屏蔽词进行比较,得到第一比较结果;
若所述第一比较结果为匹配,则确定所述候选屏蔽词与至少一个所述第一屏蔽词之间具有相关性。


...

【专利技术属性】
技术研发人员:孙玲李琳张晓颖
申请(专利权)人:咪咕文化科技有限公司中国移动通信集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1