一种目标文本命中匹配词方法、装置、设备、介质及程序制造方法及图纸

技术编号:43483251 阅读:18 留言:0更新日期:2024-11-29 16:55
本发明专利技术公开了一种目标文本命中匹配词方法、装置、设备、介质及程序,方法包括:遍历预设的匹配词列表,将匹配词列表中的匹配词分割成字符串数组;遍历所述字符串数组,将所述字符串数组的子项加入树形索引模型,并在所述树形索引模型中建立所述子项对应的哈希值与匹配词之间的映射关系;获取目标文本并判断目标文本是否命中LRU缓存;LRU缓存中存储有历史命中结果;若目标文本命中LRU缓存,则从LRU缓存中返回目标文本对应的命中结果;若目标文本未命中LRU缓存,则判断目标文本是否命中匹配词;若目标文本命中匹配词,获取目标文本对应的命中结果,并加入至LRU缓存中。本发明专利技术能够解决文本匹配效率低下以及处理复杂匹配规则困难的问题。

【技术实现步骤摘要】

本专利技术涉及即时通讯,具体涉及一种目标文本命中匹配词方法、装置、设备、介质及程序


技术介绍

1、即时通讯(im)领域针对信息有保障信息安全合规的责任和义务。在满足用户体验的同时,需要通过技术手段保障信息的安全合规,涉及到目标文本命中匹配词。相关技术中,判断目标文本是否命中匹配词,一般使用正则表达式或者strings.contains(目标文本,匹配词)等方法。以上两种方法存在以下问题:当大量匹配词时,以上两种方法导致目标文本需要针对每个匹配词都判断,时间成本较高;当匹配词中包含一些组合关系,如目标文本“杭州的天气真好”需要命中匹配词“杭州+天气”时,以上两种方法达不到以上效果;当匹配词中包含一些组合关系,但实际语义差异导致的匹配效果较差的场景。

2、鉴于此,需要一种能够命中包含组合关系的匹配词以及提高命中效率的目标文本命中匹配词的方法。


技术实现思路

1、有鉴于此,本专利技术提供了一种目标文本命中匹配词方法、装置、设备、介质及程序,以解决文本匹配效率低下以及处理复杂匹配规则困难的问题。

本文档来自技高网...

【技术保护点】

1.一种目标文本命中匹配词方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述若所述目标文本命中所述匹配词,获取所述目标文本对应的命中结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述判断所述匹配词是否符合命中规则,包括:

4.根据权利要求2所述的方法,其特征在于,所述计算所述命中匹配词之间的间隔,筛选得到所述目标文本对应的命中结果,包括:

5.根据权利要求2所述的方法,其特征在于,所述判断所述匹配词是否符合命中规则之前,还包括:

6.一种目标文本命中匹配词装置,其特征在于,所述装置包括:<...

【技术特征摘要】

1.一种目标文本命中匹配词方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述若所述目标文本命中所述匹配词,获取所述目标文本对应的命中结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述判断所述匹配词是否符合命中规则,包括:

4.根据权利要求2所述的方法,其特征在于,所述计算所述命中匹配词之间的间隔,筛选得到所述目标文本对应的命中结果,包括:

5.根据权利要求2所述的方法,其特征在于,所述判断所述匹配词是否符合命中规则之前...

【专利技术属性】
技术研发人员:谢泽昌
申请(专利权)人:杭州安司源科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1