对疑似词进行处理的方法和装置制造方法及图纸

技术编号:24498749 阅读:57 留言:0更新日期:2020-06-13 04:08
本发明专利技术提供一种对疑似词进行处理的方法和装置,该方法包括:将获取的待检测文本通过nameko微服务框架进行分发;将分发的文本切割为单词数组;利用深度优先算法遍历单词数组的单词个体,获取疑似词;将疑似词与预设词组进行匹配,确定匹配组合后的疑似词组;利用nameko微服务框架消费者调用代码完成对疑似词组的处理。通过本发明专利技术业务方客户端无需等待,将需要处理的数据分发到指定消息队列即可,不会影响业务服务器,处理过程独立成一套微服务,可以单独更新启动及维护,当需要改变疑似词组合时,仅在疑似词服务器上进行即可,可达到实时效果;同时,在匹配方面,疑似词树启动时只需构建一次树结构,存在内存缓存,检测速度快。

Methods and devices for handling suspected words

【技术实现步骤摘要】
对疑似词进行处理的方法和装置
本专利技术涉及计算机
,尤其涉及一种对疑似词进行处理的方法和装置。
技术介绍
服务器在待处理文本所处的消息队列里,会对一些没有出现在字典中的词我们称为“疑似词”进行处理,通常会利用服务器对疑似词的组合完成查询和更新,每查询一次就要更新一次业务代码,这样在待检测文本数据很大的情况下,会由于每次的更新和疑似词的重新匹配,导致匹配效率降低,且服务器工作负荷加重。鉴于此,急需一种对疑似词进行快速处理且不影响服务器正常运行的方法。
技术实现思路
为了解决现有技术匹配效率低,服务器负荷加重的问题,本专利技术提供一种对疑似词进行处理的方法和装置。第一方面,本专利技术提供一种对疑似词进行处理的方法,该方法包括:将获取的待检测文本通过nameko微服务框架进行分发;将分发的文本切割为单词数组;利用深度优先算法遍历单词数组的单词个体,获取疑似词;将疑似词与预设词组进行匹配,确定匹配组合后的疑似词组;利用nameko微服务框架消费者调用代码完成对疑似词组的本文档来自技高网...

【技术保护点】
1.一种对疑似词进行处理的方法,其特征在于,所述方法包括:/n将获取的待检测文本通过nameko微服务框架进行分发;/n将所述分发的文本切割为单词数组;/n利用深度优先算法遍历所述单词数组的单词个体,获取疑似词;/n将所述疑似词与预设词组进行匹配,确定匹配组合后的疑似词组;/n利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理。/n

【技术特征摘要】
1.一种对疑似词进行处理的方法,其特征在于,所述方法包括:
将获取的待检测文本通过nameko微服务框架进行分发;
将所述分发的文本切割为单词数组;
利用深度优先算法遍历所述单词数组的单词个体,获取疑似词;
将所述疑似词与预设词组进行匹配,确定匹配组合后的疑似词组;
利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理。


2.根据权利要求1所述的方法,其特征在于,所述利用深度优先算法遍历所述单词数组的单词个体,获取疑似词包括;
利用nameko微服务框架内多个消费者,完成深度优先算法遍历对所述单词数组的单词个体,获取疑似词。


3.根据权利要求2所述的方法,其特征在于,所述利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理包括:
将所述疑似词组输入待处理消息队列中;
nameko微服务框架消费者调用代码,对所述待处理消息队列中的疑似词组进行处理。


4.根据权利要求1所述的方法,其特征在于,所述利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理之后还包括:
获取疑似词组的处理结果;
利用Flask构建的web服务,对所述疑似词组的处理结果进行实时查看。


5.一种对疑似词进行处理的装置,其特征在于,所述装置包括:
分发模块,用于将获取的待检测文本通过nameko微服务框架进行分发;
切割模块,用于将所述分发的文本切割为单词数组;

【专利技术属性】
技术研发人员:尹永华黄培侯亚乾
申请(专利权)人:上海众言网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1