对疑似词进行处理的方法和装置制造方法及图纸

技术编号：24498749 阅读：57 留言：0更新日期：2020-06-13 04:08

本发明专利技术提供一种对疑似词进行处理的方法和装置，该方法包括：将获取的待检测文本通过nameko微服务框架进行分发；将分发的文本切割为单词数组；利用深度优先算法遍历单词数组的单词个体，获取疑似词；将疑似词与预设词组进行匹配，确定匹配组合后的疑似词组；利用nameko微服务框架消费者调用代码完成对疑似词组的处理。通过本发明专利技术业务方客户端无需等待，将需要处理的数据分发到指定消息队列即可，不会影响业务服务器，处理过程独立成一套微服务，可以单独更新启动及维护，当需要改变疑似词组合时，仅在疑似词服务器上进行即可，可达到实时效果；同时，在匹配方面，疑似词树启动时只需构建一次树结构，存在内存缓存，检测速度快。

Methods and devices for handling suspected words

全部详细技术资料下载

【技术实现步骤摘要】
对疑似词进行处理的方法和装置
本专利技术涉及计算机
，尤其涉及一种对疑似词进行处理的方法和装置。
技术介绍
服务器在待处理文本所处的消息队列里，会对一些没有出现在字典中的词我们称为“疑似词”进行处理，通常会利用服务器对疑似词的组合完成查询和更新，每查询一次就要更新一次业务代码，这样在待检测文本数据很大的情况下，会由于每次的更新和疑似词的重新匹配，导致匹配效率降低，且服务器工作负荷加重。鉴于此，急需一种对疑似词进行快速处理且不影响服务器正常运行的方法。
技术实现思路
为了解决现有技术匹配效率低，服务器负荷加重的问题，本专利技术提供一种对疑似词进行处理的方法和装置。第一方面，本专利技术提供一种对疑似词进行处理的方法，该方法包括：将获取的待检测文本通过nameko微服务框架进行分发；将分发的文本切割为单词数组；利用深度优先算法遍历单词数组的单词个体，获取疑似词；将疑似词与预设词组进行匹配，确定匹配组合后的疑似词组；利用nameko微服务框架消费者调用...

【技术保护点】
1.一种对疑似词进行处理的方法，其特征在于，所述方法包括：/n将获取的待检测文本通过nameko微服务框架进行分发；/n将所述分发的文本切割为单词数组；/n利用深度优先算法遍历所述单词数组的单词个体，获取疑似词；/n将所述疑似词与预设词组进行匹配，确定匹配组合后的疑似词组；/n利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理。/n

【技术特征摘要】
1.一种对疑似词进行处理的方法，其特征在于，所述方法包括：
将获取的待检测文本通过nameko微服务框架进行分发；
将所述分发的文本切割为单词数组；
利用深度优先算法遍历所述单词数组的单词个体，获取疑似词；
将所述疑似词与预设词组进行匹配，确定匹配组合后的疑似词组；
利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理。

2.根据权利要求1所述的方法，其特征在于，所述利用深度优先算法遍历所述单词数组的单词个体，获取疑似词包括；
利用nameko微服务框架内多个消费者，完成深度优先算法遍历对所述单词数组的单词个体，获取疑似词。

3.根据权利要求2所述的方法，其特征在于，所述利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理包括：
将所述疑似词组输入待处理消息队列中；
nameko微服务框架消费者调用代码，对所述待处理消息队列中的疑似词组进行处理。

4.根据权利要求1所述的方法，其特征在于，所述利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理之后还包括：
获取疑似词组的处理结果；
利用Flask构建的web服务，对所述疑似词组的处理结果进行实时查看。

5.一种对疑似词进行处理的装置，其特征在于，所述装置包括：
分发模块，用于将获取的待检测文本通过nameko微服务框架进行分发；
切割模块，用于将所述分发的文本切割为单词数组；

【专利技术属性】
技术研发人员：尹永华，黄培，侯亚乾，
申请(专利权)人：上海众言网络科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人