一种文本处理方法和文本处理系统技术方案

技术编号:34193853 阅读:30 留言:0更新日期:2022-07-17 16:06
本发明专利技术公开了一种文本处理方法和文本处理系统,方法包括:服务器接收待处理文本,并在第一缓存区中排序形成文本队列;获取待处理文本的特征片段;将文本队列中的待处理文本的特征片段依次存储至第二缓存区中;第二处理器从第二缓存区中提取待处理文本的特征片段;第二处理器对提取的特征片段进行初步处理得到初步结果,将初步结果返回至服务器;服务器将初步结果返回至用户终端;第一处理器从第一缓存区中依次提取各个待处理文本进行完整处理,根据完整处理结果形成精确结果,将精确结果返回至服务器;服务器将精确结果返回至用户终端。本发明专利技术有利于解决现有技术中用户等待文本处理时间过长的缺陷。理时间过长的缺陷。理时间过长的缺陷。

A text processing method and text processing system

【技术实现步骤摘要】
一种文本处理方法和文本处理系统


[0001]本专利技术涉及文本处理
,尤其涉及一种文本处理方法和一种文本处理系统。

技术介绍

[0002]文本处理直接应用于自然语言处理,也称为NLP(Natural Language Processing),自然语言处理是研究人与计算机交互的语言问题的一门学科,处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguage Understanding),也称为计算语言学(Computational Linguistics)。一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。
[0003]文本处理涉及的处理类型有:信息提取、语言翻译、情绪分析、信息分类等,其中,文本处理涉及到的技术手段有自动分词、词性分析、句法分析和语义分析等NLP领域的多种复杂技术。
[0004]通常而言,文本处理是将待处理文本输入处理模块,在处理模块中进行一系列自动处理得到处理结果,当本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括如下步骤:服务器接收各个用户终端发送的待处理文本,并在所述服务器的第一缓存区中排序形成文本队列,等待各个第一处理器按照所述文本队列的排列顺序提取所述待处理文本进行文本处理;获取用户终端对待处理文本进行词频统计确定的所述待处理文本的特征片段;将所述文本队列中的待处理文本的特征片段按照文本队列中的顺序,依次存储至所述服务器的第二缓存区中;第二处理器从所述第二缓存区中依次提取待处理文本的特征片段;所述第二处理器对提取的所述特征片段进行初步处理得到初步结果,将所述初步结果返回至所述服务器;所述服务器将所述初步结果返回至用户终端;所述第一处理器从所述第一缓存区中依次提取各个待处理文本进行完整处理得到精确结果,将所述精确结果返回至服务器;所述服务器将所述精确结果返回至所述用户终端。2.根据权利要求1所述的文本处理方法,其特征在于,所述获取用户终端对待处理文本进行词频统计确定的所述待处理文本的特征片段的步骤,包括:所述用户终端对向所述服务器发送的每个待处理文本进行词频统计;通过词频统计筛选出每个所述待处理文本中词频排名靠前的单词作为典型词,标记所述典型词在所述待处理文本中所在的文本位置;统计标注出的文本位置中,出现典型词次数最多的文本片段;将出现典型词次数最多的文本片段作为所述特征片段;将所述特征片段向所述服务器发送。3.根据权利要求1所述的文本处理方法,其特征在于,所述文本处理方法,还包括:所述第二处理器判断所述文本队列中的各个所述待处理文本是否均已完成初步处理;若否,根据所述文本队列中的各个所述待处理文本的排列顺序,对未进行初步处理的所述待处理文本继续进行初步处理;若是,控制所述第二处理器执行所述第一处理器的完整处理任务。4.根据权利要求1所述的文本处理方法,其特征在于,所述服务器连接有多个处理器,所述服务器接收各个用户终端发送的待处理文本,并在所述服务器的第一缓存区中排序形成文本队列,等待各个第一处理器按照所述文本队列的排列顺序提取所述待处理文本进行文本处理的步骤之前,还包括:获取与所述服务器连接的空闲的处理器;获取与所述服务器连接的剩余处理时间不超过预设时间的处理器;将空闲的处理器与所述剩余处理时间不超过预设时间的处理器添加至处理器群组,对所述处理器群组进行剩余处理时间排序;将所述处理器群组中剩余处理时间最短的编号第一个处理器作为所述第二处理器;将所述处理器群组中其余的所述处理器作为所述第一处理器。5.根据权利要求1所述的文本处理方法,其特征在于,所述服务器接收各个用户终端发送的待处理文本,并在所述服务器的第一缓存区中排序形成文本队列的步骤之后,还包括:
所述第二处理器识别所述文本队列中的每个所述待处理文本对应的所述用户终端的类别;根据所述用户终端的类别确定所述待处理文本的文本类别;根据所述文本类别将所述待处理文本存储至所述服务器的所述第一缓存区的不同类别的存储单元;在所述第一缓存区中形成记录文本队列中各个待处理文本信息的文本链表,其中文本链表中按照待处理文本的排序记载有各个待处理文本信息,和每个所述待处理文本的具体存储单元。6.根据权利要求5所述的文本处理方法,其特征在于,所述文本处理方法,还包括:生成用于对各个第一处理器进行剩余...

【专利技术属性】
技术研发人员:刘跃华王新
申请(专利权)人:湖南正宇软件技术开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1