【技术实现步骤摘要】
一种文本抽取信息结构化数据处理的控制方法及装置
本专利技术属于计算机应用领域,特别涉及一种文本抽取信息结构化数据处理的控制方法及装置。
技术介绍
在现有的技术中,往往通过查找关键字在搜索引擎中查找,从而获取到用户需要的资料,但这样的方式往往杂乱无章、检索耗时且检索结果并不精确,而当用户需要检索多个关键字的组合搜索时,这样的搜索引擎往往会表现的力不从心,这给工作人员带来了极大的工作压力,降低了工作效率,增加了工作成本。如何将需要搜索的文档数据结构化,关系化,从而用户能够在这样的搜索环境下进行关键字检索,如何更为快速、便捷的对一个或多个关键字进行检索,精确有效的获取与所述关键字相对应的文档信息成为了目前亟待解决的技术问题。目前在现有的技术中,并没有一种能够解决上述技术问题的技术方案,具体地,缺少一种文本抽取信息结构化数据处理的控制方法及装置。
技术实现思路
针对现有技术存在的技术缺陷,本专利技术的目的是提供一种文本抽取信息结构化数据处理的控制方法,包括如下步骤:a.与待处理文本内容建立通讯连接;b.确定目标关键字集合,所述目标关键字集合为与所述待处理文本内容对应的关键字集 ...
【技术保护点】
1.一种文本抽取信息结构化数据处理的控制方法,其特征在于,包括如下步骤:a.与待处理文本内容建立通讯连接;b.确定目标关键字集合,所述目标关键字集合为与所述待处理文本内容对应的关键字集合的子集;c.基于所述目标关键字集合,从所述待处理文本内容中提取目标字段。
【技术特征摘要】
1.一种文本抽取信息结构化数据处理的控制方法,其特征在于,包括如下步骤:a.与待处理文本内容建立通讯连接;b.确定目标关键字集合,所述目标关键字集合为与所述待处理文本内容对应的关键字集合的子集;c.基于所述目标关键字集合,从所述待处理文本内容中提取目标字段。2.根据权利要求1所述的控制方法,其特征在于,所述步骤c包括如下步骤:c1.根据所述目标关键字集合内的关键字个数启动对应数量的线程;c2.所述线程分别针对各自对应的关键字从所述待处理文本内容中提取目标字段。3.根据权利要求1或2所述的控制方法,其特征在于,所述步骤a包括如下步骤:a1.获取所述待处理文本内容。4.根据权利要求1至3中任一项所述的控制方法,其特征在于,还包括如下步骤:d.将所述目标字段存储于关系型数据库中。5.根据权利要求4所述的控制方法,其特征在于,在所述步骤d中,将符合数据库格式条件的所述目标字段存储...
【专利技术属性】
技术研发人员:严卫国,藏宇铎,王冠军,陆银飞,严晴远,
申请(专利权)人:上海润吧信息技术有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。