浏览器信息勘误方法、装置、系统及计算机可读存储介质制造方法及图纸

技术编号:32831001 阅读:26 留言:0更新日期:2022-03-26 20:43
本发明专利技术实施例公开了一种浏览器信息勘误方法、装置、系统及计算机可读存储介质。其中,该方法包括:获取参考字符串及校正字符串;根据当前页面的类型确定信息抽取模型,通过所述信息抽取模型调用所述当前页面的数据修改接口;在当前页面的数据库中查询到与所述参考字符串对应的目标字符串;通过所述数据修改接口链接到所述数据库,将所述目标字符串替换为所述校正字符串。本发明专利技术可对多个数据修改接口对应的数据进行替换修改,实现了页面批量替换的目的,提高了数据处理效率。提高了数据处理效率。提高了数据处理效率。

【技术实现步骤摘要】
浏览器信息勘误方法、装置、系统及计算机可读存储介质


[0001]本专利技术涉及数据处理领域,尤其涉及一种浏览器信息勘误方法、装置、系统及计算机可读存储介质。

技术介绍

[0002]在日常的文档编辑中,经常会遇到某一个词重复打错需要替换,或者本身用了模板,需要替换其中一些词句。在Word中,有一个查找/替换的功能,可以实现上述的功能,可是在某网站或者系统中,也经常会有这样的需求,却没有好的工具来实现这个功能。
[0003]传统的文档勘误基于线下数据层面操作,无法满足信息管理系统与底层数据库数据勘误;信息系统页面也无法采用传统文档勘误方式去完成单个或批量数据勘误操作,目前信息系统页面勘误方式均是基于某个单一数据模型进行调取替换操作,需要逐个手动点击特定编辑操作完成数据勘误。
[0004]针对现有技术中无法对信息系统页面批量勘误的问题,目前还没有一个有效的解决方法。

技术实现思路

[0005]为解决上述问题,本专利技术提供一种浏览器信息勘误方法、装置、系统及计算机可读存储介质,通过确定当前页面的类型来确定信息抽取模型,再根据具体的信息抽取模型调用当前页面的数据修改接口,通过数据修改接口在数据库中的对应位置将目标字符串统一替换为校正字符串,以解决现有技术中无法对信息系统页面批量勘误的问题。
[0006]为达到上述目的,本专利技术提供了一种浏览器信息勘误方法,包括:获取参考字符串及校正字符串;根据当前页面的类型确定信息抽取模型,通过所述信息抽取模型调用所述当前页面的数据修改接口;在当前页面的数据库中查询到与所述参考字符串对应的目标字符串;通过所述数据修改接口链接到所述数据库,将所述目标字符串替换为所述校正字符串。
[0007]进一步可选的,所述通过所述信息抽取模型调用所述当前页面的数据修改接口,包括:当所述信息抽取模型为NLP(自然语言处理)页面信息抽取模型时,采用正则表达式或SQL语言抽取所述当前页面的数据修改接口;当所述信息抽取模型为包装器页面信息抽取模型时,采用网页链接分类算法和网页结构分离算法抽取所述当前页面的数据修改接口;当所述信息抽取模型为HTML页面信息抽取模型时,根据提取所述网页中的超链接信息及URL信息提取所述当前页面的数据修改接口。
[0008]进一步可选的,所述在当前页面的数据库中查询到与所述参考字符串对应的目标字符串之后,还包括:识别所述当前页面中所有目标字符串的所处位置;将所有目标字符串的所处位置进行加底色高亮显示。
[0009]进一步可选的,所述在当前页面的数据库中查询到与所述参考字符串对应的目标字符串之前,还包括:获取数据库中所有字符串的所处位置;建立每个字符串与其所处位置
的映射关系并存储为索引表。
[0010]另一方面,本专利技术还提供一种浏览器信息勘误装置,包括:数据获取模块,用于获取参考字符串及校正字符串;数据修改接口抽取模块,用于根据当前页面的类型确定信息抽取模型,通过所述信息抽取模型调用所述当前页面的数据修改接口;查询模块,用于在当前页面的数据库中查询到与所述参考字符串对应的目标字符串;替换模块,用于通过所述数据修改接口链接到所述数据库,将所述目标字符串替换为所述校正字符串。
[0011]进一步可选的,所述数据修改接口抽取模块,包括:第一抽取子模块,用于当所述信息抽取模型为NLP(自然语言处理)页面信息抽取模型时,采用正则表达式或SQL语言抽取所述当前页面的数据修改接口;第二抽取子模块,用于当所述信息抽取模型为包装器页面信息抽取模型时,采用网页链接分类算法和网页结构分离算法抽取所述当前页面的数据修改接口;第三抽取子模块,用于当所述信息抽取模型为HTML页面信息抽取模型时,根据提取所述网页中的超链接信息及URL信息提取所述当前页面的数据修改接口。
[0012]进一步可选的,该装置还包括:第一位置识别模块,用于识别所述当前页面中所有目标字符串的所处位置;区别显示模块,用于将所有目标字符串的所处位置进行加底色高亮显示。
[0013]进一步可选的,该装置还包括:第二位置识别模块,用于获取数据库中所有字符串的所处位置;索引表建立模块,用于建立每个字符串与其所处位置的映射关系并存储为索引表。
[0014]本专利技术还提供一种浏览器信息勘误系统,包括上述的浏览器信息勘误装置。
[0015]本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述的浏览器信息勘误方法。
[0016]上述技术方案具有如下有益效果:根据每个页面的类型确定信息抽取模型,保证在不同的场景下均可以查询到数据修改接口,且在切换页面场景时,也可以根据信息抽取模型快速抽取信息,调用数据修改接口对底层数据库中的错误信息进行替换,提高了信息查询与替换效率,以及提高了方法的普适性;另外,可对多个数据修改接口对应的数据进行替换修改,实现了页面批量替换的目的,提高了数据处理效率。
附图说明
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本专利技术实施例提供的浏览器信息勘误方法的流程图;
[0019]图2是本专利技术实施例提供的各信息抽取模型调用数据修改接口方法的流程图;
[0020]图3是本专利技术实施例提供的显示目标字符串方法的流程图;
[0021]图4是本专利技术实施例提供的建立索引表方法的流程图;
[0022]图5是本专利技术实施例提供的浏览器信息勘误装置的结构示意图;
[0023]图6是本专利技术实施例提供的数据修改接口抽取模块的结构示意图;
[0024]图7是本专利技术实施例提供的第一位置识别模块与区别显示模块的结构示意图;
[0025]图8是本专利技术实施例提供的第二位置识别模块与索引表建立模块的结构示意图;
[0026]图9是本专利技术实施例提供的修改邮件正文的示意图;
[0027]图10是本专利技术实施例提供的操作页面布局示意图;
[0028]图11是本专利技术实施例提供的管理系统的操作界面进行勘误的示意图。
[0029]附图标记:100

数据获取模块 200

数据修改接口抽取模块 2001

第一抽取子模块 2002

第二抽取子模块 2003

第三抽取子模块 300

查询模块 400

替换模块 500

第一位置识别模块 600

区别显示模块 700

第二位置识别模块 800

索引表建立模块
具体实施方式
[0030]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种浏览器信息勘误方法,其特征在于,包括:获取参考字符串及校正字符串;根据当前页面的类型确定信息抽取模型,通过所述信息抽取模型调用所述当前页面的数据修改接口;在当前页面的数据库中查询到与所述参考字符串对应的目标字符串;通过所述数据修改接口链接到所述数据库,将所述目标字符串替换为所述校正字符串。2.根据权利要求1所述的浏览器信息勘误方法,其特征在于,所述通过所述信息抽取模型调用所述当前页面的数据修改接口,包括:当所述信息抽取模型为NLP页面信息抽取模型时,采用正则表达式或SQL语言抽取所述当前页面的数据修改接口;当所述信息抽取模型为包装器页面信息抽取模型时,采用网页链接分类算法和网页结构分离算法抽取所述当前页面的数据修改接口;当所述信息抽取模型为HTML页面信息抽取模型时,根据提取所述网页中的超链接信息及URL信息提取所述当前页面的数据修改接口。3.根据权利要求1所述的浏览器信息勘误方法,其特征在于,所述在当前页面的数据库中查询到与所述参考字符串对应的目标字符串之后,还包括:识别所述当前页面中所有目标字符串的所处位置;将所有目标字符串的所处位置进行加底色高亮显示。4.根据权利要求1所述的浏览器信息勘误方法,其特征在于,所述在当前页面的数据库中查询到与所述参考字符串对应的目标字符串之前,还包括:获取数据库中所有字符串的所处位置;建立每个字符串与其所处位置的映射关系并存储为索引表。5.一种浏览器信息勘误装置,其特征在于,包括:数据获取模块,用于获取参考字符串及校正字符串;数据修改接口抽取模块,用于根据当前页面的类型确定信息抽取模型,通过所述信息抽取模型调用所...

【专利技术属性】
技术研发人员:姚诺铮代芬胡绍勇
申请(专利权)人:上海观安信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1