信息处理装置、储存介质及信息处理方法制造方法及图纸

技术编号:24996965 阅读:47 留言:0更新日期:2020-07-24 17:59
一种信息处理装置、储存介质及信息处理方法,即使在文件内存在多个表示想要获取的信息的项目的关键词的候选的情况下,也能够从多个关键词中确定表示想要获取的信息的项目的任一个关键词并输出与所确定的关键词对应的字符串。信息处理装置具备:设定部,当在文件内包含多个表示获取对象的信息的候选关键词时,按照如下优先信息,从所述候选关键词中设定所述目标关键词,该优先信息为规定了将所述候选关键词中的哪一个关键词优先用作表示成为所述获取对象的信息的项目的目标关键词;提取部,从文件提取与通过所述设定部设定的所述目标关键词对应的字符串;及输出部,输出与通过所述提取部提取的所述目标关键词对应的字符串。

【技术实现步骤摘要】
信息处理装置、储存介质及信息处理方法
本专利技术涉及一种信息处理装置、储存介质及信息处理方法。
技术介绍
已知有从通过扫描仪读取的文件图像提取与以用户所期望的特定关键词来表示的项目建立对应关系的字符串的信息处理装置。专利文献1中公开有一种信息处理装置,其特征在于,具备:提取单元,通过对图像执行区域分析处理而提取区域;获取单元,获取用于提取特定关键词及与该关键词对应的价值(value)的规则;决定单元,根据能够获得该规则中所包含的所述关键词和与该关键词对应的价值的值决定使用所述规则确定包含所述关键词的区域及包含与该关键词对应的价值的区域的顺序;确定单元,按照所述决定的顺序,从所述提取的区域中确定包含所述关键词的区域或包含与该关键词对应的价值的区域;及文字识别单元,对所述确定的区域进行文字识别处理,所述确定单元按照所述决定的顺序,并根据先前确定的区域,确定所对应的另一个区域。专利文献1:日本特开2018-128996号公报当预先设定有表示用户所期望的信息的项目的标记时,通过将所设定的标记设定为关键词,从文件提取与关键词建立对应关系的字符串。然而,例如,若文件的创建方不同,则即便是相同的项目,有时也会使用不同的关键词来创建文件。在这种情况下,若要从文件提取与所期望的项目建立对应关系的字符串,则使用认为在所期望的项目的标记中使用的多个关键词的候选,提取与各关键词的候选建立对应关系的字符串即可。然而,当使用多个关键词的候选来提取与各关键词的候选建立对应关系的字符串时,无法判断哪一字符串是与所期望的项目建立对应关系的字符串。
技术实现思路
本专利技术的目的在于提供一种即使在文件内存在多个表示想要获取的信息的项目的关键词的候选情况下,也能够从多个关键词中确定表示想要获取的信息的项目任一个关键词并输出与所确定的关键词对应的字符串的信息处理装置、储存介质及信息处理方法。第1方式所涉及的信息处理装置具备:设定部,当在文件内包含多个表示获取对象的信息的候选关键词时,按照如下优先信息,从所述候选关键词中设定所述目标关键词,该优先信息为规定了将所述候选关键词中的哪一个关键词优先用作表示成为所述获取对象的信息的项目的目标关键词;提取部,从文件提取与通过所述设定部设定的所述目标关键词对应的字符串;及输出部,输出与通过所述提取部提取的所述目标关键词对应的字符串。第2方式所涉及的信息处理装置在第1方式所涉及的信息处理装置中,当文件由以不同的格式记载的多个文件构成时,所述设定部按照所述优先信息,按格式不同的每个文件设定所述目标关键词。第3方式所涉及的信息处理装置在第2方式所涉及的信息处理装置中,在所述优先信息中建立对应关系有每个文件的格式信息,当遵从文件中的格式与任一所述优先信息建立对应关系的特定格式信息时,所述设定部按照与所述特定格式信息建立对应关系的所述优先信息,从所述候选关键词中设定所述目标关键词。第4方式所涉及的信息处理装置在第3方式所涉及的信息处理装置中,与所述优先信息建立对应关系的格式信息由表示所述候选关键词的字符串的文字属性或与所述候选关键词对应的字符串的文字属性来表示。第5方式所涉及的信息处理装置在第3方式所涉及的信息处理装置中,与所述优先信息建立对应关系的格式信息由文件中的所述候选关键词的记载位置来表示。第6方式所涉及的信息处理装置在第3方式所涉及的信息处理装置中,与所述优先信息建立对应关系的格式信息由文件中的与所述候选关键词对应的字符串的记载位置来表示。第7方式所涉及的信息处理装置在第5或6方式所涉及的信息处理装置中,所述候选关键词的记载位置或与所述候选关键词对应的字符串的记载位置由以所述候选关键词的任一个位置为基准的相对位置来表示。第8方式所涉及的信息处理装置在第1~7方式中的任一个方式所涉及的信息处理装置具备:接收部,接收从所述候选关键词中选择了任一个关键词的选择结果,当不存在与文件中所包含的所述候选关键词一致的所述优先信息时,所述设定部将由通过所述接收部接收的选择结果表示的关键词设定为所述候选关键词中的所述目标关键词。第9方式所涉及的信息处理装置在第8方式所涉及的信息处理装置具备:生成部,分别对不与所述优先信息中的任一个一致的所述候选关键词生成遵从所述选择结果的新的优先信息。第10方式所涉及的存储介质存储有用于使计算机作为如下各部发挥功能的信息处理程序:设定部,当在文件内包含多个表示获取对象的信息的候选关键词时,按照如下优先信息,从所述候选关键词中设定所述目标关键词,该优先信息为规定了将所述候选关键词中的哪一个关键词优先用作表示成为所述获取对象的信息的项目的目标关键词;提取部,从文件提取与通过所述设定部设定的所述目标关键词对应的字符串;及输出部,输出与通过所述提取部提取的所述目标关键词对应的字符串。第11方式所涉及的信息处理方法包括如下步骤:设定步骤,当在文件内包含多个表示获取对象的信息的候选关键词时,按照如下优先信息,从所述候选关键词中设定所述目标关键词,该优先信息为规定了将所述候选关键词中的哪一个关键词优先用作表示成为所述获取对象的信息的项目的目标关键词;提取步骤,从文件提取与通过所述设定步骤设定的所述目标关键词对应的字符串;及输出步骤,输出与通过所述提取步骤提取的所述目标关键词对应的字符串。专利技术效果根据第1方式、第10方式及第11方式,具有如下效果,即,即使在文件内存在多个表示想要获取的信息的项目的关键词的候选的情况下,也能够从多个关键词中确定表示想要获取的信息的项目的任一个关键词并输出与所确定的关键词对应的字符串。根据第2方式,具有如下效果,即,即使在文件内包含不同格式的文件的情况下,也能够按格式不同的每个文件输出与表示成为获取对象的信息的项目的关键词对应的字符串。根据第3方式,具有如下效果,即,即便存在分别包含多个相同的候选关键词的多个文件,也能够从多个候选关键词中按每个文件确定表示成为获取对象的信息的项目的关键词。根据第4方式,具有如下效果,即,即便存在分别包含多个相同的候选关键词的多个文件,也能够根据字符串的文字属性,从多个候选关键词中按每个文件确定表示成为获取对象的信息的项目的关键词。根据第5方式,具有如下效果,即,即便存在分别包含多个相同的候选关键词的多个文件,也能够根据候选关键词的记载位置,从多个候选关键词中按每个文件确定表示成为获取对象的信息的项目的关键词。根据第6方式,具有如下效果,即,即便存在分别包含多个相同的候选关键词的多个文件,也能够根据与候选关键词对应的字符串的记载位置,从多个候选关键词中按每个文件确定表示成为获取对象的信息的项目的关键词。根据第7方式,具有如下效果,即,包含成为获取对象的信息的项目的文件即便是在光学读取原稿的内容时偏离成为基准的读取位置读取了原稿的结果而生成的文件,也能够从多个候选关键词中按每个文件确定表示成为获取对象的信息的项目的关键词。根据第8方式,具有如下效果,即,即使在多个候选关键词中不知哪一本文档来自技高网
...

【技术保护点】
1.一种信息处理装置,其具备:/n设定部,当在文件内包含多个表示获取对象的信息的候选关键词时,按照如下优先信息,从所述候选关键词中设定所述目标关键词,该优先信息为规定了将所述候选关键词中的哪一个关键词优先用作表示成为所述获取对象的信息的项目的目标关键词;/n提取部,从文件提取与通过所述设定部设定的所述目标关键词对应的字符串;及/n输出部,输出与通过所述提取部提取的所述目标关键词对应的字符串。/n

【技术特征摘要】
20190117 JP 2019-0061921.一种信息处理装置,其具备:
设定部,当在文件内包含多个表示获取对象的信息的候选关键词时,按照如下优先信息,从所述候选关键词中设定所述目标关键词,该优先信息为规定了将所述候选关键词中的哪一个关键词优先用作表示成为所述获取对象的信息的项目的目标关键词;
提取部,从文件提取与通过所述设定部设定的所述目标关键词对应的字符串;及
输出部,输出与通过所述提取部提取的所述目标关键词对应的字符串。


2.根据权利要求1所述的信息处理装置,其中,
当文件由以不同的格式记载的多个文件构成时,
所述设定部按照所述优先信息,按格式不同的每个文件设定所述目标关键词。


3.根据权利要求2所述的信息处理装置,其中,
在所述优先信息中建立对应关系有每个文件的格式信息,
当遵从文件中的格式与任一所述优先信息建立对应关系的特定格式信息时,所述设定部按照与所述特定格式信息建立对应关系的所述优先信息,从所述候选关键词中设定所述目标关键词。


4.根据权利要求3所述的信息处理装置,其中,
与所述优先信息建立对应关系的格式信息由表示所述候选关键词的字符串的文字属性或与所述候选关键词对应的字符串的文字属性来表示。


5.根据权利要求3所述的信息处理装置,其中,
与所述优先信息建立对应关系的格式信息由文件中的所述候选关键词的记载位置来表示。


6.根据权利要求3所述的信息处理装置,其中,
与所述优先信息建立对应关系的格式信息由文件中的与所述候选关键词对应的字符串的记载位置来表示。


7.根据权利要求5或6所述...

【专利技术属性】
技术研发人员:小林邦彦清水淳一堀江大悟
申请(专利权)人:富士施乐株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1