信息处理装置和计算机可读取介质制造方法及图纸

技术编号:30342723 阅读:22 留言:0更新日期:2021-10-12 23:18
信息处理装置和计算机可读取介质。信息处理装置包括存储器和一个或多个处理器,所述存储器将赋予给文档的属性信息以及表示该属性信息是用户能够赋予的第1属性信息还是通过文档管理软件提取的第2属性信息的信息对应起来存储,所述处理器使用所述第1属性信息和所述第2属性信息进行文档的检索。第2属性信息进行文档的检索。第2属性信息进行文档的检索。

【技术实现步骤摘要】
信息处理装置和计算机可读取介质


[0001]本公开涉及信息处理装置和计算机可读取介质。

技术介绍

[0002]在日本特开2004-171316号公报中,作为针对纸文档以及文档图像的文档检索手段,以提出应用字符识别技术来检索包含给定的关键字的文档群的方法为课题,公开了如下的系统,分离字符识别装置和检索装置,作为字符识别装置的输出形式,采用永久地保持字符行提取以及字符截取以及字符识别的多重假说的文件(字符识别装置读取假说文件),公开了通过构成以该字符识别装置读取假说文件为基础检索关键字的功能,来提供进行必要的文档检索以及文件分类。
[0003]在日本特开平07-160730号公报中,以即使是包含误识别的文档也能够可靠地进行检索为目的,公开了如下的全文检索装置,该装置设置有:转换候选生成单元,其在难以从以活字打印的文档的图像数据转换为文本数据时,使用标准模式等生成多个转换候选,将第1候选作为确定文档数据,将从第2候选起作为转换候选数据;文件库,其储存该生成的确定文档数据和转换候选数据;关键词转换单元,其将存储在所述文件库中的转换候选数据的字符替换为所输入的关键词的字符,生成类似关键词,生成由关键词和类似关键词构成的检索式;以及检索单元,其根据以上生成的检索式,从所述文件库中检索确定文档数据。
[0004]在日本特许第3689455号公报中,公开了如下的信息处理方法,在具有字符识别单元、存储单元和字符串的指定单元的信息处理装置中,从由所述字符识别单元从文档图像中识别出的文本信息中检索通过所述指定单元指定的字符串,该信息处理方法的特征在于,包括:判别工序,由所述信息处理装置具备的判别单元参照存储有特定字符的所述存储单元,判别在所述指定的字符串中是否包含有所述特定字符;生成工序,当在所述判别步骤中判别为包含所述特定字符时,所述信息处理装置具备的生成单元生成全部部分字符串,所述部分字符串是所述指定字符串中的连续的字符并且在字符串中不包含所述特定字符的部分;检测工序,所述信息处理装置具备的检测单元检测根据所述文本信息生成的与所述部分字符串相同字符数的索引中是否包含全部的所述部分字符串;判断工序,在所述检测工序中检测为包含所述部分字符串的情况下,所述信息处理装置具备的判断单元判断在所述文本信息中是否包含通过用预定数量以内的其他字符串替代所述指定字符串中的所述特定字符的字符串模式;以及显示工序,所述信息处理装置具备的显示单元将在所述判断工序中判断为包含所述字符串模式的文本信息或对应的文档图像作为检索结果显示在显示装置上。

技术实现思路

[0005]在使用赋予给文档的属性信息进行检索的情况下,与无论用户是否能够赋予该属性信息,或者是否通过文档管理软件提取都一律使用属性信息进行检索。因此,会产生检索
遗漏或检索噪声。因此,本公开的目的在于提供一种信息处理装置和计算机可读取介质,在使用赋予给文档的属性信息进行检索的情况下,与无论用户是否能够赋予该属性信息,或者是否通过文档管理软件提取都一律使用属性信息进行检索的情况相比,能够抑制检索遗漏或检索噪声的产生。
[0006]根据本公开的第一方面,提供一种信息处理装置,其包括存储器和一个或多个处理器,所述存储器将赋予给文档的属性信息以及如下信息对应起来存储,该信息表示该属性信息是用户能够赋予的第1属性信息还是通过文档管理软件提取的第2属性信息,所述处理器使用所述第1属性信息和所述第2属性信息进行文档的检索。
[0007]根据本公开的第二方面,所述第2属性信息有多个种类,所述处理器使用所述第2属性信息的种类的优先顺序进行检索。
[0008]根据本公开的第三方面,所述文档是图像,作为所述第2属性信息,包含分析图像的结果,作为第2属性信息的所述种类,具有字符的形态、记载字符的位置、字符串的统计信息、字符串的词类、与预定的字符串处于预定的位置关系的字符串中的任意1个以上,所述处理器能够变更所述种类的优先顺序,所述处理器在检索时能够指定使用第2属性信息的上级顺序。
[0009]根据本公开的第四方面,所述处理器能够对于所述第1属性信息指定检索中的完全一致和部分一致中的任一个,所述处理器对所述第2属性信息进行基于部分一致的检索。
[0010]根据本公开的第五方面,提供一种计算机可读取介质,其存储有使包括存储器和一个或多个处理器的计算机执行处理的程序,所述存储器将赋予给文档的属性信息以及如下信息对应起来存储,该信息表示该属性信息是用户能够赋予的第1属性信息还是通过文档管理软件提取的第2属性信息,所述处理使用所述第1属性信息和所述第2属性信息进行文档的检索。
[0011]专利技术效果
[0012]根据上述第一方面,在使用赋予给文档的属性信息进行检索的情况下,与无论用户是否能够赋予该属性信息,或者是否通过文档管理软件提取都一律使用属性信息进行检索的情况相比,能够抑制检索遗漏或检索噪声的产生。
[0013]根据上述第二方面,能够使用第2属性信息的种类的优先顺序进行检索,
[0014]根据上述第三方面,在文档是图像的情况下,能够将分析图像的结果包含于第2属性信息内,在检索时使用第2属性信息指定上级顺序。
[0015]根据上述第四方面,能够对于第1属性信息指定检索中的完全一致和部分一致中的任一个,对第2属性信息进行基于部分一致的检索。
[0016]根据上述第五方面,在使用赋予给文档的属性信息进行检索的情况下,与无论用户是否能够赋予该属性信息,或者是否通过文档管理软件提取都一律使用属性信息进行检索的情况相比,能够抑制检索遗漏或检索噪声的产生。
附图说明
[0017]图1是关于本实施方式的结构例的示意模块结构图。
[0018]图2是示出使用本实施方式的系统结构例的说明图。
[0019]图3是示出本实施方式的处理例的说明图。
[0020]图4是示出本实施方式的具体模块结构的说明图。
[0021]图5是示出本实施方式的处理例的流程图。
[0022]图6A是示出环境设定(属性A抽出规则)画面的显示例的说明图。
[0023]图6B是示出环境设定(属性A抽出规则)画面的显示例的说明图。
[0024]图7是示出环境设定(属性B抽出规则)画面的显示例的说明图。
[0025]图8是示出本实施方式的处理例的流程图。
[0026]图9是示出本实施方式的处理例的说明图。
[0027]图10是示出属性B显示区域的显示例的说明图。
[0028]图11是示出属性检索画面的显示例的说明图。
[0029]图12是示出检索结果画面的显示例的说明图。
[0030]图13是示出键值提取表的数据结构例的说明图。
具体实施方式
[0031]以下,基于附图说明实现本公开的优选的一个实施方式的例子。
[0032]图1示出关于本实施方式的结构例的示意模块结构图。
[0033]另外,模块一般是指逻辑上可分离的软件(作为“软件”的解释,包括计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理装置,所述信息处理装置包括存储器和一个或多个处理器,所述存储器将赋予给文档的属性信息以及如下信息对应起来存储,该信息表示该属性信息是用户能够赋予的第1属性信息还是通过文档管理软件提取的第2属性信息,所述处理器使用所述第1属性信息和所述第2属性信息进行文档的检索。2.根据权利要求1所述的信息处理装置,其中,所述第2属性信息有多个种类,所述处理器使用所述第2属性信息的种类的优先顺序进行检索。3.根据权利要求2所述的信息处理装置,其中,所述文档是图像,作为所述第2属性信息,包含分析图像的结果,作为第2属性信息的所述种类,具有字符的形态、记载字符的位置、字符串的统计信息、字符串的词类、与预定的字符串处...

【专利技术属性】
技术研发人员:高山直弥
申请(专利权)人:富士胶片商业创新有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1