手写文件检索装置、方法以及记录介质制造方法及图纸

技术编号:9462850 阅读:76 留言:0更新日期:2013-12-19 00:12
本发明专利技术的实施形态关于手写文件检索装置、方法以及记录介质。提供即使作为检索对象的笔画数增加,也可以防止处理时间和存储量增加的手写文件检索装置、方法以及记录介质。根据实施形态,具备获取部、分类部、特征提取部、检索部。获取部获取包含笔迹数据的手写文件。分类部将所述手写文件分类为多个区域。特征提取部根据所述分类结果,提取显示所述区域的特征的特征量。检索部根据所述特征量执行检索。

【技术实现步骤摘要】
【专利摘要】本专利技术的实施形态关于手写文件检索装置、方法以及记录介质。提供即使作为检索对象的笔画数增加,也可以防止处理时间和存储量增加的手写文件检索装置、方法以及记录介质。根据实施形态,具备获取部、分类部、特征提取部、检索部。获取部获取包含笔迹数据的手写文件。分类部将所述手写文件分类为多个区域。特征提取部根据所述分类结果,提取显示所述区域的特征的特征量。检索部根据所述特征量执行检索。【专利说明】手写文件检索装置、方法以及记录介质本申请以日本专利申请2012-121305 (申请日:2012/5/28)为基础,从该申请享受优先利益。本申请通过参照该申请,包含该申请的全部内容。
本专利技术的实施形态关于手写文件检索装置、方法以及记录介质。
技术介绍
已知有从数据库中检索与用户输入或指定的手写查询对象(夕二 U —)相似或匹配的手写文件的文件检索装置。
技术实现思路
本专利技术要解决的课题是提供即使作为检索对象的笔画数增加,也可以防止处理时间和存储量增加的手写文件检索装置、方法以及记录介质。根据实施形态,具备获取部、分类部、特征提取部、检索部。获取部获取包含笔迹数据得手写文件。分类部将上述手写文件分类为多个区域。特征提取部根据上述分类结果,提取表示上述区域特征的特征量。检索部根据所述特征量执行检索。根据上述构成的装置,即使作为检索对象的笔画数增加,也可以防止处理时间和存储量增加。【专利附图】【附图说明】图1是显示本实施形态涉及的手写文件检索装置的构成例的图。图2是显示本实施形态涉及的手写文件检索装置的处理例的流程图。图3是显示墨迹数据的格式一例的图。图4是用于说明笔画数据输入的图。图5是用于说明笔画数据分类的图。图6是用于说明笔画数据分类的图。图7是用于说明笔画数据分类的图。图8是显示分类部一例的图。图9是用于说明分类例的图。图10是用于说明分类例的图。图11是显示检索结果显示的一例的图。图12是用于说明各种输入方法的图。图13是用于说明硬件构成例的图。图14是用于说明有网络的构成例的图。【具体实施方式】以下参照附图详细说明本专利技术的实施形态涉及的手写文件检索装置。另外,以下的实施形态中,对于赋予了相同编号的部分执行同样动作,省略重复说明。本实施形态中,从预先书写的(例如大量的)手写文件中,以用户手写的(含笔迹数据)手写文件列作为查询对象,执行检索。用户指定文件的方法可使用任意方法。例如,可以通过用户实际手写文件而指定查询对象。也可通过将预先准备的笔画列模板配置于布局上而由用户书写文件。也可以由用户从已有的手写文件中选择用作查询对象的文件。也可以是它们的组合。此外,本实施形态中,查询对象与手写文件的相似度判定使用手写文件的布局。另夕卜,笔画指的是手写输入的笔画,表示笔等从接触输入面到离开为止的轨迹。此外,本实施形态中,将含有与查询对象相似或匹配的布局的手写文件作为检索结果呈示。图1显示的是本实施形态的手写文件检索装置的构成例。如图1所示,本实施形态的手写文件检索装置,具备获取部1、分类部2、特征提取部5、检索部7、结果显示部8、墨迹数据数据库(墨迹数据DB) 11、特征量数据库(特征量DB) 12。墨迹数据DBll存储将笔画以文件为单位汇总的墨迹数据。特征量DB12存储基于该文件分类为多个区域的结果的特征量。此处,此处,区域指的是例如,图形区域、表区域、文字区域、行区块、文字区块等,详细后述。获取部I用于获取用作查询对象的手写字符串。此处,主要说明获取用户书写的笔画的情况。另外,该手写输入的方法可使用在触摸屏上用笔输入的方法、在触摸屏上用手指输入的方法、在触摸板上用手指输入的方法、操作鼠标输入的方法、用电子笔的方法等各种方法。用户书写的笔画组(墨迹数据),例如,在用户结束书写文件时或保存时等作为墨迹数据DBll被存储。墨迹数据是用于以文件为单位等存储笔画组的数据构造。分类部2将手写文件(墨迹数据)分类为多个区域,提取分类信息,执行分类处理。分类信息详细后述,但它是从手写文件得到的可以指定各个区域的信息。特征提取部5从分类部2得到的分类信息中提取记述有该文件的(关于多个区域的)特征的特征量。检索部7使用提取的特征量算出文件间的相似度,检索相似的文件。结果显不部8不出检索结果。图2显示本实施形态的手写文件检索装置的处理的一例。步骤SI中,获取部I获取用作查询对象的手写文件(手写笔画列)。步骤S2中,分类部2对于该获取的手写文件提取分类信息(执行分类处理)。步骤S3中,特征提取部5基于该分类处理的结果,对于该获取的手写文件执行特征提取处理。步骤S4中,检索部7根据特征提取部5得到的特征量,执行检索。步骤S5中,结果显示部8显示检索部7得到的检索结果。接着,参照图3说明墨迹数据的数据构造以及笔画数据的数据构造。通常,在规定的时点(例如一定周期),笔画轨迹上的点会被抽样。因此,笔画表现为抽样点的系列。图3 (b)的例中,I个笔画(B卩,I笔)的笔画构造表现为笔移动的平面上的坐标值的集合(点构造),具体来说,I个笔画是含有:显示形成该笔画的点的个数的“点总数”、“开始时刻”、“外接图形”、与点总数相当的个数的“点构造”的排列的构造体。此处,开始时刻表示该笔画中笔接触到输入面开始书写的时刻。外接图形表示文件平面上对于该笔画轨迹的外接图形(优选为文件平面上内包该笔画的最小面积的矩形)。点的构造可依存于输入设备得到。图3 (C)的例中,I点的构造是具有该抽样点的坐标值X、y、笔压以及距初期点(例如上述的“开始时刻”)的时间差这4个值的构造体。另外,坐标为文件平面的坐标系,可通过左上角为原点、越往右下角值越大的正值来表现。此外,输入设备无法获取笔压或者即使可以获取笔压但之后的处理不使用笔压时,可以省去图3 (c)的笔压或在笔压处标记显示无效的数据。另外,图3 (b)、(c)的例中,可在笔画构造的各个点构造区域记载坐标值x,y等的实际数据,或者也可将笔画构造的数据与点构造的数据分别管理,在笔画构造中各个点构造的区域记载对应的点构造的链接信息。图4显示的是获取的笔画例。此处,以笔画内的样本点的抽样周期固定的情况为例进行说明。图4 (a)显示抽样出的点的坐标,图4 (b)将时间连续的点构造线性插补并显示。抽样点的坐标间隔不同是由于笔速的差异。抽样点数可因各个笔画而异。图3 (a)的例中,墨迹数据的数据构造,是包含有显示该文件全部区域所含笔画构造个数的“笔画总数”、与笔画总数相当的个数的“笔画构造”的排列的构造体。另外,图3 (a)、(b)的例中,墨迹数据构造中的各个笔画构造的区域,既可以记载图3 (b)的数据,或者也可以将墨迹数据构造的数据与图3 (b)的笔画的数据构造分别管理,在墨迹数据构造中的各个笔画的数据构造区域记载对于对应的图3 (b)的数据的链接信息。用户使用输入设备书写的笔画数据,通过例如图3所示的墨迹数据构造在存储器上展开。墨迹数据例如作为文件保存等情况下,作为墨迹数据DBll存储。另外,存储多个文件时,可将用于识别这些文件的文件ID与各墨迹数据对应保存。此外,为了识别各个笔画,也可对各笔画构造付与笔画ID。接着,说明分类部2。分类部2,是对于存储的一个手写文件(墨迹数据),根据文件平面上的笔画位置关系和属性本文档来自技高网...

【技术保护点】
一种手写文件检索装置,其特征在于,具备:获取包含笔迹数据的手写文件的获取部;将所述手写文件分类为多个区域的分类部;根据所述分类结果,提取示出所述区域的特征的特征量的特征提取部;以及根据所述特征量执行检索的检索部。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:柴田智行登内洋次郎井本和范山内康晋
申请(专利权)人:株式会社东芝
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1