数据处理装置和数据处理方法制造方法及图纸

技术编号:27573574 阅读:10 留言:0更新日期:2021-03-09 22:22
本发明专利技术提供数据处理装置和数据处理方法,能够提高生成数据库时的生成效率和数据库的有用性。数据处理装置(1)以规定的取得条件从由规定媒体公开的信息取得多个文本信息(步骤1),在由用户指定了显示器(1a)所显示的多个文本信息中的至少一部分作为排除关键字时,生成去除了包含排除关键字的文本信息后的噪声去除完成信息(步骤2),对噪声去除完成信息实施规定处理,从而生成数据库(步骤3~4)。从而生成数据库(步骤3~4)。从而生成数据库(步骤3~4)。

【技术实现步骤摘要】
数据处理装置和数据处理方法


[0001]本专利技术涉及执行数据库的生成等的数据处理装置等。

技术介绍

[0002]以往,作为数据处理装置,已知有日本特开2011-48527号公报中记载的数据处理装置。在该数据处理装置中,从日语的文本信息中提取感性表达,使用已生成的感性表达数据库将感性信息和侧面信息与检索对象关联起来,从而生成检索对象数据库。
[0003]接着,当用户输入了作为检索条件的感性表达时,从感性表达数据库中取得与该感性表达对应的感性信息和侧面信息,根据侧面信息从检索对象数据库中检索感性信息,计算从检索对象数据库中检索到的感性信息与从感性表达数据库中取得的感性信息之间的距离。然后,按照距离从近到远的顺序,画面上排列显示检索对象ID等各种信息。

技术实现思路

[0004]根据上述日本特开2011-48527号公报的数据处理装置,只不过是根据日语的文本信息而生成检索对象数据库,由于数据收集范围被制约,因此存在检索对象数据库的有用性低的问题。除此以外,由于没有考虑无利用价值的不需要的信息即噪声,因此可能在包含噪声的状态下生成检索对象数据库,该情况下,检索对象数据库的生成效率降低,并且其有用性进一步降低。
[0005]本专利技术是为了解决上述课题而完成的,其目的在于,提供能够提高生成数据库时的生成效率和数据库的有用性的数据处理装置等。
[0006]用于解决问题的手段
[0007]为了达成上述目的,第1方面的数据处理装置的特征在于,具备:输出接口;输入接口,其由用户进行操作;文本信息取得部,其以规定的取得条件从由规定媒体公开的信息中取得多个文本信息;文本信息显示部,其将多个文本信息显示于输出接口;噪声去除完成信息生成部,其在通过用户对输入接口的操作而将显示于输出接口的多个文本信息的各个文本信息中的至少一部分指定为噪声时,生成噪声去除完成信息,该噪声去除完成信息是从多个文本信息中去除了包含被指定为噪声的部分在内的文本信息后得到的文本信息;以及数据库生成部,其对该噪声去除完成信息实施规定处理,从而生成数据库。
[0008]根据该数据处理装置,以规定的取得条件从由规定媒体公开的信息中取得多个第1文本信息,将多个文本信息显示于输出接口。然后,当通过用户对输入接口的操作将输出接口中显示的多个文本信息中的各文本信息中的至少一部分指定为噪声时,生成噪声去除完成信息,该噪声去除完成信息是从多个文本信息中去除包含被指定为噪声的部分在内的文本信息后得到的文本信息。这样,仅通过用户对输入接口的操作来选择噪声,就能够从多个文本信息容易且适当地去除包含被用户看作噪声的数据的文本信息,能够生成噪声去除完成信息作为其除去结果。
[0009]进而,通过对这样生成的噪声去除完成信息实施规定处理来生成数据库,因此,能
够在排除了用户视为噪声的文本信息的状态下生成数据库。由此,能够提高生成数据库时的生成效率和有用性。
[0010]第2方面的专利技术在第1方面所记载的数据处理装置中,其特征在于,还具备:噪声存储部,其存储噪声;以及噪声显示部,其在通过用户对输入接口的操作而执行了噪声的显示操作时,将噪声存储部中存储的噪声显示于输出接口。
[0011]根据该数据处理装置,当通过用户对输入接口的操作而执行了噪声的显示操作时,将噪声存储部中存储的噪声显示于输出接口,因此,用户能够目视确认用户自己目前为止选择的噪声。由此,能够提高便利性。
[0012]第3方面的专利技术在第1方面或第2方面所记载的数据处理装置中,其特征在于,文本信息取得部从由规定媒体公开的信息中提取感性信息,并且,作为将感性信息与由规定媒体公开的信息关联起来的信息而取得多个文本信息,数据处理装置还具备噪声去除完成信息显示部,该噪声去除完成信息显示部将噪声去除完成信息和与噪声去除完成信息关联的感性信息一起显示于输出接口,数据库生成部的规定处理包含通过用户对输入接口的操作而执行的感性信息修正处理,在该感性信息修正处理中,对显示于输出接口的1个以上的噪声去除完成信息中的感性信息进行修正。
[0013]根据该数据处理装置,从由规定媒体公开的信息中提取感性信息,并且,作为将感性信息与由规定媒体公开的信息关联起来的信息而取得多个文本信息,将噪声去除完成信息与感性信息一起显示于输出接口。而且,在生成数据库时,通过用户对输入接口的操作而执行感性信息修正处理,在该感性信息修正处理中,对显示于输出接口的噪声去除完成信息中的感性信息进行修正,因此,用户能够在目视确认噪声去除完成信息中的感性信息的同时容易地对其进行修正。由此,能够进一步提高生成数据库时的生成效率和有用性。
[0014]第4方面的专利技术在第1~3方面中的任意一个方面所记载的数据处理装置中,其特征在于,还具备标签信息存储部,该标签信息存储部存储由用户定义的标签信息,数据库生成部的规定处理包含关联处理,在该关联处理中,将标签信息存储部中存储的标签信息与噪声去除完成信息关联起来。
[0015]根据该数据处理装置,在生成数据库时,执行将标签信息存储部中存储的标签信息与噪声去除完成信息关联的关联处理,因此,能够根据标签信息来执行数据库的检索等,能够进一步提高数据库的有用性。
[0016]第5方面的专利技术在第1~4方面中的任意一个方面所记载的数据处理装置中,其特征在于,文本信息显示部将根据多个文本信息所包含的信息的意思对多个文本信息进行划分时的包含相同信息、或相同和近似的信息在内的文本信息的集合,按照集合的从大到小的顺序显示于输出接口。
[0017]根据该数据处理装置,根据多个文本信息所包含的信息的意思对多个文本信息进行划分时的包含相同的信息或相同和近似的信息在内的文本信息的集合按照集合的从大到小的顺序被显示于输出接口,因此,用户能够从文本信息的集合大的一方起依次指定噪声。由此,能够从多个文本信息中高效地去除包含噪声的文本信息。由此,能够进一步提高生成数据库时的生成效率。
[0018]第6方面的专利技术在第3方面所记载的数据处理装置中,其特征在于,数据库生成部在将感性信息划分为多个分类的状态下生成数据库,数据处理装置具备感性信息显示部,
该感性信息显示部以彼此不同的色彩将数据库中包含的多个分类的感性信息显示于输出接口。
[0019]根据该数据处理装置,将数据库中包含的多个分类的感性信息以彼此不同的色彩显示于输出接口,因此,用户能够容易地区分并目视确认多个分类的感性信息。
[0020]第7方面的专利技术在第1~6方面中的任意一个方面所记载的数据处理装置中,其特征在于,规定的取得条件是如下的条件:由规定媒体公开的信息包含规定信息,并且不包含可能与规定信息混同的规定的混同信息。
[0021]根据该数据处理装置,以由规定媒体公开的信息包含规定信息、并且不包含可能与规定信息混同的规定的混同信息这样的条件,从由规定媒体公开的信息取得多个文本信息,因此,能够取得多个文本信息作为高精度地包含规定信息的信息。由此,能够更进一步提高生成数据库时的生成效率。
[0022]为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理装置,其特征在于,所述数据处理装置具备:输出接口;输入接口,其由用户进行操作;文本信息取得部,其以规定的取得条件从由规定媒体公开的信息中取得多个文本信息;文本信息显示部,其将该多个文本信息显示于所述输出接口;噪声去除完成信息生成部,其在通过所述用户对所述输入接口的操作而将显示于所述输出接口的所述多个文本信息的各个文本信息中的至少一部分指定为噪声时,生成噪声去除完成信息,该噪声去除完成信息是从所述多个文本信息中去除了包含被指定为该噪声的部分在内的所述文本信息后得到的所述文本信息;以及数据库生成部,其对该噪声去除完成信息实施规定处理,从而生成数据库。2.根据权利要求1所述的数据处理装置,其特征在于,所述数据处理装置还具备:噪声存储部,其存储所述噪声;以及噪声显示部,其在通过所述用户对所述输入接口的操作而执行了所述噪声的显示操作时,将所述噪声存储部中存储的所述噪声显示于所述输出接口。3.根据权利要求1或2所述的数据处理装置,其特征在于,所述文本信息取得部从由所述规定媒体公开的所述信息中提取感性信息,并且作为将该感性信息与由所述规定媒体公开的所述信息关联起来的信息而取得所述多个文本信息,所述数据处理装置还具备噪声去除完成信息显示部,该噪声去除完成信息显示部将所述噪声去除完成信息和与该噪声去除完成信息关联的所述感性信息一起显示于所述输出接口,所述数据库生成部的所述规定处理包含通过所述用户对所述输入接口的操作而执行的感性信息修正处理,在该感性信息修正处理中,对显示于所述输出接口的1个以上的所述噪声去除完成信息中的所述感性信息进行修正。4.根据权利要求1至3中的任意一项所述的数据处理装置,...

【专利技术属性】
技术研发人员:坂本大辅
申请(专利权)人:本田技研工业株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1