【技术实现步骤摘要】
数据库制作装置以及检索系统
本专利技术涉及制作检索用的数据库的数据库制作装置等。
技术介绍
以往,作为数据库制作装置,已知有专利文献1(日本特开2011-48527号公报)所记载的数据库制作装置。在该数据库制作装置中,从日语的文本信息提取感性表现,使用制作完成的感性表现数据库,将感性信息和检索对象建立关联,由此来制作检索对象数据库。另外,作为数据库制作装置,已知有专利文献2(日本特开2010-272075号公报)所记载的数据库制作装置。在该数据库制作装置中,根据日语的文本信息,使用感性表现辞典以及感性表现提取规则提取感性表现,并使用感性向量辞典,针对每个检索对象生成感性信息,由此制作检索对象数据库。
技术实现思路
根据上述专利文献1以及专利文献2的数据库制作装置,只是根据日语的文本信息制作数据库,数据收集范围受到制约,因而存在数据库的有用性低的问题。其结果,检索数据库时的检索结果的有用性也下降。本专利技术是为了解决上述课题而完成的,其目的在于提供一种能够在提高有用性的同时制作数据库的数据库制作装置等。用于解决课题的手段为了实现上述目的,本专利技术的数据库制作装置的特征在于,具备:文本信息获取单元,通过对由规定媒介公开的公开信息实施规定的滤波处理,获取包含规定的第1语言作为文本的第1语言文本信息、以及包含规定的第1语言以外的一个以上的第2语言作为文本的第2语言文本信息作为与规定领域关联的文本信息;翻译文本信息制作单元,通过利用规定翻译方法将第2语言文本信息翻译成规定的 ...
【技术保护点】
1.一种数据库制作装置,其特征在于,具备:/n文本信息获取单元,其通过对由规定媒介公开的公开信息实施规定的滤波处理,获取包含规定的第1语言作为文本的第1语言文本信息、以及包含所述规定的第1语言以外的一个以上的第2语言作为文本的第2语言文本信息作为与规定领域关联的文本信息;/n翻译文本信息制作单元,其通过利用规定翻译方法将所述第2语言文本信息翻译成所述规定的第1语言来制作翻译文本信息;/n混合文本信息制作单元,其通过将所述翻译文本信息作为所述第1语言文本信息的一部分与所述第1语言文本信息组合来制作混合文本信息;以及,/n数据库制作单元,其在执行了从所述混合文本信息中提取感性信息的提取处理以及从所述混合文本信息中去除构成噪声的噪声信息的噪声去除处理之后,通过将所述感性信息与去除了所述噪声信息的所述混合文本信息建立关联,来制作检索用的数据库。/n
【技术特征摘要】
20180828 JP 2018-1593811.一种数据库制作装置,其特征在于,具备:
文本信息获取单元,其通过对由规定媒介公开的公开信息实施规定的滤波处理,获取包含规定的第1语言作为文本的第1语言文本信息、以及包含所述规定的第1语言以外的一个以上的第2语言作为文本的第2语言文本信息作为与规定领域关联的文本信息;
翻译文本信息制作单元,其通过利用规定翻译方法将所述第2语言文本信息翻译成所述规定的第1语言来制作翻译文本信息;
混合文本信息制作单元,其通过将所述翻译文本信息作为所述第1语言文本信息的一部分与所述第1语言文本信息组合来制作混合文本信息;以及,
数据库制作单元,其在执行了从所述混合文本信息中提取感性信息的提取处理以及从所述混合文本信息中去除构成噪声的噪声信息的噪声去除处理之后,通过将所述感性信息与去除了所述噪声信息的所述混合文本信息建立关联,来制作检索用的数据库。
2.根据权利要求1所述的数据库制作装置,其特征在于,
在所述噪声去除处理中,在所述混合文本信息中包含与所述规定领域关联的规定名词的情况下,连接在所述规定名词之后的词性是主格、宾格以及所有格的任一格助词以外的情况时,将包含所述规定名词的所述混合文本信息作为所述噪声信息将其去除。
3.一种检索系统,其特征在于,具备:
权利要求1所述的数据库制作装置;
存储所述数据库的数据库存储单元;
检索单元,其基于与所述规定领域关联的规定关键词检索存储在所述数据库存储单元中的所述数据库;
区分单元,其将所述检索单元的检索结果中的感性信息区分为多个分类的感性信息;以及,
显示单元,其将所述多个分类的感性信息以互不相同的颜色进行颜色区分来显示。
4.一种检索系统,其特征在于,具备:
权利要求1所述的数据库制作装置;
存储所述数据库的数据库存储单元;
检索单元,其基于与所述规定领域关联的规定关键词检索存储在所述数据库存储单元中的所述数据库;
区分单元,其将所述...
【专利技术属性】
技术研发人员:坂本大辅,
申请(专利权)人:本田技研工业株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。