文本挖掘支援方法及装置制造方法及图纸

技术编号:19122081 阅读:47 留言:0更新日期:2018-10-10 05:12
一种文本挖掘支援方法及装置,当显示表示对应分析的结果的散布图时,显示包含散布图与表示散布图的看法的启示的支援画面。当显示与单词及变数相关的散布图时,从不含启示的基本画面、含有原点附近的单词的判断方法作为启示的第1支援画面、含有对变数赋予特征的单词的关联度的判断方法作为启示的第2支援画面、含有单词彼此的类似度的判断方法作为启示的第3支援画面、及含有变数彼此的类似度的判断方法作为启示的第4支援画面中,显示利用者所指示的画面。由此,可有效率地进行从表示对应分析的结果的图表中引导出见解的处理。

【技术实现步骤摘要】
文本挖掘支援方法及装置
本专利技术涉及一种数据挖掘技术,尤其涉及一种支援文本挖掘(textmining)的执行的文本挖掘支援方法及装置。
技术介绍
近年来,针对大量的数据应用统计学或模式识别等数据分析技术,并从大量的数据中引导出见解(数据中所显现的规则等)的数据挖掘技术正受到瞩目。将文本数据作为对象的数据挖掘被称为文本挖掘。以下,考虑针对文本数据,进行作为数据分析技术的一种的对应分析(correspondenceanalysis)的情况。在对应分析中,针对复合表(crosstabulationtable),进行以表头项目与表侧项目之间的关联变成最大的方式重新排列各项目的处理。进行对应分析的结果通常使用散布图(二维图表)来表现。例如,若对图2中所示的复合表进行对应分析,则可获得图3中所示的散布图。在与本申请专利技术相关联的日本专利特开2005-44087号公报中,记载有一种对利用者提示使用多个分析工具时的分析流程的文本挖掘系统。若使用所述文献中所记载的系统,则即便是与文本挖掘相关的知识或经验少的利用者,也能够以适宜的顺序使用多个分析工具进行分析。
技术实现思路
[专利技术所要解决的问题]在对应分析中,与求出散布图相比,对所求出的散布图进行考察,并引导出见解更重要。但是,与文本挖掘相关的知识或经验少的利用者不懂散布图的看法,因此即便观看散布图,也不懂首先进行什么才好。因此,知识或经验少的利用者无法有效率地进行从散布图中引导出见解的处理。专利文献1中所记载的系统虽然对利用者提示分析流程,但并不支援从分析结果中引导出见解的处理。因此,即便使用专利文献1中所记载的系统,也无法解决所述课题。因此,本专利技术的目的在于提供一种用以有效率地进行从表示对应分析的结果的图表中引导出见解的处理的文本挖掘支援方法及装置。[解决问题的技术手段]为了达成所述目的,本专利技术具有以下的特征。本专利技术的第1实施例是一种文本挖掘支援方法,其显示由对应分析所得的分析结果,其包括输入所述分析结果的步骤;输入来自利用者的指示的步骤;生成包含表示所述分析结果的图表的画面的画面数据的步骤;以及根据所述画面数据,显示画面的步骤;且所述生成画面数据的步骤对应于所述指示,生成包含所述图表与表示所述图表的看法的启示(hint)的支援画面的画面数据。本专利技术的第2实施例是在本专利技术的第1实施例中,所述生成画面数据的步骤生成从多个支援画面与包含所述图表且不含所述启示的基本画面之中,对应于所述指示所选择的画面的画面数据。本专利技术的第3实施例是在本专利技术的第2实施例中,在所述输入分析结果的步骤中,输入将第1项目与第2项目建立对应的结果,即包含所述第1项目的第1成分及第2成分与所述第2项目的第1成分及第2成分的结果作为所述分析结果,所述生成画面数据的步骤制作在将所述第1成分作为横轴,将所述第2成分作为纵轴的平面内对所述第1项目与所述第2项目进行绘图而成的散布图作为所述图表。本专利技术的第4实施例是在本专利技术的第3实施例中,所述多个支援画面包括第1支援画面,所述第1支援画面含有在散布图内原点附近的第1项目不具有显著的特征的意思作为所述启示。本专利技术的第5实施例是在本专利技术的第4实施例中,在所述第1支援画面中所含有的散布图中图示有原点附近的范围。本专利技术的第6实施例是在本专利技术的第3实施例中,所述多个支援画面包括第2支援画面,所述第2支援画面含有在散布图内位于从原点向第2项目离去的方向上的第1项目对所述第2项目赋予特征的意思作为所述启示。本专利技术的第7实施例是在本专利技术的第6实施例中,在所述第2支援画面中所含有的散布图中图示有从原点向所选择的第2项目离去的方向的范围。本专利技术的第8实施例是在本专利技术的第3实施例中,所述多个支援画面包括第3支援画面,所述第3支援画面含有在散布图内距离近的第1项目彼此的类似度高的意思作为所述启示。本专利技术的第9实施例是在本专利技术的第8实施例中,在所述第3支援画面中所含有的散布图中图示有所选择的第1项目附近的范围。本专利技术的第10实施例是在本专利技术的第3实施例中,所述多个支援画面包括第4支援画面,所述第4支援画面含有在散布图内距离近的第2项目彼此的类似度高的意思作为所述启示。本专利技术的第11实施例是在本专利技术的第10实施例中,在所述第4支援画面中所含有的散布图中图示有表示与所选择的第2项目的距离最近的第2项目的符号。本专利技术的第12实施例是在本专利技术的第3实施例中,在所述输入分析结果的步骤中,输入对将单词作为所述第1项目,将文章的部分作为所述第2项目,将文章的各部分中的各单词的出现频率作为表内数据的复合表进行对应分析的结果作为所述分析结果。本专利技术的第13实施例是一种文本挖掘支援装置,其显示由对应分析所得的分析结果,其包括分析结果输入部,用以输入所述分析结果;指示输入部,用以输入来自利用者的指示;画面生成部,生成包含表示所述分析结果的图表的画面的画面数据;以及分析结果显示部,根据所述画面数据,显示画面;且所述画面生成部对应于所述指示,生成包含所述图表与表示所述图表的看法的启示的支援画面的画面数据。本专利技术的第14实施例是在本专利技术的第13实施例中,所述画面生成部生成从多个支援画面与包含所述图表且不含所述启示的基本画面之中,对应于所述指示所选择的画面的画面数据。本专利技术的第15实施例是在本专利技术的第14实施例中,在所述分析结果输入部中,输入将第1项目与第2项目建立对应的结果,即包含所述第1项目的第1成分及第2成分与所述第2项目的第1成分及第2成分的结果作为所述分析结果,所述画面生成部制作在将所述第1成分作为横轴,将所述第2成分作为纵轴的平面内对所述第1项目与所述第2项目进行绘图而成的散布图作为所述图表。本专利技术的第16实施例是在本专利技术的第15实施例中,在所述分析结果输入部中,输入对将单词作为所述第1项目,将文章的部分作为所述第2项目,将文章的各部分中的各单词的出现频率作为表内数据的复合表进行对应分析的结果作为所述分析结果。[专利技术的效果]根据所述第1实施例或第13实施例,利用者可使用包含表示对应分析的结果的图表与表示图表的看法的启示的支援画面,有效率地进行从表示对应分析的结果的图表中引导出见解的处理。根据所述第2实施例或第14实施例,通过选择性地显示包含启示的支援画面与不含启示的基本画面,可显示对应于利用者的水平的画面。另外,通过选择性地显示多个支援画面,可对利用者提示多种图表的看法。根据所述第3实施例或第15实施例,利用者可有效率地进行从表示与第1项目及第2项目相关的对应分析的结果的散布图中引导出见解的处理。根据所述第4实施例,利用者可使用在散布图内原点附近的第1项目不具有显著的特征这一知识,有效率地进行从表示对应分析的结果的图表中引导出见解的处理。根据所述第5实施例,利用者可观看所图示的范围,而容易地知道不具有显著的特征的第1项目。根据所述第6实施例,利用者可使用在散布图内位于从原点向第2项目离去的方向上的第1项目对所述第2项目赋予特征这-知识,有效率地进行从表示对应分析的结果的图表中引导出见解的处理。根据所述第7实施例,利用者可观看所图示的范围,而容易地知道对所选择的第2项目赋予特征的第1项目。根据所述第8实施例,利用者可使用在散布图内距离近的第1项目彼此的类似度高这一知识,有效率地进行从表示对应分析的结本文档来自技高网...
文本挖掘支援方法及装置

【技术保护点】
1.一种文本挖掘支援方法,其是显示由对应分析所得的分析结果的文本挖掘支援方法,其特征在于:包括输入所述分析结果的步骤;输入来自利用者的指示的步骤;生成包含表示所述分析结果的图表的画面的画面数据的步骤;以及根据所述画面数据,显示画面的步骤;且所述生成画面数据的步骤对应于所述指示,生成包含所述图表与表示所述图表的看法的启示的支援画面的画面数据。

【技术特征摘要】
2017.03.15 JP 2017-0497281.一种文本挖掘支援方法,其是显示由对应分析所得的分析结果的文本挖掘支援方法,其特征在于:包括输入所述分析结果的步骤;输入来自利用者的指示的步骤;生成包含表示所述分析结果的图表的画面的画面数据的步骤;以及根据所述画面数据,显示画面的步骤;且所述生成画面数据的步骤对应于所述指示,生成包含所述图表与表示所述图表的看法的启示的支援画面的画面数据。2.根据权利要求1所述的文本挖掘支援方法,其特征在于:所述生成画面数据的步骤生成从多个支援画面与包含所述图表且不含所述启示的基本画面之中,对应于所述指示所选择的画面的画面数据。3.根据权利要求2所述的文本挖掘支援方法,其特征在于:在所述输入分析结果的步骤中,输入将第1项目与第2项目建立对应的结果,即包含所述第1项目的第1成分及第2成分与所述第2项目的第1成分及第2成分的结果作为所述分析结果,所述生成画面数据的步骤制作在将所述第1成分作为横轴,将所述第2成分作为纵轴的平面内对所述第1项目与所述第2项目进行绘图而成的散布图作为所述图表。4.根据权利要求3所述的文本挖掘支援方法,其特征在于:所述多个支援画面包括第1支援画面,所述第1支援画面含有在散布图内原点附近的第1项目不具有显著的特征的意思作为所述启示。5.根据权利要求4所述的文本挖掘支援方法,其特征在于:在所述第1支援画面中所含有的散布图中图示有原点附近的范围。6.根据权利要求3所述的文本挖掘支援方法,其特征在于:所述多个支援画面包括第2支援画面,所述第2支援画面含有在散布图内位于从原点向第2项目离去的方向上的第1项目对所述第2项目赋予特征的意思作为所述启示。7.根据权利要求6所述的文本挖掘支援方法,其特征在于:在所述第2支援画面中所含有的散布图中图示有从原点向所选择的第2项目离去的方向的范围。8.根据权利要求3所述的文本挖掘支援方法,其特征在于:所述多个支援画面包括第3支援画面,所述第3支援画面含有在散布图内距离近的第1项目彼此的类似度高的意思作为所述启示。9.根据权利要求8所...

【专利技术属性】
技术研发人员:西川康平
申请(专利权)人:株式会社斯库林集团
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1