当前位置: 首页 > 专利查询>贾新志专利>正文

一种文献主题内容分析的图形化显示方法技术

技术编号:12836106 阅读:48 留言:0更新日期:2016-02-11 00:15
本发明专利技术提供了一种文献主题内容分析的图形化显示方法,包括确定用于进行文献主题内容分析的统计项目,还包括:对各统计项目进行规范化处理;根据规范化后的各统计项目从文献中提取出统计结果;从各统计项目中提取出标识项目建立坐标系;将统计结果以标示图的形式显示在坐标系中。通过本发明专利技术实现的文献主题内容分析的图形化显示,用户可以更加直观的看到一组文献中各个统计项目在各个时间出现次数的分布,避免了目前的分析结果只显示总次数的不足;用户可以选择对一组文献中各个统计项目进行规范化处理并分类,选择某一个分类下的各个统计项目进行比较,也可以单独只选择一个具体的统计项目进行查看,并可查看每一个节点的文献列表,便于用户分析。

【技术实现步骤摘要】

本专利技术涉及文献主题内容分析
,特别是指。
技术介绍
对一组文献(包括图书、期刊、新闻报道等)内在主题内容的分析,目前通用的方法是对文献的标题、作者、摘要以及正文等信息进行采集,把与统计项目(比如,文献量、作者数、词汇数等)有关的各项数据从文献中提取出来,然后将各统计项目的统计结果显示出来(比如,含有某个词汇的文献数量),但是如果用户需要进一步的了解某统计项目在各个年份或各个领域中出现的数量(比如,含有某个词汇的文献的按年份分布情况),或者需要更进一步的看到某统计项目在各个年份或各个领域中出现的数量并进行对比,则不能实现。
技术实现思路
本专利技术要解决问题是:现有的文献主题内容分析方式统计信息有限,显示不够直观、全面,不能够满足用户的需求。本专利技术的技术方案是这样实现的:,包括确定用于进行文献主题内容分析的统计项目,还包括如下步骤:步骤1:对各统计项目进行规范化处理;步骤2:根据规范化后的各统计项目从文献中提取出统计结果;步骤3:从各统计项目中提取出标识项目建立坐标系;步骤4:将所述统计结果以标示图的形式显示在所述坐标系中。在优选的方案中,所述对各统计项目进行规范化处理包括对各统计项目涉及的词汇进行规范化处理:将文献中表示同一事物的词汇进行统一。在优选的方案中,步骤1还包括:将规范化处理后的词汇进行分类并以树形图的形式列出各规范化处理后的词汇;步骤2还包括:以用户选择的规范化处理后的词汇作为关键词并且根据用户选择的统计项目从文献中提取出所述统计结果。在优选的方案中,步骤3中建立的坐标系为二维坐标系;步骤3还包括:从下列属性中选择出两项属性作为坐标属性:出现的次数、出现时的时间、以及所属的分类;步骤4还包括:根据所选择的统计项目的坐标属性值将所选择的统计项目的统计结果以小圆点的形式显示在所述二维坐标系中。在优选的方案中,步骤3中建立的坐标系为三维坐标系。在优选的方案中,当用户鼠标移动到所述二维坐标系中的某个小圆点上时,显示所述小圆点对应的统计结果的详细信息。本专利技术的有益效果如下:通过上述技术方案能够实现文献主题内容分析的图形化显示,首先,用户可以更加直观的看到一组文献中各个统计项目在各个时间出现次数的分布,避免了目前的分析结果只显示总次数的不足(若只显示总次数,则用户无法判断某统计项目在统计组文献中是在何时间段出现的,影响用户对该统计项目的趋势判断);其次,用户可以选择对一组文献中各个统计项目进行规范化处理并分类,用户可以选择某一个分类下的各个统计项目进行比较,也可以单独只选择一个具体的统计项目进行查看,并可查看每一个节点的文献列表,便于用户分析。【附图说明】为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例文献主题内容分析的图形化显示方法的流程图;图2为基于本实施例图形化显示方法从词汇列表中选择主题词界面的示意图;图3为基于本实施例图形化显示方法对一组文献分析、分类后以词汇数作为统计项目的统计结果显示图;图4为对图3中一项统计结果的详细信息显示示意图。【具体实施方式】下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示本专利技术实施例文献主题内容分析的图形化显示方法的流程图;该图形化显示方法包括:步骤1:对各统计项目进行规范化处理。其中,预先确定了用于进行文献主题内容分析的统计项目,对各统计项目进行规范化处理包括对各统计项目涉及的词汇进行规范化处理:将文献中表示同一事物的词汇进行统一。比如,统计项目中涉及词汇:番茄(Tomato),别名西红柿、洋柿子等,则此步骤中将从文献中提取出来的番茄、西红柿、洋柿子等全部规范为番茄,还可以再进一步对番茄进行归类,比如番茄属于食用蔬果类等。步骤2:根据规范化后的各统计项目从文献中提取出统计结果。具体包括:对用户需要分析的一组文献,从文献中的标题、摘要或全文信息等中,把统计项目所需要的各项数据提取出来;比如,对这一组文献中出现番茄的次数,以及每次出现时在文献中位置、文献发表或公示的时间等统计项目进行采集,以便根据用户的需求,对文献主旨内容的分析结果进行图形化显示。步骤3:从各统计项目中提取出标识项目建立坐标系;步骤4:将所述统计结果以标示图的形式显示在所述坐标系中。上述技术方案的关键技术点在于对一组文献进行内在内容分析时,将提取出来的各统计项目进行规范化处理和分类,提取时详细的记录下来各统计项目出现的时间、位置、次数以及所在的分类,并可根据用户的需求,选取各统计项目(文献量、作者数、词汇数、各词汇出现的时间、次数或所在的分类等)的部分信息(比如,各词汇出现的时间、次数或所在的分类等)作为坐标系的数值,进行图形化显示(二维图或三维表或其他图)。因此,对文献主题内容的分析,其各统计项目的分析结果不但只显示一个总的数量(比如,某作者发表文献的总数),对各统计项目在各个时间点或分类里出现的次数,也可分别显示,也可查看某节点的文献列表。图2为从词汇列表中选择主题词界面的示意图,由此可见:步骤1还可以包括:将规范化处理后的词汇进行分类并以图2所示树形图的形式列出各规范化处理后的词汇;用户可以选择规范化处理后的词汇作为关键词,并选择待显示的统计项目。步骤2还可以包括:以用户选择的规范化处理后的词汇作为关键词(主题词)并且根用户据选择的统计项目从文献中提取出统计结果。针对统计结果,可以以出现的次数或出现时的时间或所属的分类等信息作为进行度量和分类的坐标轴:垂直轴(也称数值轴或1轴)和水平轴(也称分类轴或X轴),三维图还有第三个坐标轴,即竖坐标轴(也称系列轴或z轴),以便能够根据图表的深度绘制数据,从而对分析结果进行图形化显示。当所建立的坐标系为二维坐标系时,步骤3还包括:从下列属性中选择出两项属性作为坐标属性:出现的次数、出现时的时间、以及所属的分类等;步骤4还包括:根据所选择的统计项目的坐标属性值将所选择的统计项目的统计结果以小圆点的形式显示在所述二维坐标系中。图3为对一组文献分析、分类后以词汇数作为统计项目的统计结果显示图。如图3所示,垂直轴为词汇出现的次数,水平轴为词汇出现时的时间,表示统计结果的小圆点通过线段连接。图4为一项统计结果的详细信息显示示意图。当用户鼠标移动到所述二维坐标系中的某个小圆点上时,显示所述小圆点对应的统计结果的详细信息。以上所述仅为本专利技术的较佳实施例而已,并不用以限制本专利技术,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。【主权项】1.,包括确定用于进行文献主题内容分析的统计项目,其特征在于,还包括如下步骤: 步骤1:对各统计项目进行规范化处理; 步骤2:根据规范化后的各统计项目从文献中提取出统计结果; 步骤3:从各统计项目中提取出标识项目建立坐标系本文档来自技高网...

【技术保护点】
一种文献主题内容分析的图形化显示方法,包括确定用于进行文献主题内容分析的统计项目,其特征在于,还包括如下步骤:步骤1:对各统计项目进行规范化处理;步骤2:根据规范化后的各统计项目从文献中提取出统计结果;步骤3:从各统计项目中提取出标识项目建立坐标系;步骤4:将所述统计结果以标示图的形式显示在所述坐标系中。

【技术特征摘要】

【专利技术属性】
技术研发人员:贾新志
申请(专利权)人:贾新志
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1