出版物范围可视化及分析制造技术

技术编号:15448302 阅读:71 留言:0更新日期:2017-05-29 23:01
系统生成了表示针对一个或更多个出版物的出版物数据的可视化。该可视化表示出信息以支持消费者决策,从而进行阅读、提交或与出版物的其他交互。该可视化还可以辅助出版商或其他策划者与改造出版物的内容相关的决策。在一些情况下,出版物数据可以从出版物或其他相关出版物的内容的语义分析中获得。

Visualization and analysis of publication scope

The system generates visualizations that represent publication data for one or more publications. The visualization represents information to support consumer decision-making, and thus to read, submit, or interact with publications. The visualization can also assist publishers or other planners to make decisions related to the content of the publications. In some cases, publication data can be obtained from semantic analysis of publications or other related publications.

【技术实现步骤摘要】
【国外来华专利技术】出版物范围可视化及分析与相关申请的交叉引用本申请要求2014年3月20日提交的临时专利申请系列号为61/968,101的优先权,该申请的内容以引用方式并入本文。
本公开涉及可视化地表示出版物信息。本公开还涉及根据历史出版数据来生成出版物信息。
技术介绍
每年有许多新的期刊着手出版,同时现有的学术类和科技类期刊大幅地提高它们的发行量。现有期刊的出版焦点会改变并适应于反应它们领域或焦点领域的变化。期刊可以更新它们所陈述的焦点的文本解释(对于出版物而言,通常被称为“目标和范围”),如同已出版的内容所反应的那样,以便反应出版焦点中的变化。试图理解期刊的主题和要求,以便出版、发表、购买和阅读的研究人员、图书管理员、管理员、期刊编者和出版商可以使用这些文本解读。附图说明图1示出了针对出版物的示例性指纹表示。图2示出了示例性矢量可视化。图3示出了示例性棱镜可视化。图4示出了浏览器可视化的示例性状态。图5示出了在出版物节点上的示例性扩展操作。图6示出了出版物所发表的项目显示依据类型的百分比的可视化示例。图7示出了在基本出版物或成组出版物内显示术语的出现频率的可视化示例。图8示出了显示开放访问的等级的可视化示例。图9示出了将出版物的度量值与测算的出版物和与出版物在相同领域或子领域中进行归类的那些出版物的平均值相比较的可视化示例。图10示出了显示由其他出版物、本领域的其他出版物以及或者匹配关键字或者共享主题的指定出版物所发表的论文的相对数量的可视化示例。图11示出了将在所有出版物中、在出版物领域内以及针对出版物的作者先前发表的论文的平均值进行比较的可视化示例。图12示出了将针对提交出版物与利用出版物进行工作的各个方面的用户评价进行比较的可视化示例。图13示出了针对范围工具(scopetool)的示例性环境。图14示出了针对范围工具的示例性网络环境。图15示出了针对范围工具的示例性具体执行环境。图16示出了示例出版焦点查询逻辑。具体实施方式下面的讨论涉及用于在期刊内和/或其他出版物内表示关于出版物趋势的信息的范围工具。所述范围工具可以基于来自出版物的出版物历史的数据的信息。在一些情况下,范围工具可以使用多个图形表示,以通过结合并生成关于期刊的数据并且将其可视地表示来处理这些问题,从而辅助理解并发现期刊的各方面。范围工具可以表示在包括专用网站的网站上。在一些实施方式中,范围工具可以用作“插件”,从而出版商、学术团体或其他个人或组织可以将其嵌入它们的网站;或者用作应用程序,其可以被下载或本地安装。范围工具为这样的系统,其通过专门的数据表示方法以图形方式来结合各种语义和大数据分析技术,以表示期刊的过去和现在的出版焦点以及期刊的其他特性,从而提供学术和科学期刊的目标和范围的本质上的先进,快速,直观的理解。当范围工具嵌入为插件,或下载为AP时,范围工具将能够与来自网页或其他地方的内容交互,或经由作为API(应用程序编程接口)进行交互。范围工具可以定制或以多种方式打开,从而显示特定的状态。范围工具可以用于使用从多个来源收集并利用多种技术进行处理的数据来表示出版物的焦点,性质和事实。范围工具可以表示多种格式的数据,以满足多个用户配置文件。同时,在提高感兴趣方对于学业、技术和学术期刊的理解的示例使用方面,主要讨论了所表示的技术和架构,这里描述的技术和架构也适用于其他领域,包括小说和非小说文学,在那些领域里向读者说明了出版物的性质和焦点。范围工具也可以用来重新格式化非文本项目。范围工具在各种交互式图形工具中与其他工具相比可以绘制成数据值的组。这些图形工具可以以新的方式来提供关于学业、学术和科学期刊上的信息。这种技术使得信息易于理解,并促进了数据组内信息的发现,这对当前的主要是基于文本的技术而言是不可能的,或者是困难的。在各种实施方式中,范围工具可以将结构化和非结构化数据与来自学业、学术和科学期刊以及其他出版物的内容、抽象的内容和元数据结合在一起。结构化数据通常是由为机器和人类可读格式的期刊、编辑团队、出版商、图书馆、资料库和其他组织,以及通过用户与范围工具、相关的公司和商业服务的交互所产生的数据来提供,相关的公司和商业服务包括:提交和发布时间、接受率、内部业务分析、书签、评价和评论。数据也可以通过监测和分析使用上述源、网站或材料来生成。非结构化数据包括期刊的内容(其包括文章、摘要和其他部分的文本)以及与期刊相关的标题、参考文献和引用文献等。数据包括期刊数据和文章数据两者。期刊数据将期刊描述为实体。文章数据将文章描述为实体。数据采集:在一些情况中,数据可以被机械式地采集。机械数据采集技术包括但不限于:连接至API、FTP或其他下载、日志记录RSS和其他馈入、网页爬虫、以及获得公共和特许资源库。数据还通过网站的使用、读取的材料以及其他用户和消费者行为的分析进行收集。也可以实现来自订阅、馈入、定期下载、或其他来源的自动化数据采集。数据解析与组织:数据可以存储在SQL、noSQL、和/或其他文件系统的数据库中。数据存储格式可以被标准化并解析存储在用于快速检索和分析的分布式文件系统中的数据。数据可以存储成各种格式或结构,包括图形、映射、数组、如同在索引、矩阵和矢量空间中链接的数据。本体和分类:范围工具可以使用手动、软件以及机械生成的、策划的分类/本体、消歧模式、权限控制、停用字(这是从处理前的文本中删除的字)和算法。在生成本体、分类、主题和领域列表中使用的算法根据观察结果所计划的刻意调整、以及用户与算法所嵌入的一个系统和多个系统的交互的分析来“积极地”调节。现有的本体和分类可以包括:PubMedMESH(医学主题词表)、SKOS数据集(简单知识组织系统)、国家航空和航天局的天体物理数据系统(ADS)、教育研究澳大利亚的研究码领域、美国国家环境保护局的分类学集。范围工具可以从文本生成或收集本体和分类。这方面的示例包括:从存档的文章、医疗设备或试剂名单收集关键字、机构名称,医疗设备或试剂名单来自文章和其他类似的组集中提到的供应商、机构。本体质量可使用标准的重复数据删除和同义词检测以及匹配技术来进行调整。数据组:数据组可以例如为系列、映射或收藏、或其他数值组。范围工具将不同的方法结合以从现有数据组中生成新的数据组。提取:数据组可以通过识别在一个或多个其他数据组中的共同特性、性质或值而从其他数据组中提取。提取的数据组可以单独保存或根据涉及的数据量、用于完成的时间和可用的计算能力来实时地生成。映射:可以通过从一个或多个其他数据组以一对一或多对一的关系将特性、性质或值映射至单一组,从而创建数据组。映射的数据组可以单独保存或根据涉及的数据量、用于完成的时间和可用的计算能力来实时地生成。映射可以涉及在原始数据中的值和所得到的数据中的值之间的对应关系的创建。在一些情况下,原始数据值中多个值可以映射成所得到的数据中的单一值。映射可以由机器生成或人工生成。映射允许相同或类似项目的多个列表进行比较、排名、列表或以统一的方式来表示。映射还可以减少针对特定性质的值的数量。例如,在学术领域中的期刊列表、研究人员、文章、会议或其他对象使用不同的主题分类方案。映射函数可用于使这种列表通过将列表中的领域映射到标准化的成组类别来进行比较。映射还可以减少针对特定性质的值的本文档来自技高网...
出版物范围可视化及分析

【技术保护点】
一种方法,其包括:在语义分析电路解析来自第一出版物的内容,以便识别第一术语,所述第一术语指示第一出版物的出版焦点;确定第一术语在内容中出现;响应于所述出版焦点,基于第一术语和出现来生成出版焦点的第一表示;将第一表示存储在表示存储器中;在将第一表示存储在表示存储器中之后,经由通信接口电路来接收针对第一出版物的出版焦点查询;响应于所述出版焦点查询,来生成焦点查询的第二表示;访问表示存储器中的所述第一表示;将第一表示和第二表示进行比较,以便确定第一表示和第二表示之间的重叠;确定第一术语在重叠内;以及生成考虑了所述出现的显示输出。

【技术特征摘要】
【国外来华专利技术】2014.03.20 US 61/968,1011.一种方法,其包括:在语义分析电路解析来自第一出版物的内容,以便识别第一术语,所述第一术语指示第一出版物的出版焦点;确定第一术语在内容中出现;响应于所述出版焦点,基于第一术语和出现来生成出版焦点的第一表示;将第一表示存储在表示存储器中;在将第一表示存储在表示存储器中之后,经由通信接口电路来接收针对第一出版物的出版焦点查询;响应于所述出版焦点查询,来生成焦点查询的第二表示;访问表示存储器中的所述第一表示;将第一表示和第二表示进行比较,以便确定第一表示和第二表示之间的重叠;确定第一术语在重叠内;以及生成考虑了所述出现的显示输出。2.根据权利要求1所述的方法,进一步包括解析来自第一出版物的内容以识别第二术语,所述第二术语不能指示任何出版焦点;以及基于所述第二术语停止生成第三表示。3.根据权利要求1所述的方法,其中,所述第一表示是基于多个术语的,所述多个术语的每一个指示出版焦点。4.根据权利要求1所述的方法,其中,所述显示通过指示所述第一术语在内容中出现的频率来说明所述出现。5.根据权利要求4所述的方法,其中,所述展示进一步通过示出所述第一术语与其他术语一起出现的相关频率来说明所述出现。6.根据权利要求4所述的方法,其中,所述第一术语在内容中出现的频率包括在限定间隔内的频率。7.根据权利要求6所述的方法,进一步包括在第二限定间隔上确定第二术语出现的频率,以便确定针对第一出版物的出版焦点演进。8.根据权利要求1所述的方法,其中,所述出版焦点查询包括出版物主题;以及语义分析电路配置成根据与出版物主题相关联的关键术语来生成第二表示。9.根据权利要求1所述的方法,其中,第一术语指示多个出版焦点。10.根据权利要求1所述的方法,其中,出版焦点查询包括针对类似于选择的出版物的出版物的请求。11.根据权利要求10所述的方法,其中,显示包括在第一出版物和选择的出版物之间的比较。12.根据权利要求1所述的方法,其中,显示包括针对出版物的多个出版焦点的指示。13.根据权利要求12所述的方法,其中,指示包括与多个出版焦点中的各个相关联的内容部分的相关大小的指示。14.根据权利要求1所述的方法,其中,显示包括:指纹可视化、棱镜可视化、浏览器可视化、柱状图、饼图、直方图、或它们的任意组合。15.一种系统,其包括:通信接口电路,其配置成接收针对出版物的出版焦点查询;表示存储器,其配置成存储出版焦点表示;以及...

【专利技术属性】
技术研发人员:B·E·邵R·M·帕里斯K·A·格里尔
申请(专利权)人:易单咨集团有限公司
类型:发明
国别省市:日本,JP

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1