信息的语义时间可视化制造技术

技术编号:38683958 阅读:15 留言:0更新日期:2023-09-02 22:56
提出了一种用于在主题区域中生成数字信息数据的计算机实现的方法。该方法包括:

【技术实现步骤摘要】
【国外来华专利技术】信息的语义时间可视化


[0001]本专利技术涉及一种用于在主题区域(subject area)中生成数字信息数据的计算机实现的方法。而且,本专利技术涉及一种用于在主题区域中生成数字信息数据的计算机系统。该方法和计算机系统可用于从研究与开发到产品发布的创新链,诸如在化学
其他应用是可能的。

技术介绍

[0002]许多
中的数字化举措不断识别用户需要,以在经由搜索引擎或网络驱动器访问的一组文档中自动建立因果依存性,以便跨多个文档引导用户快速关注最重要的事实。搜索结果的排名根本不是为该任务而设计。通过语义信息提取所处理并在知识库中表示为语义网络的文档可以完成该任务。然而,知识库建立缓慢且昂贵。对软件代理进行“逻辑理解”的更高级方法仍然处于AI研究的不同阶段,因此存在在廉价的技术实现中对因果依存性进行语用(pragmatic)近似的机会。
[0003]US 2016/0188642 A1公开了一种用于将主文档与一个或多个候选文档组合的计算机实现的方法。该方法包括:提取主文档中所公开的过程步骤,并且提取一个或多个候选文档中所公开的候选过程步骤;构建对应于主文档的主数据结构;其中,主数据结构包括互连节点,并且每个节点对应于主文档中所公开的提取的过程步骤;识别一个或多个候选过程以与主数据结构组合;以及将一个或多个识别的候选过程步骤插入到主数据结构中。
[0004]US 2016/0162486A1公开了一种辅助生成创新的计算机支持的方法。该方法包括以下步骤:从数据库检索属于第一域的多于两个文档的第一集合;从所述数据库检索属于第二域的多于两个文档的第二集合;选择来自所述第一集合的文档与所述第二集合中的所有文档的所有可能组合,并且对于文档的每个组合:确定复合(composite)新颖性(novelty)得分、复合接近性(proximity)得分和复合冲击性(impact)得分;以及基于所有所确定的复合新颖性得分和/或复合接近性得分和/或复合冲击性得分,提供可以辅助生成创新的推荐。
[0005]US 9,799,040 B2公开了一种计算机辅助创新的方法。该方法提供了一种可以自动生成建议的创新机会的方法,其然后可以查看或以其他方式传递给用户并由用户进行分析。本公开提供了一种用于通过选择一个或多个项目(term)来确定创新机会的方法和装置;确定与所选择的元素相关的趋势数据;取决于所述趋势数据确定用于所选择的元素的创新可能性度量;取决于所述创新可能性度量来识别创新机会。
[0006]不管迄今为止的成就,仍然需要增强信息可视化和知识管理,具体地沿着从研究与开发到产品发布的创新链。
[0007]待解决的问题
[0008]因此,希望提供解决上文所提到的技术挑战的方法和设备。具体地,应提供用于经由至少一个处理单元在主题区域中生成数字信息数据的设备和方法,该设备和方法允许增强信息可视化和知识管理。

技术实现思路

[0009]该问题通过用于在主题领域中生成数字信息数据的计算机实现的方法和具有独立权利要求的特征的计算机系统来解决。在从属权利要求中列出了可以以孤立方式或任何任意组合实现的有利实施例。
[0010]在本专利技术的第一方面中,提出了一种用于在主题区域中生成数字信息数据的计算机实现的方法。
[0011]如本文所使用的,术语“计算机实现的”是一个广义的术语,并且应赋予本领域普通技术人员其普通和惯用的含义,而不限于特殊或定制的含义。该术语具体地可以是指但不限于通过使用数据处理装置(诸如包括至少一个处理单元的数据处理装置)来完全或部分地实现的过程。因此,术语“计算机”通常可以是指具有至少一个数据处理装置(诸如至少一个处理单元)的设备的组合或网络。此外,计算机可包括一个或多个另外的组件,诸如数据存储设备、电子接口、或人机接口中的至少一个。
[0012]如本文所使用的,术语“处理单元”是一个广义的术语,并且应赋予本领域普通技术人员其普通和惯用的含义,而不限于特殊或定制的含义。该术语具体地可以是指但不限于被配置用于执行计算机或系统的基本操作的任意逻辑电路,和/或通常是指被配置用于执行计算或逻辑操作的设备。特别地,处理单元可以被配置用于处理驱动计算机或系统的基本指令。作为示例,处理单元可包括至少一个算术逻辑单元(ALU)、至少一个浮点单元(FPU),诸如数学协处理器或数字协处理器,多个寄存器,具体地被配置用于向ALU提供操作数并存储运算结果的寄存器,以及存储器,诸如L1和L2高速缓冲存储器。特别地,处理单元可以是多核处理器。具体地,处理单元可以是或可以包括中央处理单元(CPU)。附加地或者替代地,处理单元可以是或可以包括微处理器,因此具体地,处理单元的元件可以被包含在一个单个集成电路(IC)芯片中。附加地或者替代地,处理单元可以是或可以包括一个或多个专用集成电路(ASIC)和/或一个或多个现场可编程门阵列(FPGA)等。
[0013]如本文所使用的,术语“数据库”是一个广义的术语,并且应赋予本领域普通技术人员其普通和惯用的含义,而不限于特殊或定制的含义。该术语具体地可以是指但不限于信息的任意集合和/或被配置用于存储信息的任意集合的物理结构。数据库可包括被配置用于存储信息的至少一个存储设备。数据库可以是或可以包括选自包括以下各项的组的至少一个元素:至少一个服务器、包括多个服务器的至少一个服务器系统、至少一个云服务器、或云计算基础设施。方法可以使用多个数据库来执行,诸如至少一个文档存储和至少一个知识库,如下文将详细概述的。方法可以使用一个数据库来执行,该数据库被配置用于实现诸如数据存储和知识存储的多个功能。例如,文档存储可以集成到知识库或者可以是外部设备。
[0014]如本文所使用的,术语“存储装置”是一个广义的术语,并且应赋予本领域普通技术人员其普通和惯用的含义,而不限于特殊或定制的含义。该术语具体地可以是指但不限于记录和/或重新训练数据的过程。
[0015]如本文所使用的,术语“主题区域”是一个广义的术语,并且应赋予本领域普通技术人员其普通和惯用的含义,而不限于特殊或定制的含义。该术语具体地可以是指但不限于诸如医学、化学、物理学等知识的分支。
[0016]如本文所使用的,术语“数字信息数据”是一个广义的术语,并且应赋予本领域普
通技术人员其普通和惯用的含义,而不限于特殊或定制的含义。该术语具体地可以是指但不限于任意文本信息的离散的、不连续的表示。数字信息数据可包括以下各项中的一项或多项:科学文档、研究相关文档、开发相关文档、商业相关文档、公司相关文档、法律文档、专利文档、监管文档、操作手册、说明手册、培训材料等。
[0017]计算机实现的方法包括以下步骤,其可以以给定的顺序执行。然而,不同的顺序也可以是可能的。进一步地,可以一次或重复地执行一个或多于一个或甚至所有步骤。进一步地,可以以及时重叠的方式或者甚至并行地执行方法步骤。该方法还可包括未列出的附加方法步骤。
[0018]该方法包括以下步骤:
[0019]‑
在处理单元处提供数字本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于在主题区域中生成数字信息数据的计算机实现的方法,所述方法包括:

在处理单元(110)处,提供数字信息语料库数据;

经由所述处理单元(110),从所述数字信息语料库数据中提取数字信息种子数据;

经由所述处理单元(110),在包括知识信息的至少一个数据库(120)中执行搜索,从而从所述至少一个数据库(120)中提取与所述主题区域相关的多个文本块;其中,所述搜索是基于所述数字信息种子数据来执行的,

经由所述处理单元(110),按时间顺序来索引所述文本块;

经由所述处理单元(110),使用按时间组织的文本块来生成所述数字信息数据。2.根据前述权利要求所述的方法,其中,提取所述数字信息种子数据包括:语义信息提取。3.根据任何前述权利要求所述的方法,还包括:由所述处理单元(110)通过过程属性来过滤所提取的数字信息种子数据。4.根据任何前述权利要求所述的方法,其中,提取所述多个文本块包括:选择用于将来自所述数据库(120)的所述知识信息分解为文本块的部分。5.根据任何前述权利要求所述的方法,还包括:由所述处理单元(110)递归地计算所提取的文本块之间的语义相似性。6.根据任何前述权利要求所述的方法,还包括:针对经索引的文本块中的具有预定时间戳的每一个文本块,选择预定数量的先前文本块,以及通过对所有所述先前文本块中的概念嵌入来聚类嵌入,针对具有所述预定时间戳的所述文本块中的每个概念,在所述数据库(120)中识别候选概念列表。7.根据前述权利要求所述的方法,还包括:使用评估候选概念之间的图关系以及评估具有所述预定时间戳的所述文本块与所有所述先前文本块之间的语义相似性的特征,在所述处理单元(110)处应用在现有的数字信息语料库数据上所训练的排序学习模型。8.根据前述权利要求所述的方法,还包括:用排名前k的候选概念来注释具有所述预定时间戳的所述文本块。9.根据前述权利要求所述的方法,还包括:将具有所述预定时间戳的所述文本块与所述先前文本块中的排名前k的文本块连接,并且用所述排序学习模型的得分对其进行标记。10.根据前述权利要求所述的方法,还包括:重复以下步骤,直到所有文本块被聚类:选择所述先前文本块,识别所述候选概念列表,应用所述排...

【专利技术属性】
技术研发人员:H
申请(专利权)人:巴斯夫欧洲公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1