一种面向自然语言文本的可视化分析方法技术

技术编号:40028165 阅读:30 留言:0更新日期:2024-01-16 17:49
本发明专利技术公开了一种面向自然语言文本的可视化分析方法,该方法首先针对自然语言文本,进行可视化信息图的文本可视化数据集提取。其次根据文本可视化数据集,进行连续情节合并,得到连续文本可视化数据集。然后根据连续文本可视化数据集,进行面向文本的文本情节可视化展示。最后根据连续文本可视化数据集,进行面向文本的文本角色可视化展示。本发明专利技术使得快速浏览这一功能可以使用自动化的方式实现,并且也传承了其他信息的自动化抽取,为可视化提供了完整丰富的原料,可以帮助用户更容易的探索发现,更容易理解情节。

【技术实现步骤摘要】

本专利技术涉及自然语言处理领域,特别是涉及一种面向自然语言文本的可视化分析方法


技术介绍

1、对文学作品的研究和对其情节、人物和其他信息实体的分析在文学科学中是一项复杂而耗时的任务。文学的数字化和电子书的激增为这些任务提供了新的舞台和机会,为了支持对这些文本的可视分析,经常会利用计算语言学领域的方法,可以自动从数字化小说中提取实体及实体间关系。然而,这些方法有其局限性,特别是当应用于叙事文本时,这种文本通常不遵循共同的模式,而是有各种形式,因此对文学作品进行可视化表现可以通过提供视觉线索来表现不同模式的信息,从而解决这些限制,让文学学者更好地发现探索信息。此外,还可以通过交互让用户根据自己的需要控制和调整提取和可视化方法。

2、在当前针对非结构化文本的信息自动抽取领域中,依然没有一套完全成熟的方法可供使用,但已经出现许多的自动化技术。针对文本预处理和分析的词汇和句法任务现有方法为:palmer提出的通过收集语言词汇表的方式分割句子的方法,使用了三种不同神经网络架构的多语言系统;vijayarani提出的通过分解词元的方式的文本标记化的方法;以本文档来自技高网...

【技术保护点】

1.一种面向自然语言文本的可视化分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的面向自然语言文本的可视化分析方法,其特征在于,步骤1具体过程为:

3.根据权利要求2所述的面向自然语言文本的可视化分析方法,其特征在于,所述元数据包括时间、人物和地理。

4.根据权利要求3所述的面向自然语言文本的可视化分析方法,其特征在于,所述自然语言文本任务设置的模板对元数据进行处理具体过程为:将元数据按照情节位置进行分割,然后对不同角色在各自情节上的元数据进行合并,最终按照模板得到角色时间地理分布数据集。

5.根据权利要求4所述的面向自然语言文...

【技术特征摘要】

1.一种面向自然语言文本的可视化分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的面向自然语言文本的可视化分析方法,其特征在于,步骤1具体过程为:

3.根据权利要求2所述的面向自然语言文本的可视化分析方法,其特征在于,所述元数据包括时间、人物和地理。

4.根据权利要求3所述的面向自然语言文本的可视化分析方法,其特征在于,所述自然语言文本任务设置的模板对元数据进行处理具体过程为:将元数据按照情节位置进行分割,然后对不同角色在各自情节上的元数据进行合并,最终按照模板得到角色时间地理分布数据集。

5.根据权利要求4所述的面向自然语言文本的可视化分析方法,其特征在于,步骤2具体过程如下:

6.根据权利要求5所述的面向自然语言文本的可视化分析方法,其特征在于,步骤2.1所述连续性指数为:情节的连续性指数通过线性时间差...

【专利技术属性】
技术研发人员:吴向阳何鸿杰
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1