【技术实现步骤摘要】
本专利技术涉及自然语言处理领域,特别是涉及一种面向自然语言文本的可视化分析方法。
技术介绍
1、对文学作品的研究和对其情节、人物和其他信息实体的分析在文学科学中是一项复杂而耗时的任务。文学的数字化和电子书的激增为这些任务提供了新的舞台和机会,为了支持对这些文本的可视分析,经常会利用计算语言学领域的方法,可以自动从数字化小说中提取实体及实体间关系。然而,这些方法有其局限性,特别是当应用于叙事文本时,这种文本通常不遵循共同的模式,而是有各种形式,因此对文学作品进行可视化表现可以通过提供视觉线索来表现不同模式的信息,从而解决这些限制,让文学学者更好地发现探索信息。此外,还可以通过交互让用户根据自己的需要控制和调整提取和可视化方法。
2、在当前针对非结构化文本的信息自动抽取领域中,依然没有一套完全成熟的方法可供使用,但已经出现许多的自动化技术。针对文本预处理和分析的词汇和句法任务现有方法为:palmer提出的通过收集语言词汇表的方式分割句子的方法,使用了三种不同神经网络架构的多语言系统;vijayarani提出的通过分解词元的方式的
...【技术保护点】
1.一种面向自然语言文本的可视化分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的面向自然语言文本的可视化分析方法,其特征在于,步骤1具体过程为:
3.根据权利要求2所述的面向自然语言文本的可视化分析方法,其特征在于,所述元数据包括时间、人物和地理。
4.根据权利要求3所述的面向自然语言文本的可视化分析方法,其特征在于,所述自然语言文本任务设置的模板对元数据进行处理具体过程为:将元数据按照情节位置进行分割,然后对不同角色在各自情节上的元数据进行合并,最终按照模板得到角色时间地理分布数据集。
5.根据权利要求4
...【技术特征摘要】
1.一种面向自然语言文本的可视化分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的面向自然语言文本的可视化分析方法,其特征在于,步骤1具体过程为:
3.根据权利要求2所述的面向自然语言文本的可视化分析方法,其特征在于,所述元数据包括时间、人物和地理。
4.根据权利要求3所述的面向自然语言文本的可视化分析方法,其特征在于,所述自然语言文本任务设置的模板对元数据进行处理具体过程为:将元数据按照情节位置进行分割,然后对不同角色在各自情节上的元数据进行合并,最终按照模板得到角色时间地理分布数据集。
5.根据权利要求4所述的面向自然语言文本的可视化分析方法,其特征在于,步骤2具体过程如下:
6.根据权利要求5所述的面向自然语言文本的可视化分析方法,其特征在于,步骤2.1所述连续性指数为:情节的连续性指数通过线性时间差...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。