当前位置: 首页 > 专利查询>浙江大学专利>正文

一种数据故事生成方法技术

技术编号:31378403 阅读:15 留言:0更新日期:2021-12-15 11:19
本发明专利技术公开了一种数据故事生成方法,包括以下步骤:(1)将结构化的原始数据输入分析洞察层,依次对数据进行事件提取、事件分类和事件排序,最后得到多个用户容易理解的事件;(2)将分析洞察层得到的多个事件输入故事模型层中,生成数据故事,所述的故事模型层包含故事元素管理模块、故事主题提取模块、故事模型生成模块以及故事脚本生成模块四个部分;(3)在故事版生成层中,根据数据故事与视觉元素的映射关系,得到数据故事的故事看板,并通过前端UI实现故事看板的可视化表达。本发明专利技术的方法可以广泛应用于数据工具产品中,为非专业人士理解业务数据创造了新途径,增进非专业人士对数据产品的理解与信任。据产品的理解与信任。据产品的理解与信任。

【技术实现步骤摘要】
一种数据故事生成方法


[0001]本专利技术属于数据科学和可视分析
,尤其是涉及一种数据故事生成方法。

技术介绍

[0002]随着数据科学的不断发展,数据带动了越来越多的业务需求,数据的分析与表达成为实际业务中的关键步骤。然而数据分析对于非专业人士有较高的理解成本,不利于数据洞察的表达和传播。
[0003]将数据转化为信息并驱动做出更好决策的关键在于将数据可视化并运用数据讲故事。相比于统计数据,数据故事更易于人们记忆。
[0004]生成数据故事主要涉及两个方面:数据科学和可视分析。数据科学领域已有研究对数据故事化流程中的数据分析与洞察活动提供了理论依据,并为数据故事产品的研发提供了技术条件。同时,可视化方法已成为数据故事化的重要手段之一,信息图、数据标注法、视觉增强方法等可视化方法在数据故事化中的应用已成为相关领域研究的主要关注点之一,如何在可视分析工具中引入故事化功能是相关研究的热点。
[0005]公开号为CN111930997A的中国专利文献公开了一种智能生成故事线可视化的系统和方法,包括:故事线剧本模块,该模块为包含人物及人物间关系的结构化脚本;故事线模板模块,根据用户输入的约束指令生成故事模板;故事线智能生成模块,根据结构化脚本和故事模板生成故事线可视化;故事线画板模块,用于展示和调整故事线可视化。
[0006]公开号为CN106709968A的中国专利文献公开了一种剧本故事信息的数据可视化方法,通过从剧本内容中抽取剧本的基本要素;将所述基本要素中的场景地点以及该场景地点所对应的人物进行匹配处理,得到要素集合;然后根据剧本内容的时间序列对匹配后的要素集合进行排序并依次绘制在二维图像中,对所述场景地点进行面积渲染,并对所述场景地点所对应的人物进行线条渲染,得到剧本可视化图像。
[0007]上述现有的方法虽然都可以实现故事可视化,但是其都只是对文字信息进行故事可视化,无法完成对结构化数据进行故事可视化。

技术实现思路

[0008]本专利技术提供了一种数据故事生成方法,可以广泛应用于将数据分析结果解释给非专业人士的场景,增进非专业人士对数据产品的理解与信任。
[0009]一种数据故事生成方法,包括以下步骤:
[0010](1)以实际的业务需求为驱动,将结构化的原始数据输入分析洞察层,依次对数据进行事件提取、事件分类和事件排序,最后得到多个用户容易理解的事件;
[0011](2)将分析洞察层得到的多个事件输入故事模型层中,生成数据故事;所述的故事模型层包含故事元素管理模块、故事主题提取模块、故事模型生成模块以及故事脚本生成模块四个部分,其中:
[0012]故事元素管理模块将故事元素归纳为需求、人物、情境、情节、冲突和解决方案六
个核心要素,用于辅助其他模块进行逻辑梳理;
[0013]故事主题提取模块中对全量事件进行检索,若有命中主题关键词或关键信息则将该事件加入主题集合中,生成主题列表;而后对主题列表中的事件进行排序,推荐用户最可能感兴趣的N个事件,接着对N个事件进行故事逻辑连接后输入故事模型生成模块;
[0014]故事模型生成模块将事件与事件的连接和排序看作故事发展的不同阶段,生成树状结构的故事模型;生成故事模型后输入故事脚本生成模块;
[0015]故事脚本生成模块用于根据生成的故事模型个性化的选择故事脚本;
[0016](3)在故事版生成层中,根据数据故事与视觉元素的映射关系,得到数据故事的故事看板,并通过前端UI实现故事看板的可视化表达。
[0017]进一步地,步骤(1)中,将事件视为由主题、参数、内容以及评分四个方面构成,其中参数是指该事件的数字化特征,评分是指设计策略对事件进行重要性和影响力评分排序,保证事件的可靠性;主题由用户设置,内容是对该主题下关键问题的事实说明。
[0018]事件的公式为:
[0019]F={theme,parameters,method,score}={t
i
,p
i
,m
i
,s
i
}
[0020]F表示事件的集合,theme表示主题,parameters表示参数,method表示内容,score表示评分,t
i
表示第i个事件的主题,p
i
表示第i个事件的参数,m
i
表示第i个事件的关键内容,s
i
表示第i个事件的评分。
[0021]步骤(2)中,故事模型生成模块的具体工作过程为:
[0022]首先选择一个初始事件作为故事发生的开头,同时也是树状结构的根节点,随机生成其他节点,那么树上的每个节点都是一个事件;
[0023]从根节点开始,根据权重选择最佳的子节点,直到到达一个存在未拓展的子节点,若该子节点不是终止节点,则创建该子节点A的子节点B;
[0024]拓展好了子节点B后对B进行模拟,随机选择子节点B可行的下一步直到结束,将结果计算作为子节点B的权重,模拟过程的中间节点不做记录,用模拟结果更新当前故事序列。
[0025]对于每一个事件节点,都标记了该节点的权重和探索次数,则评估指标记为:
[0026][0027]式中,v

表示当前节点,v表示父节点,Q表示节点的权重值,N表示该节点被探索的次数,c是一个常量用来控制两个加和部分的比例;score计算分为两个过程,左边项表示节点期望收益越好,值越高越值得被选择,右边项表示该节点访问次数越少值越大,越值得被选择。
[0028]所述的故事版生成层分为可视化看版配置模块、数据格式处理模块、页面模块渲染模块以及页面展示数据处理模块四个部分;
[0029]在可视化看版配置模块中,根据数据故事进行图表适配;数据格式处理模块和页面展示数据处理模块共同优化看版中的数据呈现;页面模板渲染模块结合用户的浏览习惯和常见的页面布局方式生成故事版创作。
[0030]在可视化看版配置模块中包含图片、文本、数字、图表等视觉元素,这些元素既是
事件的基本组成,也反应了事件的关系类型。
[0031]页面模板渲染模块包含八种模块布局思路:线性、栅格、网格、层级、序列、多图、图文和面板。
[0032]与现有技术相比,本专利技术具有以下有益效果:
[0033]为实现数据故事的自动化生成,本专利技术提出将数据分析与建模、数据故事建模和故事版叙述三个核心活动搭建在开发框架中。技术框架由数据层、分析洞察层、故事模型层、故事版生成层以及前端UI五个部分组成,构建了将结构化数据生成可视化故事版,并进行创作和表达的数据工具。实现数据故事自动生成的数据工具产品为非专业人士理解业务数据创造了新途径,能够更深刻的影响用户认知,辅助用户进行业务决策,解决实际业务中的关键问题,达到满足业务需求的目的。
附图说明
[0034]图1为本专利技术实施例中一种数据故事生成方法的框架流程图;
[0035本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据故事生成方法,其特征在于,包括以下步骤:(1)以实际的业务需求为驱动,将结构化的原始数据输入分析洞察层,依次对数据进行事件提取、事件分类和事件排序,最后得到多个用户容易理解的事件;(2)将分析洞察层得到的多个事件输入故事模型层中,生成数据故事;所述的故事模型层包含故事元素管理模块、故事主题提取模块、故事模型生成模块以及故事脚本生成模块四个部分,其中:故事元素管理模块将故事元素归纳为需求、人物、情境、情节、冲突和解决方案六个核心要素,用于辅助其他模块进行逻辑梳理;故事主题提取模块中对全量事件进行检索,若有命中主题关键词或关键信息则将该事件加入主题集合中,生成主题列表;而后对主题列表中的事件进行排序,推荐用户最可能感兴趣的N个事件,接着对N个事件进行故事逻辑连接后输入故事模型生成模块;故事模型生成模块将事件与事件的连接和排序看作故事发展的不同阶段,生成树状结构的故事模型;生成故事模型后输入故事脚本生成模块;故事脚本生成模块用于根据生成的故事模型个性化的选择故事脚本;(3)在故事版生成层中,根据数据故事与视觉元素的映射关系,得到数据故事的故事看板,并通过前端UI实现故事看板的可视化表达。2.根据权利要求1所述的数据故事生成方法,其特征在于,步骤(1)中,将事件视为由主题、参数、内容以及评分四个方面构成,其中参数是指该事件的数字化特征,评分是指设计策略对事件进行重要性和影响力评分排序,保证事件的可靠性;主题由用户设置,内容是对该主题下关键问题的事实说明。3.根据权利要求2所述的数据故事生成方法,其特征在于,事件的公式为:F={theme,parameters,method,score}={t
i
,p
i
,m
i
,s
i
}F表示事件的集合,theme表示主题,parameters表示参数,method表示内容,score表示评分,t
i
表示第i个事件的主题,p
...

【专利技术属性】
技术研发人员:彭韧赵婉莹张珍妮刘珂珂张凯筑
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1