基于人工智能的数据报告生成方法和系统技术方案

技术编号:25550801 阅读:42 留言:0更新日期:2020-09-08 18:50
本发明专利技术提供了一种基于人工智能的数据报告生成方法和系统。该方法包括:确定报告阅读者关注的重点指标;获取表格类报告模板,将所述重点指标的指标标识写入所述表格类报告模板中待填写的指标标识填写区域;在所述表格类报告模板中,确定除去所述重点指标以外的其它指标;从数据库中筛选出所述重点指标对应的指标数据;从所述数据库中筛选出所述其它指标对应的指标数据;将所述重点指标对应的指标数据写入所述重点指标相应的指标数据导入区域,将所述其它指标对应的指标数据写入所述其它指标相应的指标数据导入区域,从而生成数据报告。

【技术实现步骤摘要】
基于人工智能的数据报告生成方法和系统
本专利技术涉及人工智能
,特别涉及一种基于人工智能的数据报告生成方法和系统。
技术介绍
目前,数据报告是产品和运营人士不可缺少的工作,无论是周报还是月报,还是产品市场分析还是新商品表现等都围绕数据报告。但是对数据进行整理和分析提炼往往需要花费大量时间和精力,因此,急需一种能够智能的生成数据报告的方法。
技术实现思路
本专利技术提供一种于人工智能的数据报告生成方法和系统。为了实现上述目的,本专利技术采用的技术方案如下:本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附本文档来自技高网...

【技术保护点】
1.一种基于人工智能的数据报告生成方法,其特征在于,包括:/n确定报告阅读者关注的重点指标;/n获取表格类报告模板,将所述重点指标的指标标识写入所述表格类报告模板中待填写的指标标识填写区域;/n在所述表格类报告模板中,确定除去所述重点指标以外的其它指标;/n从数据库中筛选出所述重点指标对应的指标数据;/n从所述数据库中筛选出所述其它指标对应的指标数据;/n将所述重点指标对应的指标数据写入所述重点指标相应的指标数据导入区域,将所述其它指标对应的指标数据写入所述其它指标相应的指标数据导入区域,从而生成数据报告。/n

【技术特征摘要】
1.一种基于人工智能的数据报告生成方法,其特征在于,包括:
确定报告阅读者关注的重点指标;
获取表格类报告模板,将所述重点指标的指标标识写入所述表格类报告模板中待填写的指标标识填写区域;
在所述表格类报告模板中,确定除去所述重点指标以外的其它指标;
从数据库中筛选出所述重点指标对应的指标数据;
从所述数据库中筛选出所述其它指标对应的指标数据;
将所述重点指标对应的指标数据写入所述重点指标相应的指标数据导入区域,将所述其它指标对应的指标数据写入所述其它指标相应的指标数据导入区域,从而生成数据报告。


2.如权利要求1所述的方法,其特征在于,包括:
所述数据库包括本地数据库、网络侧的数据库、第三方合作数据库中的任一个或多个。


3.如权利要求1所述的方法,其特征在于,所述确定报告阅读者关注的重点指标,包括:
对所述报告阅读者参与会谈时的脸部图像和声音进行同步录制,获得参与会谈时所述报告阅读者的脸部录像和声音录音;
对所述声音录音进行文字识别,获得会谈文本;
将所述会谈文本进行语义提炼,获取所述会谈文本中的关键词和每个关键词在所述音频文件中出现的次数;
从所述音频文件中获取所述每个关键词每次出现时对应的音量大小;
对所述脸部录像中的图像进行脸部表情识别分析,确定所述脸部录像中出现预设表情的时间点;并确定预设时间段内出现的关键词;所述预设时间段为所述时间点之前的第一时间点到所述时间点之后的第二时间点之间的时间段;
根据所述每个关键词在所述音频文件中出现的次数、每个关键词每次出现时对应的音量大小、每个关键词是否出现在所述预设时间段内,确定每个关键词对应的重要性指数:
将所有关键词对应的重要性指数按照从大到小的顺序排列,获得关键词重要性序列;
从所述关键词重要性序列中选择排名前N位的重要性指数所对应的N个关键词;
根据预存的指标与关键词对照表,确定所述N个关键词各自对应的指标;
将所述N个关键词各自对应的指标作为所述报告阅读者关注的重点指标;
其中,所述根据所述每个关键词在所述音频文件中出现的次数、每个关键词每次出现时对应的音量大小、每个关键词是否出现在所述预设时间段内,确定每个关键词对应的重要性指数,包括:
按照如下公式计算当前关键词对应的重要性指数:



其中,dj是第j个关键词的重要性指数,α1是预设的第一权重系数,其值大于0且小于或等于1;fj表示第j个关键词是否出现在所述预设时间段内,当是时fj取值为1,当不是时fj取值为0;α2是预设的第二权重系数,其值大于0且小于或等于1;Ri是第i个关键词在所述音频文件中出现的次数,i=1,2,3、、、N;N为所述音频文件中出现的所有关键词的个数;Rj是第j个关键词在所述音频文件中出现的总次数;α3是预设的第三权重系数,其值大于0且小于或等于1;,Xi是第i个关键词在所述音频文件中的最大音量大小,Xj是第j个关键词在所述音频文件中的最大音量大小;其中,α1+α2+α3=1。


4.如权利要求3所述的方法,其特征在于,还包括:
将所述会谈谈话录音得到的音频文件中所识别的重要关键词与所述数据库中的图片及文本描述信息进行匹配,根据匹配结果,执行将所述重点指标对应的指标数据写入所述重点指标相应的指标数据导入区域的操作;其具体实现步骤如下:
步骤S1、根据预先建立的音频预处理模型,对会谈谈话录音得到的音频文件进行采样和编码处理,确定经短时傅里叶变换展开后的音频文件输出值,并将获取后的音频数据输出值与文字数据库匹配,获取所述音频文件对应的会谈文本信息;



其中,N为所述会谈谈话录音音频文件的数量,e为自然常数,i为所述会谈谈话录音音频文件的总时长,w为音频频率,s为所述会谈谈话录音音频文件中各句话的序号,其取值为正整数,t为音频文件中每句话的起始时间坐标,τ为音频文件中每句话的终止时间坐标,m为文本数据库中所含文本的总数,r为文本数据库中各文本所对应的音频索引序号,A为从大到小的有序排列,为文本数据库中各文本与对应音频索引的有序排列信息,是在给定音频文件中每句话起始时间坐标t和终止时间坐标τ上进行的相位展开,为获取所述会谈谈话录音音频文件所对应的会谈文本信息;
步骤S2、根据所述步骤S1获取的所述会谈谈话录音音频文件所对应的会谈文本信息,提取所述会谈文本中的关键词,并与预设数据库重要关键词进行比对,以获取所需重要音频关键词集合;



其中,y为预设数据库中关键词的数量,Hy为预设数据库中关键词的数量为y所对应的重要数据库关键词有序排序,即有序排序处于前30%为重要数据库关键词,k为所述会谈谈话录音音频文件中各文本关键词出现的次数,Bk为所述会谈谈话录音音频文件中各文本关键词出现的次数为k所对应按出现次数多少进行有序排序,其中排序处于前60%为重要文本关键词,Z为音频数据的振幅,(Zmax-Zmin)为所确认音频数据最大幅度与最小幅度的差值,为各文本关键词所对应的声音振幅,其中声音振幅超过音频数据最大幅度与最小幅度的差值的为重要文本关键词,为识别会谈谈话录音音频文件中关键词是否为重要音频关键词,即既满足为重要数据库关键词,又满足为按音量大小及出现次数确认为重要文本关键词的关键词,Ipt(Bk)为获取所需重要音频关键词集合。


5.如权利要求1所述的方法,其特征在于,
当所述其它指标中包括目标指标时,所述目标指标为指标标识中只包括“照片”这两个字符或者只包括“图片”这两个字符或者只包括“相片”这两个字符或者只包括“图像”这两个字符:
所述从所述数据库中筛选出所述其它指标对应的指标数据,包括:
根据所述重点指标在所述表格类报告模板中相应的指标数据填写区域、所述目标指标在所述表格类报告模板中相应的指标数据填写区域,确定所述目标指标与所述重点指标之间是否具有关联关系;
当目标指标与重点指标之间具有关联关系时,从重点指标的指标标识中获取所述重点指标对应的关键形象标识,关键形象标识为与重点指标相关联的照片、图片、相片或者图像中需包含的关键对象的形象识别标识;
从数据库中,筛选出包含所述关键形象标识所对应的形象的预设对象,作为所述目标指标对应的指标数据;所述预设对象包括照片、图片、相片或者图像;
此时,所述将所述其它指标对应的指标数据写入所述其它指标相应的指标数据导入区域,包括:
将所述关键形象标识所对应的形象的预设对象写入所述目标指标相应的指标数据导入区域之后,将所述表格式模板中的所述目标指标的指标标识修改为目标识别字符,所述目标识别字符用于表明所述写入所述目标指标相应的指标数据导入区域的数据为与所述重点指标相关的照片、图片、相片或者图像。


6.如权利要求5所述的方法,其特征在于,
所述从数据库中,筛选出包含所述形象标识的预设对象,作为所述目标指标对应的指标数据,包括步骤B31-B35:
步骤B31、获取报告阅读者的员工标识,员工标识用于表明报告阅读者在其所在工作机构中的职务等级;
步骤B32、根据工作机构预设的每个员工与其所管理的对象之间的第一对应关系表,根据报告阅读者的员工标识确定报告阅读者对应的被管理对象;被管理对象可以是人、物中的任一种或者两种都有;
步骤B33、根据工作机构预设的每个被管理对象与其形象标识之间的第二对应关系表,确定报告阅读者对应的被管理对象所对应的形象标识;
步骤B34、判断所述报告阅读者对应的被管理对象所对应的形象标识与所述关键形象标识之间是否存在关联关系;
其中,当被管理对象所对应的形象标识为第一人物特征、所述关键形象标识包括第二人物特征时,判断这两个人物特征之间的相似度是否等于或大于第一预设相似度,如果...

【专利技术属性】
技术研发人员:崔炜
申请(专利权)人:上海乂学教育科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1