一种基于大数据统计分析的交互方法、系统和存储介质技术方案

技术编号:33777846 阅读:15 留言:0更新日期:2022-06-12 14:31
本发明专利技术提供一种基于大数据统计分析的交互方法、系统和存储介质,所述方法包括:通过前端设备的用户界面接收用户输入的检索关键词;基于检索关键词在大数据平台中进行检索,并输出第一数据列表;由大数据平台对第一数据列表中的多条数据基于预设筛选算法进行筛选,得到第二数据列表并推送给前端设备的用户界面进行展示;通过前端设备的用户界面接收用户对第二数据列表的统计分析指令;由大数据平台基于统计分析指令对第二数据列表中的多条数据进行统计分析,并将统计分析结果展示在前端设备的用户界面。本发明专利技术能够实现对大数据的精准检索,提升大数据统计分析结果的准确性;并能够降低网络延迟,提升用户交互的体验感。提升用户交互的体验感。提升用户交互的体验感。

【技术实现步骤摘要】
一种基于大数据统计分析的交互方法、系统和存储介质


[0001]本专利技术涉及数据处理领域,尤其涉及一种基于大数据统计分析的交互方法、系统和存储介质。

技术介绍

[0002]目前,在知识爆炸时代,各行各业的数据量呈现几何式增长,如何在大量数据汇集的数据库中快速精确查找到合适的数据成为当前热门的话题。以专利数据库为例,传统的检索方式,则是由用户输入关键字/词,由专利搜索引擎直接检索出包含上述关键字/词的专利数据。然而,这种检索方式,通常容易检索出过多不相关的专利数据,不相关的专利数据不仅增加了用户分析的任务量;而且也会给统计分析结果造成干扰,例如不相关的专利数据则会导致统计分析的结果不具有参考性。
[0003]与此同时,许多大数据搜索平台布置在云端上,如果用户检索出数据量较大,则云端的大数据搜索平台通过网络推送大量数据给前端的用户界面,可能会出现网络延迟现象,进而影响用户进行数据检索的体验感。

技术实现思路

[0004]为了解决上述至少一个技术问题,本专利技术提出了一种基于大数据统计分析的交互方法、系统和存储介质,能够实现对大数据的精准检索,提升大数据统计分析结果的准确性;并能够降低网络延迟,提升了用户体验感。
[0005]本专利技术第一方面提出了一种基于大数据统计分析的交互方法,所述方法包括:
[0006]通过前端设备的用户界面接收用户输入的检索关键词;
[0007]基于所述检索关键词在大数据平台中进行检索,并输出第一数据列表;
[0008]由大数据平台对所述第一数据列表中的多条数据基于预设筛选算法进行筛选,得到第二数据列表并推送给前端设备的用户界面进行展示;
[0009]通过前端设备的用户界面接收用户对第二数据列表的统计分析指令;
[0010]由大数据平台基于所述统计分析指令对所述第二数据列表中的多条数据进行统计分析,并将统计分析结果展示在前端设备的用户界面。
[0011]本方案中,由大数据平台对所述第一数据列表中的多条数据基于预设筛选算法进行筛选,具体包括:
[0012]分别对第一数据列表中每条数据进行信息量计算,得到每条数据的信息量;
[0013]将第一数据列表中的每条数据依次作为主体数据,并将主体数据的信息量分别与剩余的其它数据的信息量进行近似度计算;
[0014]判断主体数据的信息量与剩余的其它数据的信息量之间的近似度是否大于第一预设阈值;
[0015]如果大于,则对主体数据的标记数值加1;
[0016]待第一数据列表中的每条数据均完成与其它数据的信息量比对后,则统计每条数
据的标记数值;
[0017]基于每条数据的标记数值对第一数据列表进行从高到低排序;
[0018]按照预设筛选比例,从第一数据列表中由高到底依次筛选出对应数量的数据,并加入第二数据列表。
[0019]本方案中,分别对第一数据列表中每条数据进行信息量计算,得到每条数据的信息量;将第一数据列表中的每条数据依次作为主体数据,并将主体数据的信息量分别与剩余的其它数据的信息量进行近似度计算,具体包括:
[0020]预设每条数据均具有相同的数据格式,且均包括多项标题内容,每项标题内容在数据中占比影响权重不同,且多项标题内容的占比影响权重之和等于1;
[0021]针对第一数据列表中每条数据的各个标题内容进行信息量计算,得到每条数据的各个标题内容的信息量分值;
[0022]选取第一数据列表中的一条数据作为主体数据A,将主体数据A的各项标题内容的信息量分值分别与第一数据列表中的其它数据B的对应标题内容的信息量分值进行近似度计算;
[0023]获取主体数据A与其它数据B基于各项标题内容的近似度分值;
[0024]将主体数据A与其它数据B基于各项标题内容的近似度分值分别乘以对应的占比影响权重,得到各项标题内容的近似度权重分值;
[0025]对各项标题内容的近似度权重分值进行累加,得到主体数据A的信息量与其它数据B的信息量之间的近似度。
[0026]本方案中,得到第二数据列表并推送给前端设备的用户界面进行展示,具体包括:
[0027]获取用户在历史时间段内的多次数据检索动作,每次数据检索动作至少包括用户输入的历史检索关键词,以及对应的历史检索数据;
[0028]统计每条历史检索数据在历史时间段内多次数据检索动作的呈现次数;
[0029]将呈现次数大于第二预设阈值的历史检索数据提取出,并预存入前端设备的本地数据库中;
[0030]建立本地数据库中的每条历史检索数据与对应的历史检索关键词之间的关联关系,并形成关联表;
[0031]基于所述检索关键词遍历本地数据库的关联表,并查找关联表中是否有匹配的历史检索关键词;
[0032]如果有,则根据关联表确定出对应的历史检索数据,并作为第一部分数据,并推送至前端设备的缓存库;
[0033]得到第二数据列表,从第二数据列表中过滤出第一部分数据,得到第二部分数据,并由大数据平台下载第二部分数据至前端设备的缓存库中;
[0034]由前端设备的用户界面将缓存库中的数据进行展示。
[0035]本方案中,由大数据平台基于所述统计分析指令对所述第二数据列表中的多条数据进行统计分析,并将统计分析结果展示在前端设备的用户界面,具体包括:
[0036]基于统计分析指令从统计分析模型库中选取适配的统计分析模型;
[0037]通过适配的统计分析模型对第二数据列表中的数据进行统计分析,输出初始统计分析结果;
[0038]获取前端设备的用户界面的尺寸比例;
[0039]基于前端设备的用户界面的尺寸比例,对初始统计分析结果进行调整,得到适应于前端设备的用户界面的统计分析结果;
[0040]将统计分析结果推送给前端设备的用户界面并进行展示。
[0041]本方案中,基于统计分析指令从统计分析模型库中选取适配的统计分析模型,具体包括:
[0042]采用统计分析模型库中每个统计分析模型对所述第二数据列表中的多条数据进行统计分析,并得到多个预选统计分析结果;
[0043]将多个预选统计分析结果进行打包,形成网络数据包并置入区块链网络中,其中区块链网络包括多个区块链网络节点;
[0044]由区块链网络节点P对网络数据包中的多个预选统计分析结果进行优选,并将优选结果加入网络数据包的选择链表中,然后采用自己的签名证书对选择链表进行签名,得到签名后的选择链表,并将签名后的选择列表随网络数据包一同返回至区块链网络中;
[0045]由区块链网络节点Q接收到多个网络数据包,并判断各个网络数据包中签名的选择链表长短,选取选择链表最长的网络数据包为待选网络数据包;
[0046]由区块链网络节点Q对待选网络数据包中的多个预选统计分析结果进行优选,并将优选结果加入待选网络数据包的选择链表中,然后采用自己的签名证书对待选网络数据包的选择链表进行签名,得到签名后的选择链表,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据统计分析的交互方法,其特征在于,所述方法包括:通过前端设备的用户界面接收用户输入的检索关键词;基于所述检索关键词在大数据平台中进行检索,并输出第一数据列表;由大数据平台对所述第一数据列表中的多条数据基于预设筛选算法进行筛选,得到第二数据列表并推送给前端设备的用户界面进行展示;通过前端设备的用户界面接收用户对第二数据列表的统计分析指令;由大数据平台基于所述统计分析指令对所述第二数据列表中的多条数据进行统计分析,并将统计分析结果展示在前端设备的用户界面。2.根据权利要求1所述的一种基于大数据统计分析的交互方法,其特征在于,由大数据平台对所述第一数据列表中的多条数据基于预设筛选算法进行筛选,具体包括:分别对第一数据列表中每条数据进行信息量计算,得到每条数据的信息量;将第一数据列表中的每条数据依次作为主体数据,并将主体数据的信息量分别与剩余的其它数据的信息量进行近似度计算;判断主体数据的信息量与剩余的其它数据的信息量之间的近似度是否大于第一预设阈值;如果大于,则对主体数据的标记数值加1;待第一数据列表中的每条数据均完成与其它数据的信息量比对后,则统计每条数据的标记数值;基于每条数据的标记数值对第一数据列表进行从高到低排序;按照预设筛选比例,从第一数据列表中由高到底依次筛选出对应数量的数据,并加入第二数据列表。3.根据权利要求2所述的一种基于大数据统计分析的交互方法,其特征在于,分别对第一数据列表中每条数据进行信息量计算,得到每条数据的信息量;将第一数据列表中的每条数据依次作为主体数据,并将主体数据的信息量分别与剩余的其它数据的信息量进行近似度计算,具体包括:预设每条数据均具有相同的数据格式,且均包括多项标题内容,每项标题内容在数据中占比影响权重不同,且多项标题内容的占比影响权重之和等于1;针对第一数据列表中每条数据的各个标题内容进行信息量计算,得到每条数据的各个标题内容的信息量分值;选取第一数据列表中的一条数据作为主体数据A,将主体数据A的各项标题内容的信息量分值分别与第一数据列表中的其它数据B的对应标题内容的信息量分值进行近似度计算;获取主体数据A与其它数据B基于各项标题内容的近似度分值;将主体数据A与其它数据B基于各项标题内容的近似度分值分别乘以对应的占比影响权重,得到各项标题内容的近似度权重分值;对各项标题内容的近似度权重分值进行累加,得到主体数据A的信息量与其它数据B的信息量之间的近似度。4.根据权利要求1所述的一种基于大数据统计分析的交互方法,其特征在于,得到第二数据列表并推送给前端设备的用户界面进行展示,具体包括:
获取用户在历史时间段内的多次数据检索动作,每次数据检索动作至少包括用户输入的历史检索关键词,以及对应的历史检索数据;统计每条历史检索数据在历史时间段内多次数据检索动作的呈现次数;将呈现次数大于第二预设阈值的历史检索数据提取出,并预存入前端设备的本地数据库中;建立本地数据库中的每条历史检索数据与对应的历史检索关键词之间的关联关系,并形成关联表;基于所述检索关键词遍历本地数据库的关联表,并查找关联表中是否有匹配的历史检索关键词;如果有,则根据关联表确定出对应的历史检索数据,并作为第一部分数据,并推送至前端设备的缓存库;得到第二数据列表,从第二数据列表中过滤出第一部分数据,得到第二部分数据,并由大数据平台下载第二部分数据至前端设备的缓存库中;由前端设备的用户界面将缓存库中的数据进行展示。5.根据权利要求1所述的一种基于大数据统计分析的交互方法,其特征在于,由大数据平台基于所述统计分析指令对所述第二数据列表中的多条数据进行统计分析,并将统计分析结果展示在前端设备的用户界面,具体包括:基于统计分析指令从统计分析模型库中选取适配的统计分析模型;通过适配的统计分析模型对第二数据列表中的数据进行统计分析,输出初始统计分析结果;获取前端设备的用户界面的尺寸比例;基于前端设备的用户界面的尺寸比例,对初始统计分析结果进行调整,得到适应于前端设备的用户界面的统计分析结果;将统计分析结果推送给前端设备的用户界面并进行展示。6.根据权利要求5所述的一种基于大数据统计分析的交互方法,其特征在于,基于统计分析指令从统计分析模型库中选取适配的统计分析模型,具...

【专利技术属性】
技术研发人员:吴习华邓君刘文锋黄炳鑫宋玉叶浩宇吴豪杰
申请(专利权)人:东莞市创为新科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1