数据分析的方法、数据分析系统、计算设备、存储介质和程序产品技术方案

技术编号:35158777 阅读:12 留言:0更新日期:2022-10-12 17:16
本公开的实施例提供了一种数据分析的方法、计算设备、存储介质以及程序产品。在该方法中,与目标主题相关联的多个评估因子可以被确定。相应地,可以从与多个评估因子对应的数据源中解析得到实体评估信息,其中实体评估信息包括一组实体的与多个评估因子对应的值。进一步地,该组实体的评估信息可以被用于确定该组实体与目标主题的一组相关性。相应地,与一组实体中的目标实体相关联的描述信息被提供,以用于指示该目标实体与目标主题的相关性。基于这样的方式,本公开的实施例能够基于指定的评估因子来自动地标识出实体与所关注的目标主题之间的相关性,这能够提高主题研究的效率。这能够提高主题研究的效率。这能够提高主题研究的效率。

【技术实现步骤摘要】
数据分析的方法、数据分析系统、计算设备、存储介质和程序产品


[0001]本公开的实施例主要涉及计算机
更具体地,本公开的实施例涉及用于数据分析的方法、数据分析系统、计算设备、计算机可读存储介质以及计算机程序产品。

技术介绍

[0002]在数据分析领域中,基于主题的研究是一项重要的工作。传统的主题研究通常依赖于研究人员人工搜集与待研究的主题相关联的信息,并依赖于个人经验来确定一些实体(例如,企业)与待研究主题的相关程度。这样的过程通常需要耗费较大的时间成本,并且研究结果也因为研究人员不同而存在较大的差异性。例如,在金融行业中,随着行业规模的不断扩展,研究人员需要关注的实体的数目越多越来,需要分析的信息也越来越多。因此,人们期望能够提高主题研究的效率。

技术实现思路

[0003]本公开的实施例涉及一种智能的主题研究方案,并且具体提供了一种数据分析的方法、数据分析系统、计算设备、计算机可读存储介质、以及计算机程序产品。
[0004]在本公开的第一方面,提供了一种数据分析方法。在该方法中,与目标主题相关联的多个评估因子可以被确定。相应地,可以从与多个评估因子对应的数据源中解析得到实体评估信息,其中实体评估信息包括一组实体的与多个评估因子对应的值。进一步地,该组实体的评估信息可以被用于确定该组实体与目标主题的一组相关性。相应地,与一组实体中的目标实体相关联的描述信息被提供,以用于指示该目标实体与目标主题的相关性。
[0005]基于这样的方式,本公开的实施例能够基于指定的评估因子来自动地标识出实体与所关注的目标主题之间的相关性,这能够提高主题研究的效率。
[0006]在一些实施例中,确定与目标主题相关联的多个评估因子包括:基于用户输入确定自定义评估因子,用户输入至少指示:与自定义评估因子对应的数据源,和从数据源确定与自定义评估因子对应的值的方式;以及将自定义评估因子添加到多个评估因子。以此方式,本公开的实施例能够允许用户自定义评估因子,进而支持用户从关注的角度来进行个性化的主题研究。
[0007]在一些实施例中,确定与目标主题相关联的多个评估因子包括:向用户提供与目标主题相关联的一组候选评估因子;以及基于用户的选择,从一组候选评估因子中确定多个评估因子。以此方式,本公开的实施例能够为用户提供预设的多个评估因子,并根据用户需要来选择所使用的评估因子。一方面,这降低了用户定义评估因子的成本,另一方面,这也允许用户根据实际需要来进行个性化的主题研究。
[0008]在一些实施例中,方法还包括:基于用户输入确定一组实体中的至少一个实体,用户输入包括:与实体相关联的实体标识,或者与市场指数相关联的指数标识,其中市场指数与多个实体相关联。以此方式,本公开的实施例能够支持用户了解特定实体与目标主题的
相关性,从而有效地帮助用户的主题研究。
[0009]在一些实施例中,确定一组实体与目标主题的一组相关性包括:基于一组实体的与多个评估因子对应的值,确定一组实体的与多个评估因子相关联的多个因子得分;以及基于一组实体的多个因子得分,确定一组实体与目标主题的一组相关性。以此方式,本公开的实施例能够基于实体在不同评估因子上的表现来综合地确定实体与主题的相关性,从而提升主题研究的准确度。
[0010]在一些实施例中,提供与一组实体中的目标实体相关联的描述信息包括:向用户提供以下信息:目标实体的标识,目标实体的多个因子得分,以及描述目标实体与目标主题的相关性的得分。以此方式,本公开的实施例能够使得用户快捷地了解与目标主题相关联的实体的有效信息,提高用户的效率。
[0011]在一些实施例中,方法还包括:从用户接收对提供的多个因子得分中的目标因子得分的选择;提供针对目标因子得分的辅助信息,其中辅助信息包括以下中的至少一项:数据源中用于确定目标因子得分的数据,与用于确定目标因子得分的数据源相关联的链接,或关于计算目标因子得分的过程的描述。以此方式,本公开的实施例能够使得用户能够直观地了解相关性被确定的过程和/或其他相关信息,从而使得用户能够更好地做出基于相关性的决策。
[0012]在一些实施例中,一组实体包括多个实体,并且方法还包括:从一组实体中筛选目标实体,其中目标实体与目标主题的相关性高于预定阈值。以此方式,本公开的实施例能够将符合要求的实体呈现至用户,从而降低用户的浏览和筛选成本。
[0013]在一些实施例中,方法还包括:基于至少一项主题挖掘策略,确定一组热门主题;提供第一界面,第一界面包括与一组热门主题相对应的一组视觉元素;以及响应于用户对于一组视觉元素中目标视觉元素的第一操作,从一组热门主题中确定与目标视觉元素相对应的目标主题。以此方式,本公开的实施例能够基于自动的主体挖掘而高效地为用户提供当前的热门主题,从而使得用户能够快速地了解当前的热门主题。此外,用户还能够通过便捷的界面操作而快速地启动主题分析的过程,从而提升主题研究的效率。
[0014]在一些实施例中,基于一组相关性提供与一组实体中的目标实体相关联的描述信息包括:从第一界面切换至第二界面,第二界面包括与一组实体中的目标实体相关联的描述信息。以此方式,本公开的实施例能够通过高效的用户来为用户快捷地提供相关联的目标实体的描述信息,从而提升用户获取信息的效率。
[0015]在一些实施例中,确定一组热门主题包括:基于实体市场价值的变化,确定至少一个热门实体;以及基于与至少一个热门实体相关联的标签,确定至少一个热门主题。备选地,确定一组热门主题包括:利用自然语言处理,从预定媒体发布的内容中确定一组关键词;以及对一组关键词进行聚类,以确定至少一个热门主题。以此方式,本公开的实施例能够通过各种数据来源来高效地挖掘当前的热门主题。
[0016]在一些实施例中,方法还包括:接收针对一组热门主题中的特定主题的预览请求;以及提供与特定主题相关联的主题描述信息,主题描述信息包括以下中的至少一项:热度信息,指示特定主题被关注的程度;支持信息,指示特定主题被确定为热门主题的理由;或来源信息,指示用于确定特定主题的信息源。以此方式,本公开的实施例能够允许更为直观地了解热门主题被确定的理由,并且能够允许用户便捷地访问相应信息的来源。
[0017]在一些实施例中,方法还包括:响应于用户对于目标视觉元素的第二操作,确定与目标主题相关联的一组关键词;基于与目标主题相关联的行业的知识库,构建与一组关键词相关联的层级结构,层级结构指示一组关键词中关键词对之间的从属关系;以及从第一界面切换至第三界面,第三界面以图形方式呈现一组关键词的层级结构。在一些实施例中,层级结构包括:第一层级,包括目标主题的文本;第二层级,包括与目标主题包括的多个分类相对应的关键词;以及第三层级,包括属于多个分类中各个分类的关键词。以此方式,本公开的实施例能够允许用户直观地查看与目标主题有关的关键词,并且能够通过图形方式高效地知悉各关键词之间的逻辑关系,进而能够有效地帮助用户进行主题研究。
[0018]在一些实施例中,多个评估因子与以下中的至少一项有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据分析的方法,其特征在于,所述方法包括:确定与目标主题相关联的多个评估因子;从与所述多个评估因子对应的数据源中确定实体评估信息,所述实体评估信息包括一组实体的与所述多个评估因子对应的值;基于所述一组实体的所述评估信息,确定所述一组实体与所述目标主题的一组相关性;以及基于所述一组相关性,提供与所述一组实体中的目标实体相关联的描述信息,所述描述信息至少指示所述目标实体与所述目标主题的相关性。2.根据权利要求1所述的方法,其特征在于,确定与目标主题相关联的多个评估因子包括:基于用户输入确定自定义评估因子,所述用户输入至少指示:与所述自定义评估因子对应的数据源,和从所述数据源确定与所述自定义评估因子对应的值的方式;以及将所述自定义评估因子添加到所述多个评估因子。3.根据权利要求1所述的方法,其特征在于,确定与目标主题相关联的多个评估因子包括:向用户提供与所述目标主题相关联的一组候选评估因子;以及基于所述用户的选择,从所述一组候选评估因子中确定所述多个评估因子。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于用户输入确定所述一组实体中的至少一个实体,所述用户输入包括:与实体相关联的实体标识,或者与市场指数相关联的指数标识,其中所述市场指数与多个实体相关联。5.根据权利要求1所述的方法,其特征在于,确定所述一组实体与所述目标主题的一组相关性包括:基于所述一组实体的与所述多个评估因子对应的值,确定所述一组实体的与所述多个评估因子相关联的多个因子得分;以及基于所述一组实体的所述多个因子得分,确定所述一组实体与所述目标主题的所述一组相关性。6.根据权利要求5所述的方法,其特征在于,提供与所述一组实体中的目标实体相关联的描述信息包括:向用户提供以下信息:所述目标实体的标识,所述目标实体的所述多个因子得分,以及描述所述目标实体与所述目标主题的所述相关性的得分。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:从所述用户接收对所述提供的所述多个因子得分中的目标因子得分的选择;提供针对所述目标因子得分的辅助信息,其中所述辅助信息包括以下中的至少一项:所述数据源中用于确定所述目标因子得分的数据,与用于确定所述目标因子得分的所述数据源相关联的链接,或关于计算所述目标因子得分的过程的描述。
8.根据权利要求1所述的方法,其特征在于,所述一组实体包括多个实体,并且所述方法还包括:从所述一组实体中筛选所述目标实体,其中所述目标实体与所述目标主题的所述相关性高于预定阈值。9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:基于至少一项主题挖掘策略,确定一组热门主题;提供第一界面,所述第一界面包括与所述一组热门主题相对应的一组视觉元素;以及响应于用户对于所述一组视觉元素中目标视觉元素的第一操作,从一组热门主题中确定与所述目标视觉元素相对应的所述目标主题。10.根据权利要求9所述的方法,其特征在于,基于所述一组相关性提供与所述一组实体中的目标实体相关联的描述信息包括:从所述第一界面切换至第二界面,所述第二界面包括与所述一组实体中的所述目标实体相关联的所述描述信息。11.根据权利要求9所述的方法,其特征在于,确定所述一组热门主题包括:基于实体市场价值的变化,确定至少一个热门实体;以及基于与所述至少一个热门实体相关联的标签,确定至少一个热门主题。12.根据权利要求9所述的方法,其特征在于,确定所述一组热门主题包括:利用自然语言处理,从预定媒体发布的内容中确定一组关键词;以及对所述一组关键词进行聚类,以确定至少一个热门主题。13.根据权利要求9所述的方法,其特征在于,所述方法还包括:接收针对所述一组热门主题中的特定主题的预览请求;以及在所述第一界面中呈现与所述特定主题相关联的主题描述信息,所述主题描述信息包括以下中的至少一项:热度信息,指示所述特定主题被关注的程度;支持信息,指示所述特定主题被确定为热门主题的理由;或来源信息,指示用于确定所述特定主题的信息源。14.根据权利要求9所述的方法,其特征在于,所述方...

【专利技术属性】
技术研发人员:赵冉李明磊陈志毅
申请(专利权)人:华为云计算技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1