【技术实现步骤摘要】
数据分析的方法、数据分析系统、计算设备、存储介质和程序产品
[0001]本公开的实施例主要涉及计算机
更具体地,本公开的实施例涉及用于数据分析的方法、数据分析系统、计算设备、计算机可读存储介质以及计算机程序产品。
技术介绍
[0002]在数据分析领域中,基于主题的研究是一项重要的工作。传统的主题研究通常依赖于研究人员人工搜集与待研究的主题相关联的信息,并依赖于个人经验来确定一些实体(例如,企业)与待研究主题的相关程度。这样的过程通常需要耗费较大的时间成本,并且研究结果也因为研究人员不同而存在较大的差异性。例如,在金融行业中,随着行业规模的不断扩展,研究人员需要关注的实体的数目越多越来,需要分析的信息也越来越多。因此,人们期望能够提高主题研究的效率。
技术实现思路
[0003]本公开的实施例涉及一种智能的主题研究方案,并且具体提供了一种数据分析的方法、数据分析系统、计算设备、计算机可读存储介质、以及计算机程序产品。
[0004]在本公开的第一方面,提供了一种数据分析方法。在该方法中,与目标主题相关联的多个评估因子可以被确定。相应地,可以从与多个评估因子对应的数据源中解析得到实体评估信息,其中实体评估信息包括一组实体的与多个评估因子对应的值。进一步地,该组实体的评估信息可以被用于确定该组实体与目标主题的一组相关性。相应地,与一组实体中的目标实体相关联的描述信息被提供,以用于指示该目标实体与目标主题的相关性。
[0005]基于这样的方式,本公开的实施例能够基于指定的评估因子来自动地标 ...
【技术保护点】
【技术特征摘要】
1.一种数据分析的方法,其特征在于,所述方法包括:确定与目标主题相关联的多个评估因子;从与所述多个评估因子对应的数据源中确定实体评估信息,所述实体评估信息包括一组实体的与所述多个评估因子对应的值;基于所述一组实体的所述评估信息,确定所述一组实体与所述目标主题的一组相关性;以及基于所述一组相关性,提供与所述一组实体中的目标实体相关联的描述信息,所述描述信息至少指示所述目标实体与所述目标主题的相关性。2.根据权利要求1所述的方法,其特征在于,确定与目标主题相关联的多个评估因子包括:基于用户输入确定自定义评估因子,所述用户输入至少指示:与所述自定义评估因子对应的数据源,和从所述数据源确定与所述自定义评估因子对应的值的方式;以及将所述自定义评估因子添加到所述多个评估因子。3.根据权利要求1所述的方法,其特征在于,确定与目标主题相关联的多个评估因子包括:向用户提供与所述目标主题相关联的一组候选评估因子;以及基于所述用户的选择,从所述一组候选评估因子中确定所述多个评估因子。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于用户输入确定所述一组实体中的至少一个实体,所述用户输入包括:与实体相关联的实体标识,或者与市场指数相关联的指数标识,其中所述市场指数与多个实体相关联。5.根据权利要求1所述的方法,其特征在于,确定所述一组实体与所述目标主题的一组相关性包括:基于所述一组实体的与所述多个评估因子对应的值,确定所述一组实体的与所述多个评估因子相关联的多个因子得分;以及基于所述一组实体的所述多个因子得分,确定所述一组实体与所述目标主题的所述一组相关性。6.根据权利要求5所述的方法,其特征在于,提供与所述一组实体中的目标实体相关联的描述信息包括:向用户提供以下信息:所述目标实体的标识,所述目标实体的所述多个因子得分,以及描述所述目标实体与所述目标主题的所述相关性的得分。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:从所述用户接收对所述提供的所述多个因子得分中的目标因子得分的选择;提供针对所述目标因子得分的辅助信息,其中所述辅助信息包括以下中的至少一项:所述数据源中用于确定所述目标因子得分的数据,与用于确定所述目标因子得分的所述数据源相关联的链接,或关于计算所述目标因子得分的过程的描述。
8.根据权利要求1所述的方法,其特征在于,所述一组实体包括多个实体,并且所述方法还包括:从所述一组实体中筛选所述目标实体,其中所述目标实体与所述目标主题的所述相关性高于预定阈值。9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:基于至少一项主题挖掘策略,确定一组热门主题;提供第一界面,所述第一界面包括与所述一组热门主题相对应的一组视觉元素;以及响应于用户对于所述一组视觉元素中目标视觉元素的第一操作,从一组热门主题中确定与所述目标视觉元素相对应的所述目标主题。10.根据权利要求9所述的方法,其特征在于,基于所述一组相关性提供与所述一组实体中的目标实体相关联的描述信息包括:从所述第一界面切换至第二界面,所述第二界面包括与所述一组实体中的所述目标实体相关联的所述描述信息。11.根据权利要求9所述的方法,其特征在于,确定所述一组热门主题包括:基于实体市场价值的变化,确定至少一个热门实体;以及基于与所述至少一个热门实体相关联的标签,确定至少一个热门主题。12.根据权利要求9所述的方法,其特征在于,确定所述一组热门主题包括:利用自然语言处理,从预定媒体发布的内容中确定一组关键词;以及对所述一组关键词进行聚类,以确定至少一个热门主题。13.根据权利要求9所述的方法,其特征在于,所述方法还包括:接收针对所述一组热门主题中的特定主题的预览请求;以及在所述第一界面中呈现与所述特定主题相关联的主题描述信息,所述主题描述信息包括以下中的至少一项:热度信息,指示所述特定主题被关注的程度;支持信息,指示所述特定主题被确定为热门主题的理由;或来源信息,指示用于确定所述特定主题的信息源。14.根据权利要求9所述的方法,其特征在于,所述方...
【专利技术属性】
技术研发人员:赵冉,李明磊,陈志毅,
申请(专利权)人:华为云计算技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。