在线解决方案的生成方法及装置制造方法及图纸

技术编号:34398834 阅读:16 留言:0更新日期:2022-08-03 21:36
本发明专利技术公开了一种在线解决方案的生成方法及装置,涉及分布式技术领域,其中该方法包括:接收当前问题;从Hive数据仓库中确定出与当前问题相似度最高的历史问题;所述Hive数据仓库中预先存储有历史问题及与该历史问题关联性最高的解决方案,与历史问题关联性最高的解决方案为通过随机森林算法对Hive数据仓库中的历史问题及解决方案的关联性进行统计确定出的方案;根据与当前问题相似度最高的历史问题,从Hive数据仓库中提取出与当前问题相似度最高的历史问题关联性最高的解决方案作为当前问题对应的最佳解决方案。本发明专利技术可以帮助用户精确地找到问题的最佳解决方案。用户精确地找到问题的最佳解决方案。用户精确地找到问题的最佳解决方案。

【技术实现步骤摘要】
在线解决方案的生成方法及装置


[0001]本专利技术涉及分布式
,尤其涉及一种在线解决方案的生成方法及装置。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]日常生活中我们时常会遇到一些问题,针对这些问题,我们会上各大网站搜索解决方案。实际上大家遇到的很多问题是类似的,解决的方式也相同。但是由于问题描述不准确、答案中不含问题以至于查询不到已有答案等等原因,查到了很多不相关、无效的解决方案,甚至查不到解决方案,导致问题无法解决。

技术实现思路

[0004]本专利技术实施例提供一种在线解决方案的生成方法,用以帮助用户精确地找到问题的最佳解决方案,该方法包括:
[0005]接收当前问题;
[0006]从Hive数据仓库中确定出与当前问题相似度最高的历史问题;所述Hive数据仓库中预先存储有历史问题及与该历史问题关联性最高的解决方案,与历史问题关联性最高的解决方案为通过随机森林算法对Hive数据仓库中的历史问题及解决方案的关联性进行统计确定出的方案;
[0007]根据与当前问题相似度最高的历史问题,从Hive数据仓库中提取出与当前问题相似度最高的历史问题关联性最高的解决方案作为当前问题对应的最佳解决方案。
[0008]本专利技术实施例还提供一种在线解决方案的生成装置,用以帮助用户精确地找到问题的最佳解决方案,该装置包括:
[0009]接收单元,用于接收当前问题;
[0010]确定单元,用于从Hive数据仓库中确定出与当前问题相似度最高的历史问题;所述Hive数据仓库中预先存储有历史问题及与该历史问题关联性最高的解决方案,与历史问题关联性最高的解决方案为通过随机森林算法对Hive数据仓库中的历史问题及解决方案的关联性进行统计确定出的方案;
[0011]生成单元,用于根据与当前问题相似度最高的历史问题,从Hive数据仓库中提取出与当前问题相似度最高的历史问题关联性最高的解决方案作为当前问题对应的最佳解决方案。
[0012]本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述在线解决方案的生成方法。
[0013]本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述在线解决方案的生成方法。
[0014]本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述在线解决方案的生成方法。
[0015]本专利技术实施例中,在线解决方案的生成方案,通过:接收当前问题;从Hive数据仓库中确定出与当前问题相似度最高的历史问题;所述Hive数据仓库中预先存储有历史问题及与该历史问题关联性最高的解决方案,与历史问题关联性最高的解决方案为通过随机森林算法对Hive数据仓库中的历史问题及解决方案的关联性进行统计确定出的方案;根据与当前问题相似度最高的历史问题,从Hive数据仓库中提取出与当前问题相似度最高的历史问题关联性最高的解决方案作为当前问题对应的最佳解决方案,可以帮助用户精确地找到问题的最佳解决方案。
附图说明
[0016]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0017]图1为本专利技术实施例中在线解决方案的生成方法的流程示意图;
[0018]图2为本专利技术实施例中预先构建所述Hive数据仓库的流程示意图;
[0019]图3为本专利技术实施例中获取历史问题及解决方案将历史问题及解决方案存入Hive数据仓库中的流程示意图;
[0020]图4为本专利技术另一实施例中获取历史问题及解决方案将历史问题及解决方案存入Hive数据仓库中的流程示意图;
[0021]图5为本专利技术实施例中在线解决方案的生成装置的结构示意图。
具体实施方式
[0022]为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。
[0023]为了便于理解本专利技术实施例,首先对本专利技术人涉及的名词进行介绍。
[0024]1.spark平台:Spark是一个基于内存计算的开源集群计算系统,是Apache社区最火热的项目之一,与Hadoop相比,Spark的计算速度可以提升近100倍。Spark由一组功能强大、高级别的库组成,包括SparkSql、SparkStreaming、MLlib、GraphX。Spark提供了大量的算子和丰富的数据操作接口方便对数据处理。
[0025]2.DataFrame:一种Spark平台上的分布式数据集,提供了由列组成的详细模式信息,就像关系型数据库中的表一样。DataFrame拥有丰富的算子,并进行了更高层次的抽象,提供了专用的API来处理分布式数据,可以方便地处理大规模结构化数据。
[0026]3.决策树:决策树在机器学习中是一种非常常用的分类方法,通过构成决策树来求取净现值的期望值大于等于0的概率。
[0027]4.随机森林算法:在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。随机森林集成了所有的分类投票结果,
将投票次数最多的类别指定为最终的输出。
[0028]人们对于获取问题解决方案由很强的诉求,对于较为热门的问题,希望能获取到最新最有效的解决方案。对于冷门的问题,希望能高效获取有用的解决方案。通过目前成熟的spark平台及随机森林算法实现该专利技术,具备高效的数据归集和处理能力,同时将热门问题及解决方案存储至hive数据库,独立于原网页数据,确保能够在线生成有效的解决方案,那么这将大大提高受众的使用程度,因此,具有很好的实用价值与商业前景。
[0029]现有方案:目前人们通过搜索引擎查询问题及解决方案的相关信息,搜索引擎首先从互联网上抓取包含用户查询内容的网页,然后建立自己的索引数据库,继续在自己的索引数据库中搜索,最后对搜索到的结果进行处理和排序。
[0030]通过上述可知,现有方案存在的技术缺点是:现有方案依赖于原始的网页数据,查询结果存在较大的不确定性,可能无法获取所需的解决方案。本专利技术实施例的目的是:设计一种基于spark平台的在线解决方案的生成方案,该方案通过目前成熟的spark平台及随机森林算法实现该专利技术,具备高效的数据归集和处理能力,同时将热门问题及解决方案存储至hive数据库,独立于原网页数据,确保能够在线生成有效的解决方案,提高用户获取解决方案的效率,提高本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在线解决方案的生成方法,其特征在于,包括:接收当前问题;从Hive数据仓库中确定出与当前问题相似度最高的历史问题;所述Hive数据仓库中预先存储有历史问题及与该历史问题关联性最高的解决方案,与历史问题关联性最高的解决方案为通过随机森林算法对Hive数据仓库中的历史问题及解决方案的关联性进行统计确定出的方案;根据与当前问题相似度最高的历史问题,从Hive数据仓库中提取出与当前问题相似度最高的历史问题关联性最高的解决方案作为当前问题对应的最佳解决方案。2.如权利要求1所述的在线解决方案的生成方法,其特征在于,还包括按照如下方法预先构建所述Hive数据仓库:获取历史问题及解决方案,将历史问题及解决方案存入Hive数据仓库中;通过随机森林算法对Hive数据仓库中的历史问题及解决方案的关联性进行统计,确定出与历史问题关联性最高的解决方案,将历史问题及与该历史问题关联性最高的解决方案存入Hive数据仓库中。3.如权利要求2所述的在线解决方案的生成方法,其特征在于,获取历史问题及解决方案,将历史问题及解决方案存入Hive数据仓库中,包括:对每一历史问题进行关键字切分,得到每一历史问题对应的关键字,对每一解决方案进行关键字切分,得到每一解决方案对应的关键字;对每一历史问题对应的关键字进行合并处理得到有效的历史问题,对每一解决方案对应的关键字进行合并处理得到有效的解决方案;将有效的历史问题及有效的解决方案存入Hive数据仓库中。4.如权利要求2所述的在线解决方案的生成方法,其特征在于,还包括:对Hive数据仓库中的历史问题及解决方案进行清洗加工后生成新的hive表数据。5.如权利要求4所述的在线解决方案的生成方法,其特征在于,对Hive数据仓库中的历史问题及解决方案进行清洗加工后生成新的hive表数据,包括:对Hive数据仓库中的历史问题及解决方案进行错误的关键字数据清洗、空缺值处理后生成新的hive表数据。6.如权利要求2所述的在线解决方案的生成方法,其特征在于,通过随机森林算法对Hive数据仓库中的历史问题及解决方案的关联性进行统计,确定出与历史问题关联性最高的解决方案,包括:根据用户对历史问题及解决方案的关联性投票,通过随机森林算法对Hive数据仓库中的历史问题及解决方案的关联性进行统计,确定出与历史问题关联性最高的解决方案。7.一种在线解决方案的生成装置,其特征在于,包括:接收单元,用于接收当前问题;确定单元,用于从Hive数据仓库中确定出与当前问题相似度最高的历史问题;所述Hive数据仓库中预先存储有历史问题及与该历...

【专利技术属性】
技术研发人员:夏梦
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1