应用于处理平台数据分析的方法和装置制造方法及图纸

技术编号:21158523 阅读:104 留言:0更新日期:2019-05-22 07:52
本申请提供了一种应用于处理平台数据分析的方法和装置,该方法包括:获取目标产品的第一测试数据;对该第一测试数据与第二测试数据进行对比,确定该第一测试数据与该第二数据的相似度,该第二测试数据的获取时刻早于该第一测试数据的获取时刻;根据该相似度确定是否收集该第一测试数据。本申请实施例的技术方案能够提高处理平台处理数据的效率。

Method and Device for Data Analysis of Platform

The application provides a method and device for processing platform data analysis, which includes: acquiring the first test data of the target product; comparing the first test data with the second test data to determine the similarity between the first test data and the second test data, the second test data acquisition time is earlier than the first test data acquisition time; and according to the method, the first test data acquisition time is earlier than the first test data acquisition time. Similarity determines whether the first test data is collected. The technical scheme of the embodiment of the present application can improve the efficiency of data processing by the processing platform.

【技术实现步骤摘要】
应用于处理平台数据分析的方法和装置
本申请涉及电子设备领域,并且更具体地,涉及一种应用于处理平台数据分析的方法和装置。
技术介绍
由于互联网相关产品面向消费者,因此用户体验越来越重要。对测试用户的体验感,消费者本身就是最好的测试者,舆情问题对产品的质量提升具有重要价值;此外,由于产品迭代更新速度越来越快,要求产品测试的周期也要越来越短。因而,众测方式逐渐成为互联网产品普遍采用的产品测试方式。在现有技术中,可以采用通过舆情问题处理平台发布众测任务,设置各种激励措施促使用户提交产品问题报告,收集到众测问题报告后进行汇总,分析人员定期从平台导出产品问题报告进行人工分析,提取产品缺陷(bug)和体验问题。但是,目前的处理平台并不具备问题分析功能,主要依赖于人工进行分析判断,从而导致处理数据的效率较低。
技术实现思路
有鉴于此,本申请提供了一种应用于处理平台数据分析的方法和装置,以期提高处理平台处理数据的效率。第一方面,提供了一种应用于处理平台数据分析的方法,该方法包括:获取目标产品的第一测试数据;对该第一测试数据与第二测试数据进行对比,确定该第一测试数据与该第二数据的相似度,该第二测试数据的获取时刻早于该第一测试数据的获取时刻;根据该相似度确定是否收集该第一测试数据。在本申请的实施例中,可以对第一测试数据和第二测试数据进行对比,确定第一测试数据和第二测试数据的相似度,根据相似度确定是否收集最新获取的测试数据(例如,第一测试数据)。从而避免了大量人工分析相似数据的过程,能够提高处理数据的效率。应理解,在本申请的实施例中第一测试数据和第二测试数据可以是产品发布前用户反馈的测试数据,即可以是测试产品的相关性能的数据,从而能够确定产品中是否存在bug,进一步优化产品的性能。测试数据也可以是关于用户使用产品时的相关意见或建议的反馈数据。在一种可能的实施方式中,第一测试数据和第二测试数据可以是未收集至数据库的测试数据。例如,可以是获取第二测试数据和第一测试数据之后,对第一测试数据与第二测试数据进行对比,确定第一测试数据与第二测试数据的相似度,根据相似度确定是否收集第一测试数据或第二测试数据。在另一种可能的实现方式中,第二测试数据可以是已经收集至数据库中的测试数据。例如,第二测试数据可以是收集至数据库中的测试数据,获取第一测试数据之后,对第一测试数据与数据库中的第二测试数据进行对比,确定第一测试数据与第二测试数据的相似度,根据相似度确定是否收集第一测试数据。结合第一方面,在第一方面的某些可能的实现方式中,根据该相似度确定是否收集该第一测试数据,包括:当该相似度小于第一阈值时,确定收集该第一测试数据。也就是说,在获取的多个测试数据中,若测试数据之间的相似度小于一个阈值,则可以说明这多个测试数据之间不是相似的,即该多个测试数据均可以是有效测试数据,确定收集该多个测试数据。示例性地,在确定第一测试数据与第二测试数据的相似度小于第一阈值时,则以确定第一测试数据和第二测试数据不是相似数据。因此,可以收集第一测试数据和第二测试数据至数据库。结合第一方面,在第一方面的某些可能的实现方式中,根据该相似度确定是否收集该第一测试数据,包括:当该相似度大于第一阈值时,根据该第一测试数据是否属于与该第二测试数据同一用户确定是否收集该第一测试数据。也就是说,当获取的第一测试数据与第二测试数据之间的相似度大于一个阈值时,此时第一测试数据与第二测试数据可以是相似的测试数据,需要进一步判断第一测试数据与第二测试数据是否为同一用户的发送的测试数据,进而确定是否收集该第一测试数据。结合第一方面,在第一方面的某些可能的实现方式中,该根据该第一测试数据与该第二测试数据是否属于同一用户确定是否收集该第一测试数据,包括:在该第一测试数据和该第二测试数据属于同一个用户时,确定不收集该第一测试数据。示例性地,可以确定第一测试数据和第二测试数据是否为同一用户多次提交的无效数据。例如,无效数据可以看作同一用户为了获取奖励提交的多次重复测试数据,该重复测试数据仅通过措辞的变换,其包括的实质内容可以相同。在确定第一测试数据为同一用户提交的无效数据时,可以确定不收集第一测试数据。结合第一方面,在第一方面的某些可能的实现方式中,该方法还包括:向该第一测试数据对应的用户发送第一信息,该第一信息用于指示该第一测试数据提交失败。示例性地,可以当确定不收集第一测试数据时,向第一测试数据对应的用户发送第一信息,指示第一测试数据提交失败。同时,还可以启动权限管理。例如,处理平台可以对该用户设置提交权限,即处理平台可以不再接收该用户提交的测试数据。结合第一方面,在第一方面的某些可能的实现方式中,该根据该第一测试数据与该第二测试数据是否属于同一用户确定是否收集所述第一测试数据,包括:在该第一测试数据和该第二测试数据属于不同用户时,确定收集该第一测试数据;在该第一测试数据上增加标识信息,该标识信息用于指示该第一测试数据的重复次数或该相似度的信息。在本申请的实施例中,当第一测试数据和所述第二测试数据属于不同用户时,对第一测试数据与第二测试数据进行分析处理后,确定第一测试数据与第二测试数据的相似度大于第一阈值时,则可以说明第一测试数据和第二测试数据可以是不同的用户提交的相似数据。需要说明的是,对于多个用户独立提交的测试数据,无法避免不同用户提交相似的测试数据。此时,可以对处理平台接收到的除第一个测试数据外的其它的相似测试数据标记为重复测试数据。在导出汇总的测试数据时,可以对标记标识信息的测试数据不进行多次人工分析。结合第一方面,在第一方面的某些可能的实现方式中,该对该第一测试数据与第二测试数据进行对比,确定该第一测试数据与该第二数据的相似度,包括:基于自然语言处理算法对该第一测试数据与该第二测试数据进行对比,确定该第一测试数据和该第二测试数据的相似度。应理解,上述自然语言处理算法为举例说明,还可以是与自然语言处理算法具有相同功能的其它算法,例如,还可以是机器学习、深度学习、余弦定理等算法,本申请对此不作限定。结合第一方面,在第一方面的某些可能的实现方式中,当确定收集该第一测试数据时,该方法还包括:基于该第一测试数据,确定对该目标产品的竞品进行测试,该第一测试数据用于指示该目标产品的至少一个特征,该竞品是指该目标产品对应的同类产品;对该目标产品的竞品进行测试生成测试报告,其中,该测试报告包括该竞品基于所述第一测试数据中的该至少一个特征的测试结果;输出该测试报告。示例性地,竞品对比测试可以是对目标产品的竞品基于第一测试数据中的特征进行测试。例如,第一测试数据中可以包括“使用华为浏览器打开A网站时,字体排版出错”,则竞品测试可以是华为浏览器对应的同类产品,竞品测试可以是“使用360浏览器测试打开A网站是否存在同样的字体出错的问题”。结合第一方面,在第一方面的某些可能的实现方式中,该基于该第一测试数据,确定对该目标产品的竞品进行测试,包括:基于该第一测试数据,确定对该竞品进行测试的量化值,该量化值用于指示该测试的价值;当该量化值大于第二阈值时,确定对该目标产品的竞品进行测试。结合第一方面,在第一方面的某些可能的实现方式中,该方法还包括:确定该目标产品是否存在该竞品。在本申请的实施例中,在确定收集第一测本文档来自技高网...

【技术保护点】
1.一种应用于处理平台数据分析的方法,其特征在于,所述方法包括:获取目标产品的第一测试数据;对所述第一测试数据与第二测试数据进行对比,确定所述第一测试数据与所述第二数据的相似度,所述第二测试数据的获取时刻早于所述第一测试数据的获取时刻;根据所述相似度确定是否收集所述第一测试数据。

【技术特征摘要】
1.一种应用于处理平台数据分析的方法,其特征在于,所述方法包括:获取目标产品的第一测试数据;对所述第一测试数据与第二测试数据进行对比,确定所述第一测试数据与所述第二数据的相似度,所述第二测试数据的获取时刻早于所述第一测试数据的获取时刻;根据所述相似度确定是否收集所述第一测试数据。2.根据权利要求1所述的方法,其特征在于,所述根据所述相似度确定是否收集所述第一测试数据,包括:当所述相似度小于第一阈值时,确定收集所述第一测试数据。3.根据权利要求1或2所述的方法,其特征在于,所述根据所述相似度确定是否收集所述第一测试数据,包括:当所述相似度大于第一阈值时,根据所述第一测试数据与所述第二测试数据是否属于同一用户确定是否收集所述第一测试数据。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一测试数据与所述第二测试数据是否属于同一用户确定是否收集所述第一测试数据,包括:在所述第一测试数据和所述第二测试数据属于同一个用户时,确定不收集所述第一测试数据。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:向所述第一测试数据对应的用户发送第一信息,所述第一信息用于指示所述第一测试数据提交失败。6.根据权利要求3所述的方法,其特征在于,所述根据所述第一测试数据与所述第二测试数据是否属于同一用户确定是否收集所述第一测试数据,包括:在所述第一测试数据和所述第二测试数据属于不同用户时,确定收集所述第一测试数据;在所述第一测试数据上增加标识信息,所述标识信息用于指示所述第一测试数据的重复次数或所述相似度的信息。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述对所述第一测试数据与第二测试数据进行对比,确定所述第一测试数据与所述第二数据的相似度,包括:基于自然语言处理算法对所述第一测试数据与所述第二测试数据进行对比,确定所述第一测试数据和所述第二测试数据的相似度。8.根据权利要求1至7中任一项所述的方法,其特征在于,当确定收集所述第一测试数据时,所述方法还包括:基于所述第一测试数据,确定对所述目标产品的竞品进行测试,所述第一测试数据用于指示所述目标产品的至少一个特征,所述竞品是指所述目标产品对应的同类产品;对所述目标产品的竞品进行测试生成测试报告,其中,所述测试报告包括所述竞品基于所述第一测试数据中的所述至少一个特征的测试结果;输出所述测试报告。9.根据权利要求8所述的方法,其特征在于,所述基于所述第一测试数据,确定对所述目标产品的竞品进行测试,包括:基于所述第一测试数据,确定对所述竞品进行测试的量化值,所述量化值用于指示所述测试的价值;当所述量化值大于第二阈值时,确定对所述目标产品的竞品进行测试。10.根据权利要求8或9所述的方法,其特征在于,所述方法还包括:确定所述目标产品是否存在所述竞品。11.一种应用于处理平台数据分析的方法,其特征在于,所述方法包括:获取目标产品的第一测试数据,所述第一测试数据用于指示所述目标产品的至少一个特征,所述竞品是指所述目标产品对应的同类产品;基于所述第一测试数据,确定对所述目标产品的竞品进行测试;对所述目标产品的竞品进行测试生成测试报告,其中,所述测试报告包括所述竞品基于所述第一测试数据中的所述至少一个特征的测试结果;输出所述测试报告。12.根据权利要求11所述的方法,其特征在于,所述基于所述第一测试数据,确定对所述目标产品的竞品进行测试,包括:基于所述第一测试数据,确定对所述竞品进行测试的量化值,所述量化值用于指示所述测试的价值;当所述量化值大于第二阈值时,确定对所述目标产品的竞品进行测试。13.根据权利要求11或12所述的方法,其特征在于,所述方法还包括:确定所述目标产品是否存在所述竞品。14.一种应用于处理平台数据分析的装置,其特征在于,包括一个或多个处理器;存储器;多个应用程序;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述装置执行时,使得所述装置执行以下步骤:获取目标产品的第一测试数据;对所述第一测试数据与第二测试数据进行对比,确定所述第一测试数据与所述第二数据的相似度,所述第二测试数据的获取时刻早于所述第一测试数据的获取时刻;根据所述相似度确定是否收集所述...

【专利技术属性】
技术研发人员:印杰杜闯杨振兴郭亚峰栾江义
申请(专利权)人:华为终端有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1