服务器中数据的特征分析方法和装置制造方法及图纸

技术编号:16779336 阅读:55 留言:0更新日期:2017-12-12 23:44
本发明专利技术实施例涉及服务器中数据的特征分析方法和装置。该服务器包括待分析数据和数据库,该数据库包括至少一种数据类型以及每种数据类型对应的特征扩展规则,该方法包括:根据该数据库中该至少一种数据类型,确定该待分析数据的数据类型;确定该待分析数据的数据类型对应的特征扩展规则;根据该待分析数据的数据类型对应的特征扩展规则,确定该待分析数据的至少一个扩展特征以及每个扩展特征对应的数据;输出该待分析数据的该每个扩展特征对应的数据。本发明专利技术实施例的服务器中数据的特征分析方法和装置,可以实现从单一简单的数据类型出发,通过特征扩展规则挖掘出待分析数据的一系列扩展特征,减少数据分析时特征体系构建的工作量。

Data characteristic analysis method and device in server

An embodiment of the invention relates to a feature analysis method and a device for data in a server. The server includes data and database to be analyzed, the database includes characteristics corresponding to at least one data type and each data type extension rule, the method comprises: according to the at least one type of data in the database, the data to be analyzed to determine the type of data; feature analysis data types data expansion according to the characteristics of the rules; to analyze data types data expansion rules, determine the data to be analyzed at least one of the expansion characteristics of each extension corresponding to the characteristic data; the analysis of the output of each data corresponding to the characteristic of data expansion. Feature analysis method and device for data server in the embodiment of the invention, can be achieved on the basis of a single simple data types, through a series of feature expansion rule mining expansion characteristic of the data to be analyzed, to reduce the data analysis features of system construction work.

【技术实现步骤摘要】
服务器中数据的特征分析方法和装置
本专利技术涉及数据分析领域,尤其涉及对服务器中数据的特征分析方法和装置。
技术介绍
对于大数据的分析处理,由于模板匹配算法的处理速度快、可并行化执行等特点,因此在例如推荐系统、搜索引擎、在线广告、网站数字化运营等领域都得到了广泛运用。然而,大数据的模板匹配算法的效果非常依赖于输入的数据特征,也就是为大数据设置的特征工程可以决定处理大数据的精度上限,例如:在实际的电子商务个性化推荐系统的测试中,特征工程对整个数据的分类预测结果的影响最多可以达到80%左右。这使得特征工程的构建成为一个跟算法同等重要甚至在实际应用中比算法更为重要的工作。目前的模板匹配算法中特征工程的构建主要由人工进行自定义,例如:针对用户历史行为的待处理数据的特性,由领域专家预设用户历史行为特征的模板匹配算法、模板匹配参数、匹配度阈值等。这样,只能针对不同的业务知识来提取对应的特征,导致业务专家的参与时间较长,且特征提取准确度较低。
技术实现思路
本申请提供了一种服务器中数据的特征分析方法和装置,能够提高数据分类或预测的准确度。第一方面,提供了一种服务器中数据的特征分析方法,该服务器包括待分本文档来自技高网...
服务器中数据的特征分析方法和装置

【技术保护点】
一种服务器中数据的特征分析方法,其特征在于,所述服务器包括待分析数据和数据库,所述数据库包括至少一种数据类型、以及所述至少一种数据类型中每种数据类型对应的特征扩展规则,所述特征扩展规则用于将所述每种数据类型扩展为至少一个扩展特征,所述方法包括:根据所述数据库中所述至少一种数据类型,确定所述待分析数据的数据类型;确定所述待分析数据的数据类型对应的特征扩展规则;根据所述待分析数据的数据类型对应的特征扩展规则,确定所述待分析数据的至少一个扩展特征及每个扩展特征对应的数据;输出所述待分析数据的所述每个扩展特征对应的数据。

【技术特征摘要】
1.一种服务器中数据的特征分析方法,其特征在于,所述服务器包括待分析数据和数据库,所述数据库包括至少一种数据类型、以及所述至少一种数据类型中每种数据类型对应的特征扩展规则,所述特征扩展规则用于将所述每种数据类型扩展为至少一个扩展特征,所述方法包括:根据所述数据库中所述至少一种数据类型,确定所述待分析数据的数据类型;确定所述待分析数据的数据类型对应的特征扩展规则;根据所述待分析数据的数据类型对应的特征扩展规则,确定所述待分析数据的至少一个扩展特征及每个扩展特征对应的数据;输出所述待分析数据的所述每个扩展特征对应的数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述待分析数据的所述至少一个扩展特征中的一个或者多个扩展特征对应的数据,按照分类规则,对待分析数据进行分类处理。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述待分析数据的所述至少一个扩展特征中的一个或者多个扩展特征对应的数据,按照预测规则进行预测处理。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述数据库中所述至少一种数据类型,确定所述待分析数据的数据类型,包括:确定所述待分析数据的属性信息;根据所述数据库中所述至少一种数据类型和所述待分析数据的属性信息,确定所述待分析数据的数据类型。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:确定所述待分析数据的所述每个扩展特征的重要性;根据所述每个扩展特征的重要性,输出所述至少一个扩展特征中全部或部分扩展特征。6.一种用于分析数据特征的服务...

【专利技术属性】
技术研发人员:王堃欧阳志友岳东
申请(专利权)人:华为技术有限公司南京邮电大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1