一种信息处理方法及装置制造方法及图纸

技术编号:16069200 阅读:98 留言:0更新日期:2017-08-25 09:02
本发明专利技术实施例提供了一种信息处理方法及装置,其中方法包括:获取每个对象的第一信息;根据所述第一信息获取多个数值,以及,根据所述多个数值生成所述对象的第一向量,其中每个所述数值用于从不同维度对所述第一信息进行描述;获取所述第一向量两两之间的距离,以及,根据所述距离对所述第一向量进行聚类以完成信息处理。数据挖掘的重要步骤是数据的聚类,为此本发明专利技术实施例先获取每个对象(例如商家)的第一信息(例如活动描述信息),根据每个对象的第一信息中所包含的各种维度下的数值为每个对象生成第一向量,然后在此基础上对第一向量进行聚类,从而实现了对象的聚类,这样便可大大提高网络信息平台上的数据挖掘效率,节省了信息处理时间。

Information processing method and device

The embodiment of the invention provides an information processing method and device, wherein the method comprises the following steps: first to obtain information of each object; according to the first information acquiring multiple values, and, according to the first generation of the multiple numerical vector of the object, wherein each of the number of values used to describe from the first the information of different dimensions; access between the first and 22 vector distance, according to the distance to cluster the first vector to complete the information processing. An important step of data mining is data clustering, the embodiment of the invention to obtain each object (e.g. business) the first information (e.g. activity description information), according to the values of various dimension contained in the first information of each object in the object generates a vector for each one, and then on the basis of the first vector. In order to achieve the object clustering, clustering, so it can greatly improve the efficiency of data mining on the network information platform, save the information processing time.

【技术实现步骤摘要】

本专利技术涉及网络数据挖掘
,尤其涉及一种信息处理方法及装置
技术介绍
随着信息技术的不断发展,互联网已深入到各个领域,涌现出大量的购物平台、外卖平台、打车平台等网络信息平台。这些网络信息平台上活动(例如各种促销活动)众多,所产生的数据(即活动描述信息)往往种类繁多,信息量很大,若要从中挖掘出有价值的内容并非易事。在现有技术中,为了从众多数据中挖掘出有价值的内容,往往需要动用人工进行调研和分析,经过数据筛选最后提炼出有价值的信息。专利技术人在实现本专利技术的过程中发现,由于分析的工作量很大,使得现有技术中的这类方案成本较高,且周期较长,时效性差,无法应对当前网络信息的快速变化。
技术实现思路
本专利技术提供一种信息处理方法及装置,以提高网络信息平台上的数据挖掘效率。根据本专利技术实施例的第一方面,提供一种信息处理方法,所述方法包括:获取每个对象的第一信息;根据所述第一信息获取多个数值,以及,根据所述多个数值生成所述对象的第一向量,其中每个所述数值用于从不同维度对所述第一信息进行描述;获取所述第一向量两两之间的距离,以及,根据所述距离对所述第一向量进行聚类以完成信息处理。可选的,所述第一信息为用于描述所述对象所涉及的活动的活动描述信息。可选的,所述获取所述第一向量两两之间的距离,包括:计算所述第一向量两两之间的皮尔逊相关系数以作为所述第一向量两两之间的距离。可选的,所述多个数值中包括当前对象的配送面积;根据所述第一信息获取当前对象的配送面积,包括:对当前对象所处的区域进行网格划分;获取网格中每个交点所涉及的对象;根据每个交点所涉及的对象,获取当前对象所涉及的交点,并将当前对象所涉及的交点的集合确定为配送范围;根据所述配送范围获取当前对象的配送面积。可选的,所述根据每个交点所涉及的对象,获取当前对象所涉及的交点,包括:对每个交点所涉及的对象进行倒排计算后生成key-value列表,以得到每个对象所涉及的交点,其中key代表对象,value代表对象所涉及的交点;从每个对象所涉及的交点中确定当前对象所涉及的交点。可选的,在所述根据所述配送范围获取当前对象的配送面积之后,所述方法还包括:接收对所述配送范围的显示指令;根据所述显示指令绘制并显示所述配送范围。可选的,所述根据所述显示指令绘制并显示所述配送范围,包括:在当前对象所涉及的交点的集合中,将指定交点确定为边界点,其中所述指定交点为至少在一个方向上与配送范围内的其他交点不相邻的交点;从一个边界点开始,以选择和当前边界点距离最近的边界点为当前边界点的相邻边界点为规则,为各边界点排序;将冗余边界点剔除,其中所述冗余边界点是未作为所述配送范围所围成的多边形的边线转折点的边界点;根据剔除后剩余的边界点绘制并显示所述配送范围。根据本专利技术实施例的第二方面,提供一种信息处理装置,所述装置包括:信息获取模块,用于获取每个对象的第一信息;向量生成模块,用于根据所述第一信息获取多个数值,以及,根据所述多个数值生成所述对象的第一向量,其中每个所述数值用于从不同维度对所述第一信息进行描述;聚类模块,用于获取所述第一向量两两之间的距离,以及,根据所述距离对所述第一向量进行聚类以完成信息处理。可选的,所述第一信息为用于描述所述对象所涉及的活动的活动描述信息。可选的,所述聚类模块在获取所述第一向量两两之间的距离时,用于:计算所述第一向量两两之间的皮尔逊相关系数以作为所述第一向量两两之间的距离。可选的,所述多个数值中包括当前对象的配送面积;所述向量生成模块包括:网格划分子模块,用于对当前对象所处的区域进行网格划分;召回子模块,用于获取网格中每个交点所涉及的对象;倒排计算子模块,用于根据每个交点所涉及的对象,获取当前对象所涉及的交点,并将当前对象所涉及的交点的集合确定为配送范围;面积获取子模块,用于根据所述配送范围获取当前对象的配送面积。可选的,所述倒排计算子模块用于:对每个交点所涉及的对象进行倒排计算后生成key-value列表,以得到每个对象所涉及的交点,其中key代表对象,value代表对象所涉及的交点;从每个对象所涉及的交点中确定当前对象所涉及的交点。可选的,所述装置还包括:显示模块,用于接收对所述配送范围的显示指令,根据所述显示指令绘制并显示所述配送范围。可选的,所述显示模块在根据所述显示指令绘制并显示所述配送范围时,用于:在当前对象所涉及的交点的集合中,将指定交点确定为边界点,其中所述指定交点为至少在一个方向上与配送范围内的其他交点不相邻的交点;从一个边界点开始,以选择和当前边界点距离最近的边界点为当前边界点的相邻边界点为规则,为各边界点排序;将冗余边界点剔除,其中所述冗余边界点是未作为所述配送范围所围成的多边形的边线转折点的边界点;根据剔除后剩余的边界点绘制并显示所述配送范围。本专利技术的实施例提供的技术方案可以包括以下有益效果:专利技术人在实现本专利技术的过程中发现,数据挖掘的重要步骤是数据的聚类,当实现了聚类后再进行分析就方便很多了,为此本专利技术实施例先获取每个对象(例如商家)的第一信息(例如活动描述信息),根据每个对象的第一信息中所包含的各种维度下的数值为每个对象生成第一向量,然后在此基础上对第一向量进行聚类,从而实现了对象的聚类,这样便可大大提高网络信息平台上的数据挖掘效率,节省了信息处理时间。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。此外,这些介绍并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。图1是根据本专利技术一示例性实施例示出的一种信息处理方法的流程图;图2是根据本专利技术一示例性实施例示出的一种信息处理方法的流程图;图3是根据本专利技术一示例性实施例示出的召回点示意图;图4是根据本专利技术一示例性实施例示出的一种信息处理方法的流程图;图5是根据本专利技术一示例性实施例示出的配送范围示意图;图6是根据本专利技术一示例性实施例示出的一种信息处理装置的示意图;图7是根据本专利技术一示例性实施例示出的一种信息处理装置的示意图;图8是根据本专利技术一示例性实施例示出的一种信息处理装置的示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1是根据本专利技术一示例性实施例示出的一种信息处理方法的流程图。该方法例如可以用于个人电脑或服务器等设备。参见图1所示,该方法可以包括如下步骤:步骤S101,获取每个对象的第一信息。作为示例,对象可以是网络信息平台上的商品\\服务的提供方,如商家等。所述第一信息可以为用于描述所述对象所涉及的活动的活动描述信息。对于各种网络信息平台,例如购物平台、外卖平台、打车平台等,这些网络信息平台上会经常产生活动,如本文档来自技高网...
一种信息处理方法及装置

【技术保护点】
一种信息处理方法,其特征在于,所述方法包括:获取每个对象的第一信息;根据所述第一信息获取多个数值,以及,根据所述多个数值生成所述对象的第一向量,其中每个所述数值用于从不同维度对所述第一信息进行描述;获取所述第一向量两两之间的距离,以及,根据所述距离对所述第一向量进行聚类以完成信息处理。

【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:获取每个对象的第一信息;根据所述第一信息获取多个数值,以及,根据所述多个数值生成所述对象的第一向量,其中每个所述数值用于从不同维度对所述第一信息进行描述;获取所述第一向量两两之间的距离,以及,根据所述距离对所述第一向量进行聚类以完成信息处理。2.根据权利要求1所述的方法,其特征在于,所述第一信息为用于描述所述对象所涉及的活动的活动描述信息。3.根据权利要求1所述的方法,其特征在于,所述获取所述第一向量两两之间的距离,包括:计算所述第一向量两两之间的皮尔逊相关系数以作为所述第一向量两两之间的距离。4.根据权利要求1所述的方法,其特征在于,所述多个数值中包括当前对象的配送面积;根据所述第一信息获取当前对象的配送面积,包括:对当前对象所处的区域进行网格划分;获取网格中每个交点所涉及的对象;根据每个交点所涉及的对象,获取当前对象所涉及的交点,并将当前对象所涉及的交点的集合确定为配送范围;根据所述配送范围获取当前对象的配送面积。5.根据权利要求4所述的方法,其特征在于,所述根据每个交点所涉及的对象,获取当前对象所涉及的交点,包括:对每个交点所涉及的对象进行倒排计算后生成key-value列表,以得到每个对象所涉及的交点,其中key代表对象,value代表对象所涉及的交点;从每个对象所涉及的交点中确定当前对象所涉及的交点。6.根据权利要求4所述的方法,其特征在于,在所述根据所述配送范围获取当前对象的配送面积之后,所述方法还包括:接收对所述配送范围的显示指令;根据所述显示指令绘制并显示所述配送范围。7.根据权利要求6所述的方法,其特征在于,所述根据所述显示指令绘制并显示所述配送范围,包括:在当前对象所涉及的交点的集合中,将指定交点确定为边界点,其中所述指定交点为至少在一个方向上与配送范围内的其他交点不相邻的交点;从一个边界点开始,以选择和当前边界点距离最近的边界点为当前边界点的相邻边界点为规则,为各边界点排序;将冗余边界点剔除,其中所述冗余边界点是未作为所述配送范围所围成的多边形的边线转折点的边界点;根据剔除后剩余的边界点绘制并显示所述配送范围。8.一种信息处理装置,其特征在于,...

【专利技术属性】
技术研发人员:龚廖安梁福坤马超杜洪先崔代锐
申请(专利权)人:北京小度信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1