The embodiment of the invention provides an information processing method and device, wherein the method comprises the following steps: first to obtain information of each object; according to the first information acquiring multiple values, and, according to the first generation of the multiple numerical vector of the object, wherein each of the number of values used to describe from the first the information of different dimensions; access between the first and 22 vector distance, according to the distance to cluster the first vector to complete the information processing. An important step of data mining is data clustering, the embodiment of the invention to obtain each object (e.g. business) the first information (e.g. activity description information), according to the values of various dimension contained in the first information of each object in the object generates a vector for each one, and then on the basis of the first vector. In order to achieve the object clustering, clustering, so it can greatly improve the efficiency of data mining on the network information platform, save the information processing time.
【技术实现步骤摘要】
本专利技术涉及网络数据挖掘
,尤其涉及一种信息处理方法及装置。
技术介绍
随着信息技术的不断发展,互联网已深入到各个领域,涌现出大量的购物平台、外卖平台、打车平台等网络信息平台。这些网络信息平台上活动(例如各种促销活动)众多,所产生的数据(即活动描述信息)往往种类繁多,信息量很大,若要从中挖掘出有价值的内容并非易事。在现有技术中,为了从众多数据中挖掘出有价值的内容,往往需要动用人工进行调研和分析,经过数据筛选最后提炼出有价值的信息。专利技术人在实现本专利技术的过程中发现,由于分析的工作量很大,使得现有技术中的这类方案成本较高,且周期较长,时效性差,无法应对当前网络信息的快速变化。
技术实现思路
本专利技术提供一种信息处理方法及装置,以提高网络信息平台上的数据挖掘效率。根据本专利技术实施例的第一方面,提供一种信息处理方法,所述方法包括:获取每个对象的第一信息;根据所述第一信息获取多个数值,以及,根据所述多个数值生成所述对象的第一向量,其中每个所述数值用于从不同维度对所述第一信息进行描述;获取所述第一向量两两之间的距离,以及,根据所述距离对所述第一向量进行聚类以完成信息处理。可选的,所述第一信息为用于描述所述对象所涉及的活动的活动描述信息。可选的,所述获取所述第一向量两两之间的距离,包括:计算所述第一向量两两之间的皮尔逊相关系数以作为所述第一向量两两之间的距离。可选的,所述多个数值中包括当前对象的配送面积;根据所述第一信息获取当前对象的配送面积,包括:对当前对象所处的区域进行网格划分;获取网格中每个交点所涉及的对象;根据每个交点所涉及的对象,获取当前对象所 ...
【技术保护点】
一种信息处理方法,其特征在于,所述方法包括:获取每个对象的第一信息;根据所述第一信息获取多个数值,以及,根据所述多个数值生成所述对象的第一向量,其中每个所述数值用于从不同维度对所述第一信息进行描述;获取所述第一向量两两之间的距离,以及,根据所述距离对所述第一向量进行聚类以完成信息处理。
【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:获取每个对象的第一信息;根据所述第一信息获取多个数值,以及,根据所述多个数值生成所述对象的第一向量,其中每个所述数值用于从不同维度对所述第一信息进行描述;获取所述第一向量两两之间的距离,以及,根据所述距离对所述第一向量进行聚类以完成信息处理。2.根据权利要求1所述的方法,其特征在于,所述第一信息为用于描述所述对象所涉及的活动的活动描述信息。3.根据权利要求1所述的方法,其特征在于,所述获取所述第一向量两两之间的距离,包括:计算所述第一向量两两之间的皮尔逊相关系数以作为所述第一向量两两之间的距离。4.根据权利要求1所述的方法,其特征在于,所述多个数值中包括当前对象的配送面积;根据所述第一信息获取当前对象的配送面积,包括:对当前对象所处的区域进行网格划分;获取网格中每个交点所涉及的对象;根据每个交点所涉及的对象,获取当前对象所涉及的交点,并将当前对象所涉及的交点的集合确定为配送范围;根据所述配送范围获取当前对象的配送面积。5.根据权利要求4所述的方法,其特征在于,所述根据每个交点所涉及的对象,获取当前对象所涉及的交点,包括:对每个交点所涉及的对象进行倒排计算后生成key-value列表,以得到每个对象所涉及的交点,其中key代表对象,value代表对象所涉及的交点;从每个对象所涉及的交点中确定当前对象所涉及的交点。6.根据权利要求4所述的方法,其特征在于,在所述根据所述配送范围获取当前对象的配送面积之后,所述方法还包括:接收对所述配送范围的显示指令;根据所述显示指令绘制并显示所述配送范围。7.根据权利要求6所述的方法,其特征在于,所述根据所述显示指令绘制并显示所述配送范围,包括:在当前对象所涉及的交点的集合中,将指定交点确定为边界点,其中所述指定交点为至少在一个方向上与配送范围内的其他交点不相邻的交点;从一个边界点开始,以选择和当前边界点距离最近的边界点为当前边界点的相邻边界点为规则,为各边界点排序;将冗余边界点剔除,其中所述冗余边界点是未作为所述配送范围所围成的多边形的边线转折点的边界点;根据剔除后剩余的边界点绘制并显示所述配送范围。8.一种信息处理装置,其特征在于,...
【专利技术属性】
技术研发人员:龚廖安,梁福坤,马超,杜洪先,崔代锐,
申请(专利权)人:北京小度信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。