一种短信分组方法、装置及计算机存储介质、电子设备制造方法及图纸

技术编号:23193478 阅读:30 留言:0更新日期:2020-01-24 17:09
一种短信分组方法、装置及计算机存储介质、电子设备,包括:确定待分组的多个短信;计算所述多个短信之间的短信距离矩阵;根据所述短信距离矩阵将所述多个短信进行聚类,得到多个聚类簇;每个聚类簇包括一个或多个短信;计算所述多个聚类簇之间的聚类簇距离矩阵;根据所述聚类簇距离矩阵将所述多个聚类簇进行聚类,重复计算距离矩阵直至没有新的聚类簇生成为止。采用本申请中的方案,可以更好的管理收到的短信,将同一机构的不同号码发送的同一类型的短信进行合并分组,将同一号码发送的不同类型的短信进行合并分组,方便用户浏览短信内容。

A short message grouping method, device, computer storage medium and electronic equipment

【技术实现步骤摘要】
一种短信分组方法、装置及计算机存储介质、电子设备
本申请涉及移动通信技术,具体地,涉及一种短信分组方法、装置及计算机存储介质、电子设备。
技术介绍
目前,智能手机短信分组通常是基于电话号码分组,将相同电话号码发送的短信在一组显示。然而,同一企业可能会有多个发送号码且这些号码可能经常变化,同一企业的不同号码可能会发送内容相同或相似的短信,例如:营销信息、消费提醒、账单提醒等信息。当这些号码发送的短信按照现有短信分组方式分组时,会出现用户分组过多,且不同组的短信内容相似的问题。此外,还可能同一号码发送多种类型的短信,例如:银行发送的交易提醒、还款提醒、营销推送等信息。对于这种情况采用现有短信分组方式可能导致同一组内的短信类别杂乱无章。现有技术中存在的问题:采用电话号码进行短信分组可能导致分组过多、不同组或同一组内的短信类别混乱。
技术实现思路
本申请实施例中提供了一种短信分组方法、装置及计算机存储介质、电子设备,以解决上述技术问题。根据本申请实施例的第一个方面,提供了一种短信分组方法,包括:步骤1、确定待分组的短信;步骤2、计算短信之间的短信距离矩阵;步骤3、根据所述短信距离矩阵对多个短信进行聚类,得到多个聚类簇;每个聚类簇包括一个或多个短信;步骤4、计算所述多个聚类簇之间的聚类簇距离矩阵;步骤5、根据所述聚类簇距离矩阵将所述多个聚类簇进行聚类,若生成新的聚类簇返回步骤4;否则,执行步骤6;步骤6、按照所述聚类簇确定所述短信的分组;其中,每次聚类时所采用的距离阈值不同。根据本申请实施例的第二个方面,提供了一种短信分组装置,包括:确定模块,用于确定待分组的短信;第一计算模块,用于计算多个短信之间的短信距离矩阵;第一聚类模块,用于根据所述短信距离矩阵对多个短信进行聚类,得到多个聚类簇;每个聚类簇包括一个或多个短信;第二计算模块,用于计算所述多个聚类簇之间的聚类簇距离矩阵;第二聚类模块,用于根据所述聚类簇距离矩阵将所述多个聚类簇进行聚类,若生成新的聚类簇触发第二计算模块;否则触发分组模块;其中,第一聚类模块和第二聚类模块、以及第二聚类模块每次聚类时所采用的距离阈值均不同;分组模块,用于按照所述聚类簇确定所述短信的分组。第三个方面,本申请实施例提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。第四个方面,本申请实施例提供了一种电子设备,其特征在于,包括存储器、以及一个或多个处理器,所述存储器用于存储一个或多个程序;所述一个或多个程序被所述一个或多个处理器执行时,实现如上所述的方法。采用本申请实施例中提供的短信分组方法、装置及计算机存储介质、电子设备,由于本申请实施例是对短信的内容进行距离计算以及不断聚类实现的短信分组,解决了现有技术中根据电话号码进行短信分组的诸多问题,可以更好的管理收到的短信,将同一机构的不同号码发送的同一类型的短信进行合并分组,将同一号码发送的不同类型的短信进行合并分组,方便用户浏览短信内容。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1示出了本申请实施例中短信分组方法实施的流程示意图;图2示出了本申请实施例二中短信分组装置的结构示意图;图3示出了本申请实施例四中电子设备的结构示意图;图4示出了现有技术中短信分组的效果示意图一;图5示出了本申请实施例中短信分组的效果示意图一;图6示出了现有技术中短信分组的效果示意图二;图7示出了本申请实施例中短信分组的效果示意图二。具体实施方式在实现本申请的过程中,专利技术人发现:传统的文本分类技术可以应用到短信分组问题的解决上,但由于传统的文本分类技术是基于词袋特征的聚类模型(LDA模型,LatentDirichletAllocation),没有考虑词与词之间的顺序,例如:“我喜欢你”和“你喜欢我”两个短信内容,都是“我”、“喜欢”、“你”这3个词组成,传统文本聚类技术会认为这两句话意思相同,不能有效区分两个短信之间的不同。因此,采用传统的文本分类技术实现短信分组的效果一般。针对上述问题,本申请实施例中提供了一种短信分组方法、装置及计算机存储介质、电子设备,可以将不同电话号码发送的相同或相似的短信分为一组,而且,考虑到企业不同的业务会用不同的短信模板发送给用户,本申请实施例提出了将同一号码发送的多种业务模板短信按照业务类型进行分组,从而方便用户按业务类型(短信模板)浏览短信。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。为了使本申请实施例中的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。实施例一图1示出了本申请实施例中短信分组方法实施的流程示意图。如图所示,所述短信分组方法,包括:步骤1、确定待分组的短信;步骤2、计算短信之间的短信距离矩阵;步骤3、根据所述短信距离矩阵对多个短信进行聚类,得到多个聚类簇;每个聚类簇包括一个或多个短信;步骤4、计算所述多个聚类簇之间的聚类簇距离矩阵;步骤5、根据所述聚类簇距离矩阵将所述多个聚类簇进行聚类,若生成新的聚类簇返回步骤4;否则,执行步骤6;步骤6、按照所述聚类簇确定所述短信的分组;其中,每次聚类时所采用的距离阈值不同。具体实施时,所述确定待分组的短信可以是一个,也可以是多个。在所述待分组的短信为一个时,后续计算短信之间的短信距离矩阵可以是将所述待分组的短信与已有(或已分组)的一个或多个短信进行两两计算;在所述待分组的短信为多个时,后续计算短信之间的短信距离矩阵可以既包括将所述待分组的短信与已有(或已分组)的一个或多个短信进行两两计算,也包括将所述待分组的多个短信之间进行两两计算。通常短信可以包括发送短信的号码以及短信内容,本申请实施例所述的对短信的计算或聚类指的是对短信内容的计算或聚类操作。本申请实施例首先对多个短信进行短信距离矩阵计算,然后根据短信距离矩阵对多个短信进行聚类得到多个聚类簇,接着对聚类簇进行距离矩阵计算、进一步聚类,直至无法再进行新的聚类为止,最终根据确定的聚类簇即可知道该待分组的短信属于哪一组。具体实施时,所述步骤2采用的距离矩阵计算方式可以与所述步骤4采用的距离矩阵计算方式相同,所述步骤3采用的聚类方式可以与所述步骤5采用的聚类方式相同,区别可能在于输入的参数不同,步骤本文档来自技高网...

【技术保护点】
1.一种短信分组方法,其特征在于,包括:/n步骤1、确定待分组的短信;/n步骤2、计算短信之间的短信距离矩阵;/n步骤3、根据所述短信距离矩阵对多个短信进行聚类,得到多个聚类簇;每个聚类簇包括一个或多个短信;/n步骤4、计算所述多个聚类簇之间的聚类簇距离矩阵;/n步骤5、根据所述聚类簇距离矩阵将所述多个聚类簇进行聚类,若生成新的聚类簇返回步骤4;否则,执行步骤6;/n步骤6、按照所述聚类簇确定所述短信的分组;/n其中,每次聚类时所采用的距离阈值不同。/n

【技术特征摘要】
1.一种短信分组方法,其特征在于,包括:
步骤1、确定待分组的短信;
步骤2、计算短信之间的短信距离矩阵;
步骤3、根据所述短信距离矩阵对多个短信进行聚类,得到多个聚类簇;每个聚类簇包括一个或多个短信;
步骤4、计算所述多个聚类簇之间的聚类簇距离矩阵;
步骤5、根据所述聚类簇距离矩阵将所述多个聚类簇进行聚类,若生成新的聚类簇返回步骤4;否则,执行步骤6;
步骤6、按照所述聚类簇确定所述短信的分组;
其中,每次聚类时所采用的距离阈值不同。


2.根据权利要求1所述的方法,其特征在于,所述计算短信之间的短信距离矩阵,包括:
根据所述短信中的内容计算两个短信之间的最长公共子字符串s的长度c;
根据两个短信之间的最长公共子字符串s的长度c计算所述两个短信之间的距离l;
根据每两个短信之间的距离l得到所有短信的距离矩阵。


3.根据权利要求2所述的方法,其特征在于,所述根据所述短信中的内容计算两个短信之间的最长公共子字符串s的长度c,具体按照下式计算:



其中,xi、yj分别为短信a中第i个字符、短信b中第j个字符,c[i,j]为短信a与短信b之间的公共子字符串长度。


4.根据权利要求3所述的方法,其特征在于,所述根据两个短信之间的最长公共子字符串s的长度c计算所述两个短信之间的距离l,具体按照下式计算:



其中,lab为短信a和短信b之间的距离,大小在0-1之间;len(a)、len(b)分别为短信a、短信b的长度;c为公共子字符串长度c[i,j]的最大值。


5.根据权利要求1所述的方法,其特征在于,所述根据所述短信距离矩阵对多个短信进行聚类,得到多个聚类簇,包括:
以每个短信为中心,计算与该中心的距离d小于预设第一距离阈值的短信集合;
将每个短信作为核心对象,根据以该短信为中心的短信集合确定与该短信密度直达的短信;
根据所述密度直达的短信确定与所述短信密度可达的短信;
根...

【专利技术属性】
技术研发人员:龚伟松郭得庆
申请(专利权)人:上海凯京信达科技集团有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1