The invention discloses a classification method, message device, communication terminal and server, the method comprises the following steps: segmentation of the target text, at least one word acquire the target text; at least one word vector obtained by the at least one word, and according to the at least one word vector and the word matrix generates the target message word vector; vector according to the theme of the at least one word for the target message belongs; according to the at least one word, the text word vector, the theme vector of the target text classification, the first type the target text belongs to, which solves the technical problem of word segmentation based only on the low accuracy in the classification, in order to improve the accuracy of the classification results of technical effect.
【技术实现步骤摘要】
本专利技术涉及通信
,尤其涉及一种对短信进行分类的方法、装置、通信终端及服务器。
技术介绍
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越来越多,人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的移动终端,享受随着科技发展带来的舒适生活。例如,智能手机、已经成为人们生活中一个重要的组成部分,用户可以使用智能手机打电话、收发短信等,实现随时随地快速通信。短信由于其具有短小精要、成本低廉等优点被人们广泛的使用,也正因为它使用的广泛和成本低廉常被广告商、不法分子等所利用。人们常常会收到诸多垃圾短信,如:诈骗短信、广告短信、骚扰短信等等。为了避免这些对用户来说无用设置有害的垃圾短信对用户造成困扰,现有技术会对用户目标短信进行分类,然后将属于垃圾短信的这类短信以及用户标记的不想收到的短信进行拦截。现有技术中,对短信进行分类时,通常是先对短信进行分词,然后将分词输入分类模型中进行分类,这种仅根据分词进行分类的方式仅从分词层面上考虑短信的特征属性,导致其分类结果存在精确度较低的技术问题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种对短信进行分类的方法、装置、通信终端及服务器。本专利技术的一个方面,提供了一种对短信进行分类的方法,包括:对目标短信进行分词,获得所述目标短信的至少一个分词;获得所
【技术保护点】
一种对短信进行分类的方法,其特征在于,包括:对目标短信进行分词,获得所述目标短信的至少一个分词;获得所述至少一个分词的至少一个词向量,及根据所述至少一个词向量及语料词矩阵生成所述目标短信的短信词向量;根据所述至少一个分词获得所述目标短信所属的主题向量;根据所述至少一个分词、所述短信词向量、所述主题向量对所述目标短信进行分类,获得所述目标短信所属的第一类型。
【技术特征摘要】
1.一种对短信进行分类的方法,其特征在于,包括:
对目标短信进行分词,获得所述目标短信的至少一个分词;
获得所述至少一个分词的至少一个词向量,及根据所述至少一个词向量及
语料词矩阵生成所述目标短信的短信词向量;
根据所述至少一个分词获得所述目标短信所属的主题向量;
根据所述至少一个分词、所述短信词向量、所述主题向量对所述目标短信
进行分类,获得所述目标短信所属的第一类型。
2.如权利要求1所述的方法,其特征在于,所述获得所述至少一个分词
的至少一个词向量,及根据所述至少一个词向量及语料词矩阵生成所述目标短
信的短信词向量,包括:
分别将所述至少一个分词中各分词输入词向量工具获得所述至少一个词
向量;
将所述至少一个词向量中所有词向量及所述语料词矩阵相乘获得所述短
信词向量。
3.如权利要求1所述的方法,其特征在于,根据所述至少一个分词获得
所述目标短信所述的主题向量,包括:
将所述至少一个分词中的所有分词输入语义主题生成模型获得所述主题
向量。
4.如权利要求1所述的方法,其特征在于,根据所述至少一个分词、所
述短信词向量、所述主题向量对所述目标短信进行分类,获得所述目标短信所
属的第一类型,包括:
将所述至少一个分词中的每个分词作为一个第一特征,所述短信词向量作
为第二特征,所述主题向量作为第三特征;
将所有所述第一特征、所述第二特征及所述第三特征组合成一特征矩阵;
将所述特征矩阵输入短信分类模型对所述目标短信进行分类,获得所述目
标短信所属的第一类型。
5.如权利要求4所述的方法,其特征在于,所述短信分类模型通过如下
方法获得:
采用预置的短信分类规则,构造多分类的短信分类模型,其中,...
【专利技术属性】
技术研发人员:张金晶,常富洋,李强,
申请(专利权)人:北京奇虎科技有限公司,奇智软件北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。