短信识别方法及装置制造方法及图纸

技术编号:19328271 阅读:36 留言:0更新日期:2018-11-03 15:07
本发明专利技术公开了一种短信识别方法及装置,属于信息技术领域。该方法包括:获取待识别短信的地理位置信息和时间信息;基于时空概率关系以及待识别短信的地理位置信息和时间信息,得到待识别短信对应的识别概率,时空概率关系根据恶意短信的地理位置信息和时间信息得到,是指地理位置信息、时间信息与识别概率之间的关系,识别概率是指为恶意短信的概率;基于待识别短信对应的识别概率,识别待识别短信是否为恶意短信,恶意短信是指来自于伪基站的短信。本发明专利技术通过基于时空概率关系以及待识别短信的地理位置信息和时间信息,得到待识别短信对应的识别概率,使得识别过程更加准确、可靠。

Short message recognition method and device

The invention discloses a short message recognition method and a device, belonging to the field of information technology. The method includes: acquiring the geographic location information and time information of the short message to be identified; obtaining the recognition probability of the short message to be identified based on the spatial-temporal probability relationship and the geographic location information and time information of the short message to be identified; and obtaining the spatial-temporal probability relationship according to the geographic location information and time information of the malicious short message. According to the relationship between location information, time information and recognition probability, recognition probability refers to the probability of malicious short messages; based on the corresponding recognition probability of the short messages to be identified, whether the short messages to be identified are malicious short messages or not, malicious short messages refer to short messages from pseudo base stations. The method obtains the corresponding recognition probability of the short message to be identified by using the spatial-temporal probability relationship and the geographic location information and time information of the short message to be identified, so as to make the recognition process more accurate and reliable.

【技术实现步骤摘要】
短信识别方法及装置
本专利技术涉及信息
,特别涉及一种短信识别方法及装置。
技术介绍
随着信息技术的发展,用户之间的交流变得快捷方便。然而,通过伪基站群发恶意短信等不法行为也在日益猖獗。伪基站一般由主机和笔记本电脑组成,能够搜索附近的终端,并通过伪装成运营商的基站,向附近的终端发送短信。由于来自于伪基站的短信通常包含诈骗、营销等恶意信息,往往将来自于伪基站的短信作为恶意短信,识别该恶意短信的方法也备受关注。基于恶意短信一般包含银行扣款、钱包等敏感词的特点以及伪基站的参数一般与正常基站的参数不同的特点,在识别一条短信是否为恶意短信时,终端可以根据已配置的敏感词和正常基站的参数,如果该条短信的内容匹配了敏感词,且终端当前连接的基站的参数不符合正常基站的参数时,可以将该条短信作为恶意短信,否则,将该条短信作为正常短信。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:恶意短信的内容很容易通过拼音、同义词等方式避开敏感词,而且,不法分子也可以将伪基站的参数设置为正常基站的参数,导致终端不能识别出恶意短信,因此上述短信识别的方法准确性差、可靠性低。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种短信识别方法及装置。所述技术方案如下:一方面,提供了一种短信识别方法,所述方法包括:获取待识别短信的地理位置信息和时间信息;基于时空概率关系以及所述待识别短信的地理位置信息和时间信息,得到所述待识别短信对应的识别概率,所述时空概率关系根据恶意短信的地理位置信息和时间信息得到,是指地理位置信息、时间信息与识别概率之间的关系,所述识别概率是指为恶意短信的概率;基于所述待识别短信对应的识别概率,识别所述待识别短信是否为恶意短信,所述恶意短信是指来自于伪基站的短信。另一方面,提供了一种短信识别装置,所述装置包括:第一获取模块,用于获取待识别短信的地理位置信息和时间信息;第二获取模块,用于基于时空概率关系以及所述待识别短信的地理位置信息和时间信息,得到所述待识别短信对应的识别概率,所述时空概率关系根据恶意短信的地理位置信息和时间信息得到,是指地理位置信息、时间信息与识别概率之间的关系,所述识别概率是指为恶意短信的概率;识别模块,用于基于所述待识别短信对应的识别概率,识别所述待识别短信是否为恶意短信,所述恶意短信是指来自于伪基站的短信。本专利技术实施例通过基于时空概率关系以及待识别短信的地理位置信息和时间信息,得到待识别短信对应的识别概率,由于该时空概率关系是指地理位置信息、时间信息与识别概率之间的关系,则该识别概率可以合理地评估该待识别短信为恶意短信的概率,因此基于该待识别短信对应的识别概率进行识别更加准确、可靠。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种短信识别的实施环境示意图;图2A是本专利技术实施例提供的一种短信识别方法的流程图;图2B是本专利技术实施例提供的一种获取短信识别模型的模块图;图3是本专利技术实施例提供的一种短信识别方法的流程图;图4是本专利技术实施例提供的一种短信识别装置的框图;图5是本专利技术实施例提供的一种短信识别装置的框图;图6是本专利技术实施例提供的一种终端结构示意图;图7是本专利技术实施例提供的一种服务器的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。图1是本专利技术实施例提供的一种短信识别的实施环境示意图。参见图1,该实施环境中包括:至少一个服务器101和至少一个终端102。其中,服务器101用于根据时空概率关系函数以及待识别短信的地理位置信息和时间信息识别该待识别短信是否为恶意短信。该服务器101还可以用于将该时空概率关系函数存储至终端102,并更新该终端102已存储的时空概率关系函数。另外,该服务器101还可以配置至少一个数据库,如,恶意短信数据库、用户数据库等等。该恶意短信数据库用于存储多条恶意短信的内容、时间信息和地理位置信息等,服务器101可以根据终端102上传的每条恶意短信的内容、时间信息和地理位置信息等建立该恶意短信数据库。该用户数据库用于存储该服务器101所服务的用户的用户名和密码等个人数据。图2A是本专利技术实施例提供的一种短信识别方法的流程图,参见图2A,该方法可以应用于任一设备,以该设备为服务器为例,包括以下步骤:201、服务器获取已识别的多条恶意短信的地理位置信息和时间信息。对于每条已识别的恶意短信,该条恶意短信的地理位置信息用于指示发送该条恶意短信的伪基站所在的地理位置,该地理位置信息的形式不限于经纬度坐标或者墨卡托坐标等,该条恶意短信的时间信息用于指示该伪基站发送该恶意短信的时间。本专利技术实施例对获取多条恶意短信的地理位置信息和时间信息的方式不做限定。例如,服务器从恶意短信数据库中提取每条恶意短信的时间信息和地理位置信息,该恶意短信数据库用于存储多条恶意短信的内容、时间信息和地理位置信息等。该恶意短信数据库的建立方式可以为:当任一终端将某一短信确定为恶意短信后,可以将该恶意短信的内容、当前的时间信息和当前定位的地理位置信息等上传至服务器,使得服务器基于各个终端上传的信息建立该恶意短信数据库。需要说明的是,在获取时间信息时,为使后续的时空概率关系函数获取过程更为简便,可以对时间信息进行取整,例如,以小时为统一的时间单位,对分钟进行向下取整,如,五点二十分可以表示为5。事实上,由于伪基站在不同地理区域出没的概率可能不同,在同一地理区域内的不同时间段出没的概率也可能不同,则为使时空概率关系函数的识别概率更加准确,可以获取某一地理区域内或某一地理区域内的某一时间段内的多条恶意短信,从而获取适用于该地理区域或该地理区域内该时间段内的时空概率关系函数。因此,服务器可以获取待筛选的多条恶意短信,该待筛选的多条恶意短信可以从上述恶意短信数据得到,并采用以下至少两种获取方式获取到该多条恶意短信:获取方式1、服务器按照待筛选的多条恶意短信的地理位置信息,将待筛选的多条恶意短信中来源于同一地理区域的恶意短信作为该多条恶意短信。其中,本专利技术实施例对地理区域的划分方式不做限定。例如,一个城市划分为一个地理区域。该获取方式中,服务器可以基于待筛选的多条恶意短信的地理位置信息,筛选出地理位置信息属于同一地理区域内的恶意短信,从而得到至少一个地理区域中的每个地理区域内的多条恶意短信。获取方式2、服务器按照待筛选的多条恶意短信的地理位置信息和时间信息,将待筛选的多条恶意短信中来源于同一地理区域、且属于同一时间段的恶意短信作为该多条恶意短信。其中,本专利技术实施例对时间段的划分方式不做限定。例如,划分为工作日的工作时间段(周一至周五的9:00-18:00)、工作日的非工作时间段(周一至周五的18:00-9:00)、非工作日的工作时间段(周六至周日的9:00-18:00)以及非工作日的非工作时间段(周六至周日的9:00-18:00)。该获取方式中,服务器在筛选出属于同一地理区域内的恶意短信后,可以基于每个地理区域内的多条恶意短本文档来自技高网...

【技术保护点】
1.一种短信识别方法,其特征在于,所述方法包括:获取待识别短信的地理位置信息和时间信息;基于时空概率关系以及所述待识别短信的地理位置信息和时间信息,得到所述待识别短信对应的识别概率,所述时空概率关系根据恶意短信的地理位置信息和时间信息得到,是指地理位置信息、时间信息与识别概率之间的关系,所述识别概率是指为恶意短信的概率;基于所述待识别短信对应的识别概率,识别所述待识别短信是否为恶意短信,所述恶意短信是指来自于伪基站的短信。

【技术特征摘要】
1.一种短信识别方法,其特征在于,所述方法包括:获取待识别短信的地理位置信息和时间信息;基于时空概率关系以及所述待识别短信的地理位置信息和时间信息,得到所述待识别短信对应的识别概率,所述时空概率关系根据恶意短信的地理位置信息和时间信息得到,是指地理位置信息、时间信息与识别概率之间的关系,所述识别概率是指为恶意短信的概率;基于所述待识别短信对应的识别概率,识别所述待识别短信是否为恶意短信,所述恶意短信是指来自于伪基站的短信。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取已识别的多条恶意短信的地理位置信息和时间信息;确定每条恶意短信对应的地理位置影响参数及时间影响参数;基于各条恶意短信对应的地理位置影响参数和时间影响参数,得到所述时空概率关系。3.根据权利要求2所述的方法,其特征在于,所述基于各条恶意短信对应的地理位置影响参数和时间影响参数,得到所述时空概率关系,包括:基于各条恶意短信对应的地理位置影响参数和时间影响参数,应用公式1,得到时空概率关系函数,公式1:其中,λ1(x,y,t)为所述时空概率关系函数,x和y共同表示所述时空概率关系函数中的地理位置变量,t为所述时空概率关系函数中的时间变量,xi和yi共同表示第i条恶意短信的地理位置信息,ti为所述第i条恶意短信的时间信息,g1(x-xi,y-yi,t-ti)为基于所述第i条恶意短信对应的地理位置影响参数和时间影响参数得到的子时空概率关系函数。4.根据权利要求2所述的方法,其特征在于,所述基于各条恶意短信对应的地理位置影响参数和时间影响参数,得到所述时空概率关系,包括:基于各条恶意短信对应的地理位置影响参数和时间影响参数,应用公式2,得到时空概率关系函数,公式2:其中,λ2(x,y,t)为所述时空概率关系函数,α为地理位置概率关系函数的权重,所述α基于所述多条恶意短信对应的时间段的长短确定,x和y共同表示所述时空概率关系函数中的地理位置变量,t为所述时空概率关系函数中的时间变量,xi和yi共同表示第i条恶意短信的地理位置信息,ti为所述第i条恶意短信的时间信息,T为所述多条恶意短信的时间信息对应的时间段,g1(x-xi,y-yi,t-ti)为基于所述第i条恶意短信对应的地理位置影响参数和时间影响参数得到的子时空概率关系函数,xj和yj共同表示第j条恶意短信的地理位置信息,g2(x-xj,y-yj)为基于所述第j条恶意短信对应的地理位置影响参数得到的地理位置概率关系函数。5.根据权利要求2所述的方法,其特征在于,所述获取已识别的多条恶意短信的地理位置信息和时间信息之前,所述方法还包括:按照待筛选的多条恶意短信的地理位置信息,将所述待筛选的多条恶意短信中来源于同一地理区域的恶意短信作为所述多条恶意短信;或,按照所述待筛选的多条恶意短信的地理位置信息和时间信息,将所述待筛选的多条恶意短信中来源于同一地理区域、且属于同一时间段的恶意短信作为所述多条恶意短信。6.根据权利要求1-5中任一项所述的方法,其特征在于,所述基于所述待识别短信对应的识别概率,识别所述待识别短信是否为恶意短信,包括:如果所述待识别短信对应的识别概率大于预设阈值,将所述待识别短信识别为恶意短信。7.根据权利要求1-5中任一项所述的方法,其特征在于,所述基于所述待识别短信对应的识别概率,识别所述待识别短信是否为恶意短信,包括:基于所述待识别短信对...

【专利技术属性】
技术研发人员:張瑋杰何锐邦
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1