消息数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:18458689 阅读:28 留言:0更新日期:2018-07-18 12:39
本申请涉及一种消息数据处理方法、装置、计算机设备和存储介质。所述方法包括:在主线程中接收服务器发送的消息数据,消息数据上携带有来源数据。将消息数据按照分词逻辑进行拆分得到目标分词数据。将目标分词数据与目标分词数据对应的来源数据进行关联存储,目标分词数据对应的来源数据与目标分词数据对应消息数据上携带的来源数据相同。在识别线程中查询目标分词数据中是否存在风险等级大于预设等级的目标分词数据。获取查询到的风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的来源数据添加风险标签。采用本方法能够无需人工进行监控分析,即可在不同线程中处理大量的消息数据,提高处理效率,提高准确率。

Message data processing method, device, computer equipment and storage medium

The application relates to a message data processing method, device, computer equipment and storage medium. The method includes receiving the message data sent by the server in the main thread, and carrying the source data on the message data. The message data is segmenting according to the segmentation logic and the target segmentation data is obtained. The source data corresponding to the target participle data are associated with the target participle data, and the source data corresponding to the target participle data and the target participle data are the same as the source data carried on the message data. Whether there is a target segmentation data in risk level of the target segmentation data in the recognition thread is greater than the preset level. The risk level of the query is higher than that of the target segmentation data corresponding to the preset level, and the risk label is added to the acquired source data. By using this method, we can process and analyze large amounts of message data in different threads without manual monitoring and analysis, and improve processing efficiency and accuracy.

【技术实现步骤摘要】
消息数据处理方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种消息数据处理方法、装置、计算机设备和存储介质。
技术介绍
随着互联网科技的发展,在生活中,用户可以从网络上获取到越来越多的信息,而一些高危信息是由群聊等的方式进行传播的,例如对某网站举行的活动,一些不法分子会以群聊等的方式进行交流,从而以低额的付出获取高额的活动奖励等,因此,对群聊的消息监控是非常重要的。传统地,需要人工实时监控聊天软件中的群聊等消息,进而人工分析接收到的群聊消息中是否存在有风险等级大于预设等级的聊天消息,当有大量群聊消息时,则人工分析效率低且可能不准确。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够分析效率高且准确的消息数据处理方法、装置、计算机设备和存储介质。一种消息数据处理方法,所述方法包括:在主线程中接收服务器发送的消息数据,所述消息数据上携带有来源数据;将所述消息数据按照分词逻辑进行拆分得到目标分词数据;将所述目标分词数据与所述目标分词数据对应的来源数据进行关联存储,所述目标分词数据对应的来源数据与所述目标分词数据对应消息数据上携带的来源数据相同;在识别线程中查询所述目标分词数据中是否存在风险等级大于预设等级的目标分词数据;获取查询到的所述风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的所述来源数据添加风险标签。在其中一个实施例中,所述将所述消息数据按照预设分词逻辑进行拆分得到目标分词数据的步骤,包括:获取预设的多个分词逻辑,根据所述预设的多个分词逻辑对所述消息数据进行拆分得到分词序列;计算每一个所述分词序列对应的拆分正确率;获取与最大的所述拆分正确率对应的所述分词序列作为所述目标分词数据。在其中一个实施例中,所述将所述消息数据按照分词逻辑进行拆分得到目标分词数据的步骤,还包括:将所述消息数据按照分词逻辑进行拆分得到初始分词数据;将所述初始分词数据与基础滤镜库中的过滤数据进行匹配;当所述初始分词数据与所述过滤数据匹配成功时,则提取所述匹配成功的所述初始分词数据对应的所述来源数据中的时间数据;当所述初始分词数据对应的来源数据中的时间数据相同时,则获取所述时间数据对应的消息数据;接收针对所述消息数据的分词逻辑的添加指令,并根据所述添加指令添加新的分词逻辑;采用所述新的分词逻辑将所述消息数据进行拆分得到目标分词数据。在其中一个实施例中,所述在识别线程中从所述目标分词数据中查询风险等级大于预设等级的目标分词数据的步骤,包括:将所述目标分词数据与预存的风险等级大于预设等级的数据进行匹配;当至少一个所述目标分词数据匹配成功时,则获取匹配成功的所述风险等级大于预设等级的数据的存储类别;获取匹配成功的所述目标分词数据对应的来源数据中的时间数据,根据所述时间数据提取在预设的消息数据获取时间段内的未进行匹配的所述目标分词数据;将未进行匹配的所述目标分词数据与所述存储类别下预存的风险等级大于预设等级的数据进行匹配;当所述未进行匹配的目标分词数据与所述存储类别下预存的风险等级大于预设等级的数据匹配成功时,则所述未进行匹配的目标分词数据为所述风险等级大于预设等级的目标分词数据。在其中一个实施例中,所述将所述风险等级大于预设等级的目标分词数据对应的来源数据添加风险标签的步骤之后,包括:获取所述风险等级大于预设等级的目标分词数据的关联词组;当所述关联词组的风险等级大于预设等级时,则查询与未添加风险标签的来源数据对应的目标分词数据中是否存在所述关联词组;当与未添加风险标签的来源数据对应的目标分词数据中存在所述关联词组时,则将所述未添加风险标签的来源数据添加所述风险标签。在其中一个实施例中,所述将所述风险等级大于预设等级的目标分词数据对应的来源数据添加风险标签的步骤之后,还包括:提取所述添加风险标签的来源数据对应的身份标识;统计预设时间段内所述身份标识对应的相同的风险等级大于预设等级的目标分词数据的数量;当所述数量超过预设值时,则对所述身份标识对应的消息数据进行监控。在其中一个实施例中,所述当所述数量超过预设值时,则对所述身份标识对应的消息数据进行监控的步骤之后,还包括:根据所述身份标识获取所述身份标识对应的网络地址;查询所述网络地址在预设的注册时间段内注册的身份标识的数量;当所注册的身份标识的数量超过预设值时,则将所述网络地址标记为风险等级大于预设等级的网络地址。一种消息数据处理装置,所述装置包括:接收模块,用于在主线程中接收服务器发送的消息数据,所述消息数据上携带有来源数据;拆分模块,用于将所述消息数据按照分词逻辑进行拆分得到目标分词数据;关联存储模块,用于将所述目标分词数据与所述目标分词数据对应的来源数据进行关联存储,所述目标分词数据对应的来源数据与所述目标分词数据对应消息数据上携带的来源数据相同;查询模块,用于在识别线程中查询所述目标分词数据中是否存在风险等级大于预设等级的目标分词数据;获取模块,用于获取查询到的所述风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的所述来源数据添加风险标签。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。上述消息数据处理方法、装置、计算机设备和存储介质,在主线程中接收服务器发送的消息数据,进而将消息数据按照分词逻辑进行拆分得到目标分词数据,将目标分词数据与目标分词数据对应的来源数据进行存储,进而在识别线程中从目标分词数据中查询风险等级大于预设等级的目标分词数据,采用主线程获取消息数据并进行消息数据的拆分,采用识别线程对目标分词数据中查询风险等级大于预设等级的目标分词数据,无需人工进行监控分析,即可在不同线程中处理大量的消息数据,提高处理效率,进而将风险等级大于预设等级的目标分词数据对应的来源数据添加风险标签,提高准确率。附图说明图1为一个实施例中消息数据处理方法的应用场景图;图2为一个实施例中消息数据处理方法的流程示意图;图3为一个实施例中消息数据处理装置的结构框图;图4为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的消息数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端102在主线程中接收服务器104发送的消息数据,该消息数据上携带有来源数据,进而终端102将接收到的消息数据按照分词逻辑进行拆分得到目标分词数据,终端102将拆分得到的目标分词数据与目标分词数据对应的来源数据进行关联存储,进而终端102启动识别线程,在识别线程中查询目标分词数据中是否存在风险等级大于预设等级的目标分词数据,进而当查询到存在有风险等级大于预设等级的目标分词数据时,则获取该目标分词数据对应的来源数据,并将该目标分词数据对应的来源数据添加风险标签。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑,服务器104可以用本文档来自技高网...

【技术保护点】
1.一种消息数据处理方法,所述方法包括:在主线程中接收服务器发送的消息数据,所述消息数据上携带有来源数据;将所述消息数据按照分词逻辑进行拆分得到目标分词数据;将所述目标分词数据与所述目标分词数据对应的来源数据进行关联存储,所述目标分词数据对应的来源数据与所述目标分词数据对应消息数据上携带的来源数据相同;在识别线程中查询所述目标分词数据中是否存在风险等级大于预设等级的目标分词数据;获取查询到的所述风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的所述来源数据添加风险标签。

【技术特征摘要】
1.一种消息数据处理方法,所述方法包括:在主线程中接收服务器发送的消息数据,所述消息数据上携带有来源数据;将所述消息数据按照分词逻辑进行拆分得到目标分词数据;将所述目标分词数据与所述目标分词数据对应的来源数据进行关联存储,所述目标分词数据对应的来源数据与所述目标分词数据对应消息数据上携带的来源数据相同;在识别线程中查询所述目标分词数据中是否存在风险等级大于预设等级的目标分词数据;获取查询到的所述风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的所述来源数据添加风险标签。2.根据权利要求1所述的方法,其特征在于,所述将所述消息数据按照预设分词逻辑进行拆分得到目标分词数据的步骤,包括:获取预设的多个分词逻辑,根据所述预设的多个分词逻辑对所述消息数据进行拆分得到分词序列;计算每一个所述分词序列对应的拆分正确率;获取与最大的所述拆分正确率对应的所述分词序列作为所述目标分词数据。3.根据权利要求1所述的方法,其特征在于,所述将所述消息数据按照分词逻辑进行拆分得到目标分词数据的步骤,还包括:将所述消息数据按照分词逻辑进行拆分得到初始分词数据;将所述初始分词数据与基础滤镜库中的过滤数据进行匹配;当所述初始分词数据与所述过滤数据匹配成功时,则提取所述匹配成功的所述初始分词数据对应的所述来源数据中的时间数据;当所述初始分词数据对应的来源数据中的时间数据相同时,则获取所述时间数据对应的消息数据;接收针对所述消息数据的分词逻辑的添加指令,并根据所述添加指令添加新的分词逻辑;采用所述新的分词逻辑将所述消息数据进行拆分得到目标分词数据。4.根据权利要求1所述的方法,其特征在于,所述在识别线程中从所述目标分词数据中查询风险等级大于预设等级的目标分词数据的步骤,包括:将所述目标分词数据与预存的风险等级大于预设等级的数据进行匹配;当至少一个所述目标分词数据匹配成功时,则获取匹配成功的所述风险等级大于预设等级的数据的存储类别;获取匹配成功的所述目标分词数据对应的来源数据中的时间数据,根据所述时间数据提取在预设的消息数据获取时间段内的未进行匹配的所述目标分词数据;将未进行匹配的所述目标分词数据与所述存储类别下预存的风险等级大于预设等级的数据进行匹配;当所述未进行匹配的目标分词数据与所述存储类别下预存的风险等级大于预设等级的数据匹配成功时,则所述未进行匹配的目标分词数据为所...

【专利技术属性】
技术研发人员:张澍滋
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1