The application relates to a message data processing method, device, computer equipment and storage medium. The method includes receiving the message data sent by the server in the main thread, and carrying the source data on the message data. The message data is segmenting according to the segmentation logic and the target segmentation data is obtained. The source data corresponding to the target participle data are associated with the target participle data, and the source data corresponding to the target participle data and the target participle data are the same as the source data carried on the message data. Whether there is a target segmentation data in risk level of the target segmentation data in the recognition thread is greater than the preset level. The risk level of the query is higher than that of the target segmentation data corresponding to the preset level, and the risk label is added to the acquired source data. By using this method, we can process and analyze large amounts of message data in different threads without manual monitoring and analysis, and improve processing efficiency and accuracy.
【技术实现步骤摘要】
消息数据处理方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种消息数据处理方法、装置、计算机设备和存储介质。
技术介绍
随着互联网科技的发展,在生活中,用户可以从网络上获取到越来越多的信息,而一些高危信息是由群聊等的方式进行传播的,例如对某网站举行的活动,一些不法分子会以群聊等的方式进行交流,从而以低额的付出获取高额的活动奖励等,因此,对群聊的消息监控是非常重要的。传统地,需要人工实时监控聊天软件中的群聊等消息,进而人工分析接收到的群聊消息中是否存在有风险等级大于预设等级的聊天消息,当有大量群聊消息时,则人工分析效率低且可能不准确。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够分析效率高且准确的消息数据处理方法、装置、计算机设备和存储介质。一种消息数据处理方法,所述方法包括:在主线程中接收服务器发送的消息数据,所述消息数据上携带有来源数据;将所述消息数据按照分词逻辑进行拆分得到目标分词数据;将所述目标分词数据与所述目标分词数据对应的来源数据进行关联存储,所述目标分词数据对应的来源数据与所述目标分词数据对应消息数据上携带的来源数据相同;在识别线程中查询所述目标分词数据中是否存在风险等级大于预设等级的目标分词数据;获取查询到的所述风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的所述来源数据添加风险标签。在其中一个实施例中,所述将所述消息数据按照预设分词逻辑进行拆分得到目标分词数据的步骤,包括:获取预设的多个分词逻辑,根据所述预设的多个分词逻辑对所述消息数据进行拆分得到分词序列;计算每一个所述分词序列对应的拆分正 ...
【技术保护点】
1.一种消息数据处理方法,所述方法包括:在主线程中接收服务器发送的消息数据,所述消息数据上携带有来源数据;将所述消息数据按照分词逻辑进行拆分得到目标分词数据;将所述目标分词数据与所述目标分词数据对应的来源数据进行关联存储,所述目标分词数据对应的来源数据与所述目标分词数据对应消息数据上携带的来源数据相同;在识别线程中查询所述目标分词数据中是否存在风险等级大于预设等级的目标分词数据;获取查询到的所述风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的所述来源数据添加风险标签。
【技术特征摘要】
1.一种消息数据处理方法,所述方法包括:在主线程中接收服务器发送的消息数据,所述消息数据上携带有来源数据;将所述消息数据按照分词逻辑进行拆分得到目标分词数据;将所述目标分词数据与所述目标分词数据对应的来源数据进行关联存储,所述目标分词数据对应的来源数据与所述目标分词数据对应消息数据上携带的来源数据相同;在识别线程中查询所述目标分词数据中是否存在风险等级大于预设等级的目标分词数据;获取查询到的所述风险等级大于预设等级的目标分词数据对应的来源数据,并对所获取到的所述来源数据添加风险标签。2.根据权利要求1所述的方法,其特征在于,所述将所述消息数据按照预设分词逻辑进行拆分得到目标分词数据的步骤,包括:获取预设的多个分词逻辑,根据所述预设的多个分词逻辑对所述消息数据进行拆分得到分词序列;计算每一个所述分词序列对应的拆分正确率;获取与最大的所述拆分正确率对应的所述分词序列作为所述目标分词数据。3.根据权利要求1所述的方法,其特征在于,所述将所述消息数据按照分词逻辑进行拆分得到目标分词数据的步骤,还包括:将所述消息数据按照分词逻辑进行拆分得到初始分词数据;将所述初始分词数据与基础滤镜库中的过滤数据进行匹配;当所述初始分词数据与所述过滤数据匹配成功时,则提取所述匹配成功的所述初始分词数据对应的所述来源数据中的时间数据;当所述初始分词数据对应的来源数据中的时间数据相同时,则获取所述时间数据对应的消息数据;接收针对所述消息数据的分词逻辑的添加指令,并根据所述添加指令添加新的分词逻辑;采用所述新的分词逻辑将所述消息数据进行拆分得到目标分词数据。4.根据权利要求1所述的方法,其特征在于,所述在识别线程中从所述目标分词数据中查询风险等级大于预设等级的目标分词数据的步骤,包括:将所述目标分词数据与预存的风险等级大于预设等级的数据进行匹配;当至少一个所述目标分词数据匹配成功时,则获取匹配成功的所述风险等级大于预设等级的数据的存储类别;获取匹配成功的所述目标分词数据对应的来源数据中的时间数据,根据所述时间数据提取在预设的消息数据获取时间段内的未进行匹配的所述目标分词数据;将未进行匹配的所述目标分词数据与所述存储类别下预存的风险等级大于预设等级的数据进行匹配;当所述未进行匹配的目标分词数据与所述存储类别下预存的风险等级大于预设等级的数据匹配成功时,则所述未进行匹配的目标分词数据为所...
【专利技术属性】
技术研发人员:张澍滋,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。