未读消息的处理方法、装置、存储介质及设备制造方法及图纸

技术编号:23890794 阅读:21 留言:0更新日期:2020-04-22 06:23
本发明专利技术实施例提供一种未读消息的处理方法、装置、存储介质及设备,属于计算机技术领域,解决了现有技术中对于未读消息中获取有效信息效率低的问题。所述方法包括:获取待处理的未读消息数据,所述未读消息数据包括未读消息、对应的消息标识以及发送方标识;对所述未读消息进行预处理,得到所述未读消息对应的文档集合;根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签;显示关键词标签列表,所述关键词标签列表中的所述关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引。本发明专利技术实施例适用于对未读消息的读取过程。

【技术实现步骤摘要】
未读消息的处理方法、装置、存储介质及设备
本专利技术涉及计算机
,具体地涉及一种未读消息的处理方法、装置、存储介质及设备。
技术介绍
在现有技术中,当存在多条未读IM(InstantMessaging,即时通信)消息时,用户需要逐条阅读以找到感兴趣的消息,延长了用户获取到有效信息的时间,降低了信息获取效率。
技术实现思路
本专利技术实施例的目的是提供一种未读消息的处理方法、装置、存储介质及设备,解决了现有技术中对于未读消息中获取有效信息效率低的问题,通过将未读消息中的关键词标签提供给用户,以便用户快速定位所需要的信息,提高消息获取效率。为了实现上述目的,本专利技术实施例提供一种未读消息的处理方法,包括:获取待处理的未读消息数据,所述未读消息数据包括未读消息、对应的消息标识以及发送方标识;对所述未读消息进行预处理,得到所述未读消息对应的文档集合;根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签;显示关键词标签列表,所述关键词标签列表中的所述关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引。进一步地,所述未读消息数据还包括发送时间,所述对所述未读消息进行预处理,得到所述未读消息对应的文档集合的步骤,包括:根据预设时间间隔以及所述发送方标识对应的未读消息的发送时间,将所述发送方标识对应的未读消息划分为独立会话;将所述独立会话中的文本进行合并,得到会话文本;利用中文分词技术与停用词词库,去除所述会话文本中的停用词,得到所述会话文本对应的会话文档;利用词性标注技术,保留所述会话文档中的名词和形容词,得到所述会话文档构成的文档集合。进一步地,所述根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签的步骤,包括:利用关键词库中的关键词与所述文档集合中的文档的词条进行匹配;统计匹配成功的关键词以及所述匹配成功的关键词的成功次数;将成功次数最多的前设定个数的关键词作为对应文档的关键词标签。进一步地,所述根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签的步骤,包括:利用词频-逆文档频率TF-IDF技术,得到所述文档集合中的文档的词条的权重值;将权重值最大的前设定个数的词条作为对应文档的待定关键词标签;将关键词库中的关键词与所述文档的待定关键词标签进行匹配;将匹配成功的关键词与所述待定关键词作为对应文档的关键词标签。进一步地,在所述显示关键词标签列表的步骤之后,所述方法还包括:当获取到所选择的关键词标签时,根据所选择的关键词标签关联的发送方标识以及消息标识,查找所述发送方标识对应的会话界面中的所述消息标识对应的未读消息;根据所选择的关键词标签关联的关键词位置索引,在所述会话界面中的未读消息上突出显示所述关键词标签对应的关键词。进一步地,在所述获取待处理的未读消息数据的步骤之后,所述方法还包括:将所获取的待处理的未读消息数据的未读状态显示为已读状态。相应的,本专利技术实施例还提供一种未读消息的处理装置,包括:获取单元,用于获取待处理的未读消息数据,所述未读消息数据包括未读消息、对应的消息标识以及发送方标识;预处理单元,用于对所述未读消息进行预处理,得到所述未读消息对应的文档集合;标签处理单元,用于根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签;显示单元,用于显示关键词标签列表,所述关键词标签列表中的所述关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引。进一步地,所述未读消息数据还包括发送时间,所述预处理单元还用于根据预设时间间隔以及所述发送方标识对应的未读消息的发送时间,将所述发送方标识对应的未读消息划分为独立会话;将所述独立会话中的文本进行合并,得到会话文本;利用中文分词技术与停用词词库,去除所述会话文本中的停用词,得到所述会话文本对应的会话文档;利用词性标注技术,保留所述会话文档中的名词和形容词,得到所述会话文档构成的文档集合。进一步地,所述标签处理单元还用于利用关键词库中的关键词与所述文档集合中的文档的词条进行匹配;统计匹配成功的关键词以及所述匹配成功的关键词的成功次数;将成功次数最多的前设定个数的关键词作为对应文档的关键词标签。进一步地,所述标签处理单元还用于利用词频-逆文档频率TF-IDF技术,得到所述文档集合中的文档的词条的权重值;将权重值最大的前设定个数的词条作为对应文档的待定关键词标签;将关键词库中的关键词与所述文档的待定关键词标签进行匹配;将匹配成功的关键词与所述待定关键词作为对应文档的关键词标签。进一步地,所述获取单元还用于获取所选择的关键词标签;所述装置还包括:查找单元,用于当所述获取单元获取到所选择的关键词标签时,根据所选择的关键词标签关联的发送方标识以及消息标识,查找所述发送方标识对应的会话界面中的所述消息标识对应的未读消息;所述显示单元还用于根据所选择的关键词标签关联的关键词位置索引,在所述会话界面中的未读消息上突出显示所述关键词标签对应的关键词。进一步地,所述显示单元还用于将所获取的待处理的未读消息数据的未读状态显示为已读状态。相应的,本专利技术实施例还提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如上所述的未读消息的处理方法。相应的,本专利技术实施例还提供一种设备,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器与所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如上所述的未读消息的处理方法。通过上述技术方案,在获取待处理的未读消息数据之后,对未读消息进行预处理,从而得到未读消息对应的文档集合,然后根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签,并显示关键词标签列表,其中,所述关键词标签列表中的关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引,以便用户选择需要查看关键词标签对应的未读消息中的关键词。本专利技术实施例解决了现有技术中对于未读消息中获取有效信息效率低的问题,通过将未读消息中的关键词标签提供给用户,以便用户快速定位所需要的信息,提高消息获取效率。本专利技术实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本专利技术实施例,但并不构成对本专利技术实施例的限制。在附图中:图1是本专利技术实施例提供的一种未读消息的处理方法的流程示意图;图2是本专利技术实施例提供的另一种未读消息的处理方法的流程示意图;图3是本专利技术实施例提供的一种未读消息的处理装置的结构示意图;图4是本专利技术实施例提供的另一种未读消息的处理装置的结构示意图;图5是本专利技术实施例提供的一种设备的结构示意图。具体实施方式以下结合附图对本专利技术实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本专利技术实施例,并不用于限制本专利技术实施例。现本文档来自技高网...

【技术保护点】
1.一种未读消息的处理方法,其特征在于,包括:/n获取待处理的未读消息数据,所述未读消息数据包括未读消息、对应的消息标识以及发送方标识;/n对所述未读消息进行预处理,得到所述未读消息对应的文档集合;/n根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签;/n显示关键词标签列表,所述关键词标签列表中的所述关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引。/n

【技术特征摘要】
1.一种未读消息的处理方法,其特征在于,包括:
获取待处理的未读消息数据,所述未读消息数据包括未读消息、对应的消息标识以及发送方标识;
对所述未读消息进行预处理,得到所述未读消息对应的文档集合;
根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签;
显示关键词标签列表,所述关键词标签列表中的所述关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引。


2.根据权利要求1所述的未读消息的处理方法,其特征在于,所述未读消息数据还包括发送时间,所述对所述未读消息进行预处理,得到所述未读消息对应的文档集合的步骤,包括:
根据预设时间间隔以及所述发送方标识对应的未读消息的发送时间,将所述发送方标识对应的未读消息划分为独立会话;
将所述独立会话中的文本进行合并,得到会话文本;
利用中文分词技术与停用词词库,去除所述会话文本中的停用词,得到所述会话文本对应的会话文档;
利用词性标注技术,保留所述会话文档中的名词和形容词,得到所述会话文档构成的文档集合。


3.根据权利要求1所述的未读消息的处理方法,其特征在于,所述根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签的步骤,包括:
利用关键词库中的关键词与所述文档集合中的文档的词条进行匹配;
统计匹配成功的关键词以及所述匹配成功的关键词的成功次数;
将成功次数最多的前设定个数的关键词作为对应文档的关键词标签。


4.根据权利要求1所述的未读消息的处理方法,其特征在于,所述根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签的步骤,包括:
利用词频-逆文档频率TF-IDF技术,得到所述文档集合中的文档的词条的权重值;
将权重值最大的前设定个数的词条作为对应文档的待定关键词标签;
将关键词库中的关键词与所述文档的待定关键词标签进行匹配;
将匹配成功的关键词与所述待定关键词作为对应文档的关键词标签。


5.根据权利要求1所述的未读消息的处理方法,其特征在于,在所述显示关键词标签列表的步骤之后,所述方法还包括...

【专利技术属性】
技术研发人员:蔺世庆
申请(专利权)人:贝壳技术有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1