【技术实现步骤摘要】
一种信息收集方法、装置、设备及计算机可读存储介质
[0001]本专利技术涉及数据采集领域,特别是涉及一种信息收集方法,本专利技术还涉及一种信息收集装置、设备及计算机可读存储介质。
技术介绍
[0002]境内外涉网人员经常会通过一些跨境的聊天软件(例如Telegram)进行聊天群组的构建,并在聊天群组中沟通一些不当事宜,如果能够找到这些聊天群组,便可以针对性的获取这些聊天群组内的一些不当内容,便于展开案件调查,然而现有技术中并没有一种成熟的方法能够高效且全面地找到这些聊天群组。
[0003]因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
技术实现思路
[0004]本专利技术的目的是提供一种信息收集方法,能够高效全面地进行与目标内容相关的聊天群组的查找;本专利技术的另一目的是提供一种信息收集装置、设备及计算机可读存储介质,能够高效全面地进行与目标内容相关的聊天群组的查找。
[0005]为解决上述技术问题,本专利技术提供了一种信息收集方法,应用于处理器,包括:
...
【技术保护点】
【技术特征摘要】
1.一种信息收集方法,其特征在于,应用于处理器,包括:预先构建与目标内容相关的群聊名称的关键词集合;根据所述关键词集合生成待搜索词组;在指定聊天网站中查找名称中包含所述待搜索词组的目标聊天群组;从所述目标聊天群组对应界面中获取所述目标聊天群组的特征信息。2.根据权利要求1所述的信息收集方法,其特征在于,所述预先构建与目标内容相关的群聊名称的关键词集合具体为:预先构建与目标内容相关的群聊名称的多类关键词集合;所述根据所述关键词集合生成待搜索词组具体为:随机从多类所述关键词集合中确定至少两类所述关键词集合;从确定出的至少两类所述关键词集合中各随机选取一个关键词;将选取的关键词组合为待搜索词组。3.根据权利要求2所述的信息收集方法,其特征在于,所述在指定聊天网站中查找名称中包含所述待搜索词组的目标聊天群组具体为:根据指定聊天网站的网址以及所述待搜索词组生成搜索链接;根据所述搜索链接在所述指定聊天网站中查找名称中包含所述待搜索词组的目标聊天群组。4.根据权利要求3所述的信息收集方法,其特征在于,所述从所述目标聊天群组对应界面中获取所述目标聊天群组的特征信息具体为:基于爬虫技术对所述搜索链接进行数据爬取规则的设置,以便在查找到所述目标聊天群组后,从所述目标聊天群组对应界面中获取所述目标聊天群组的特征信息。5.根据权利要求3所述的信息收集方法,其特征在于,...
【专利技术属性】
技术研发人员:黄巍峰,范渊,吴卓群,王欣,
申请(专利权)人:杭州安恒信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。