互联网信息链式存储方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:20916886 阅读:29 留言:0更新日期:2019-04-20 09:46
本发明专利技术公开了互联网信息链式存储方法、装置、计算机设备及存储介质。方法包括:获取待监控网页的网址信息,根据待监控网页的网址信息对待监控网页中所发布的数据信息进行实时监控以获取新增数据信息;对新增数据信息中的文件是否为文字文件进行判断;若新增数据信息中的文件为非文字文件,通过预设信息识别模型将非文字文件转换为文字文件;将新增数据信息中的文字文件和/或转换得到的文字文件保存至预设数据链表中。本发明专利技术基于数据压缩存储技术,能够确保数据链表中所存储的信息无法删除和修改,能够方便用户获取互联网上已删除的数据信息以协助用户对相关数据信息进行取证,具有极大的实用价值。

Internet Information Chain Storage Method, Device, Computer Equipment and Storage Media

The invention discloses an Internet information chain storage method, device, computer equipment and storage medium. The methods include: acquiring the website information of the webpage to be monitored, real-time monitoring the data information published in the webpage to be monitored according to the website information of the webpage to be monitored in order to obtain the new data information; judging whether the file in the new data information is a text file or not; if the file in the new data information is a non-text file, non-text will be recognized through the preset information recognition model. Files are converted to text files; text files and/or converted text files in new data information are saved to the default data link list. The invention is based on data compression storage technology, which can ensure that the information stored in the data link list can not be deleted and modified, and can facilitate users to obtain deleted data information on the Internet to assist users in forensic of relevant data information, and has great practical value.

【技术实现步骤摘要】
互联网信息链式存储方法、装置、计算机设备及存储介质
本专利技术涉及计算机
,尤其涉及一种互联网信息链式存储方法、装置、计算机设备及存储介质。
技术介绍
互联网中各网页上保存有海量的数据信息,且新增数据信息会逐渐更替网页中已保存的数据信息,造成网页中的数据信息发生更迭变化的情况,因而现有对互联网中的数据信息进行存储方法无法对互联网上已删除或已修改的数据信息进行获取,在司法实践中对互联网上所发布的相关数据信息进行取证存在极大的困难。因此,现有的数据信息存储方法无法获取已删除数据信息。
技术实现思路
本专利技术实施例提供了一种互联网信息链式存储方法、装置、计算机设备及存储介质,旨在解决现有技术中数据信息存储方法无法获取已删除数据信息的问题。第一方面,本专利技术实施例提供了一种互联网信息链式存储方法,其包括:获取待监控网页的网址信息,根据待监控网页的网址信息对待监控网页中所发布的数据信息进行实时监控以获取新增数据信息;对新增数据信息中的文件是否为文字文件进行判断;若新增数据信息中的文件为非文字文件,通过预设信息识别模型将非文字文件转换为文字文件;将新增数据信息中的文字文件和/或转换得到的文字文件保存至预设数据链表中。第二方面,本专利技术实施例提供了一种互联网信息链式存储装置,其包括:网页监控单元,用于获取待监控网页的网址信息,根据待监控网页的网址信息对待监控网页中所发布的数据信息进行实时监控以获取新增数据信息;判断单元,用于对新增数据信息中的文件是否为文字文件进行判断;信息转换单元,用于若新增数据信息中的文件为非文字文件,通过预设信息识别模型将非文字文件转换为文字文件;信息存储单元,用于将新增数据信息中的文字文件和/或转换得到的文字文件保存至预设数据链表中。第三方面,本专利技术实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的互联网信息链式存储方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的互联网信息链式存储方法。本专利技术实施例提供了一种互联网信息链式存储方法、装置、计算机设备及存储介质。通过对网页中所发布的数据信息进行监控并判断其中的文件是否为文字文件,将非文字文件的文件转换为文字文件,并对所有文字文件存储至数据链表中以实现对互联网信息进行链式存储,能够确保所存储的文字文件无法删除和修改,能够方便用户获取互联网上已删除的数据信息以协助用户对相关数据信息进行取证,具有极大的实用价值。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的互联网信息链式存储方法的流程示意图;图2为本专利技术实施例提供的互联网信息链式存储方法的子流程示意图;图3为本专利技术实施例提供的互联网信息链式存储方法的另一子流程示意图;图4为本专利技术实施例提供的互联网信息链式存储方法的另一子流程示意图;图5为本专利技术实施例提供的互联网信息链式存储方法的另一子流程示意图;图6为本专利技术实施例提供的互联网信息链式存储装置的示意性框图;图7为本专利技术实施例提供的互联网信息链式存储装置的子单元示意性框图;图8为本专利技术实施例提供的互联网信息链式存储装置的另一子单元示意性框图;图9为本专利技术实施例提供的互联网信息链式存储装置的另一子单元示意性框图;图10为本专利技术实施例提供的互联网信息链式存储装置的另一子单元示意性框图;图11为本专利技术实施例提供的计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。请参阅图1,图1是本专利技术实施例提供的互联网信息链式存储方法的流程示意图。该互联网信息链式存储方法应用于具有信息存储功能的终端设备中,例如台式电脑、笔记本电脑、平板电脑或手机等。如图1所示,该方法包括步骤S110~S140。S110、获取待监控网页的网址信息,根据待监控网页的网址信息对待监控网页中所发布的数据信息进行实时监控以获取新增数据信息。获取待监控网页的网址信息,根据待监控网页的网址信息对待监控网页中所发布的数据信息进行实时监控以获取新增数据信息。其中,待监控网页信息为用户所输入的待监控网页的网址信息,待监控网页可以是微博、微信、企业网址、政府网站等所有在互联网上所发布的数据信息,发布人可以是个人、企业、组织或政府部门,例如对某一名人在其微博中所发布的信息进行监控,则待监控网页信息即是该名人微博网页的网址信息。待监控网页中所发布的数据信息中可包含多种格式的文件,例如文字格式的信息、视频格式的信息、音频格式、图片格式的信息等。由于待监控网页中所发布的数据信息为实时发布,因此需对待监控网页进行监控以实时获取该网页中所发布的最新的数据信息。在一实施例中,如图2所示,步骤S110包括子步骤S111、S112和S113。S111、若监控到待监控网页中发布数据信息,根据待监控网页的网址信息及所述数据信息的发布人生成发布源信息。若监控到待监控网页中发布数据信息,根据待监控网页的网址信息及所述数据信息的发布人生成发布源信息。为获取新增数据信息的发布人,需根据待监控网页的网址信息及所述数据信息的发布人生成相应的发布源信息。发布源信息中包括待监控网页的网址信息以及该数据信息的发布人,待监控网页的网址信息也即是用户所输入的待监控网页信息;发布人也即是发布该新增数据信息的发布主体,发布人可以是个人、企业、组织或政府部门。S112、根据所述数据信息的发布时间生成发布时间戳。根据所述数据信息的发布时间生成新增数据信息的发布时间戳,为对新增数据信息的发布时间进行记录,需根据数据信息的发布时间生成相应的发布时间戳,发布时间戳生成后无法被更改,也即是确保新增数据信息的发布时间被及时记录且无法更改。例如,待监控网页为某一名人的微博网页,每一条微博信息的发布均包含一个发布时间,获取该微博信息的发布时间即为相应新增数据信息的发布时间戳。S113、获取所述发布数据信息中的所有文件及发布源本文档来自技高网...

【技术保护点】
1.一种互联网信息链式存储方法,其特征在于,包括:获取待监控网页的网址信息,根据待监控网页的网址信息对待监控网页中所发布的数据信息进行实时监控以获取新增数据信息;对新增数据信息中的文件是否为文字文件进行判断;若新增数据信息中的文件为非文字文件,通过预设信息识别模型将非文字文件转换为文字文件;将新增数据信息中的文字文件和/或转换得到的文字文件保存至预设数据链表中。

【技术特征摘要】
1.一种互联网信息链式存储方法,其特征在于,包括:获取待监控网页的网址信息,根据待监控网页的网址信息对待监控网页中所发布的数据信息进行实时监控以获取新增数据信息;对新增数据信息中的文件是否为文字文件进行判断;若新增数据信息中的文件为非文字文件,通过预设信息识别模型将非文字文件转换为文字文件;将新增数据信息中的文字文件和/或转换得到的文字文件保存至预设数据链表中。2.根据权利要求1所述的互联网信息链式存储方法,其特征在于,所述根据待监控网页的网址信息对待监控网页中所发布的数据信息进行实时监控以获取新增数据信息,包括:若监控到待监控网页中发布数据信息,根据待监控网页的网址信息及所述数据信息的发布人生成发布源信息;根据所述数据信息的发布时间生成发布时间戳;获取所述发布数据信息中的所有文件及发布源信息、发布时间戳以得到新增数据信息。3.根据权利要求1所述的互联网信息链式存储方法,其特征在于,所述通过预设信息识别模型将非文字文件转换为文字文件,包括:获取所述非文字文件的格式信息并判断该文件是否为音频文件,若该文件为音频文件则通过信息识别模型中的音频识别模型对该文件进行识别以得到相应的文字文件;获取所述非文字文件的格式信息并判断该文件是否为图片,若该文件为图片则通过信息识别模型中图片识别模型的对该文件进行识别以得到相应的文字文件;获取所述非文字文件的格式信息并判断该文件是否为视频文件,若该文件为视频文件则通过信息识别模型中的音频识别模型及图片识别模型对该文件进行识别以得到相应的文字文件。4.根据权利要求3所述的互联网信息链式存储方法,其特征在于,所述若该文件为音频文件则通过信息识别模型中的音频识别模型对该文件进行识别以得到相应的文字文件,包括:根据音频识别模型中的声学模型对音频文件中的语音信息进行切分以得到语音信息中所包含的多个音素;根据音频识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素转换为拼音信息;根据音频识别模型中的语义解析模型对所得到的拼音信息进行语义解析以得到包含文字信息的文字文件。5.根据权利要求2所述的互联网信息链式存储方法,其特征在于,所述将新增数据信息中的文字文件和/或转换得到的文字文件保存至预设数据链表中,包括:获取待监控网页中新增数据信息的发布源信息及发布时间戳;根据发布源信息将新增数据信息中...

【专利技术属性】
技术研发人员:吴壮伟
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1