文本导入数据库方法、装置、设备及存储介质制造方法及图纸

技术编号：20916341 阅读：20 留言：0更新日期：2019-04-20 09:39

本发明专利技术公开了一种文本导入数据库的方法、装置、设备及存储介质，首先，通过间隔预设时间获取数据源的文本文件；然后划分文本文件，得到对应的字符文本；最后将字符文本按照预设的顺序发送至目标数据库，以使目标数据库根据预设的顺序重组字符文本。可见，本实施例提供的技术方案通过间隔预设时间获取文本文件，将大数据的文本文件按时间分成小的文本文件，然后对这小的文本文件进行处理，最后将处理后的文本文件发送至目标数据库，实现更好的适应数据挖掘和大数据处理。

Text Import Database Method, Device, Equipment and Storage Media

The invention discloses a method, device, device and storage medium for text import into database. Firstly, the text file of data source is acquired by interval preset time; secondly, the text file is divided to get corresponding character text; finally, the character text is sent to the target database in preset order, so that the target database can reorganize character text according to preset order. It can be seen that the technical scheme provided by this example obtains text files by preset intervals, divides large data text files into small text files according to time, then processes the small text files, and finally sends the processed text files to the target database, so as to achieve better adaptability to data mining and large data processing.

全部详细技术资料下载

【技术实现步骤摘要】
文本导入数据库方法、装置、设备及存储介质
本专利技术实施例涉及大数据、分布式流式处理和数据库存储
，尤其涉及一种文本导入数据库方法、装置、设备及存储介质。
技术介绍
随着现代信息技术的快速发挥发展，各业务信息的数据量越来越大，并且随着分布式系统的发展，大量数据需要在分布式系统中的各个服务器之间进行传递。现有技术中，各个分布式机器读取操作数据都是通过分布式储存文件系统(HadoopDistributedFileSystem，HDFS)，并且分布式计算将中间结果或者最终结果都是保存到HDFS上的，每次进行读取操作数据时，难以更好的适应数据挖掘和大数据处理。
技术实现思路
本专利技术提供一种文本导入数据库的方法、装置、设备及存储介质，实现更好的适应数据挖掘和大数据处理。第一方面，本专利技术实施例提供了一种文本导入数据库的方法，包括：间隔预设时间获取数据源的文本文件；划分所述文本文件，得到对应的字符文本；将所述字符文本按照预设的顺序发送至目标数据库，以使所述目标数据库根据所述预设的顺序重组所述字符文本。第二方面，本专利技术实施例还提供了一种文本导入数据库的装置，包括：文本获取模块，用于间隔预设时间获取数据源的文本文件；文本划分模块，用于划分所述文本文件，得到对应的字符文本；字符发送模块，用于将所述字符文本按照预设的顺序发送至目标数据库，以使所述目标数据库根据所述预设的顺序重组所述字符文本。第三方面，本专利技术实施例还提供了一种设备，所述设备包括：一个或多个处理器；存储器，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处...

【技术保护点】
1.一种文本导入数据库的方法，其特征在于，包括：间隔预设时间获取数据源的文本文件；划分所述文本文件，得到对应的字符文本；将所述字符文本按照预设的顺序发送至目标数据库，以使所述目标数据库根据所述预设的顺序重组所述字符文本。

【技术特征摘要】
1.一种文本导入数据库的方法，其特征在于，包括：间隔预设时间获取数据源的文本文件；划分所述文本文件，得到对应的字符文本；将所述字符文本按照预设的顺序发送至目标数据库，以使所述目标数据库根据所述预设的顺序重组所述字符文本。2.根据权利要求1所述的方法，其特征在于，所述间隔预设时间获取数据源的文本文件之前，还包括：建立访问所述数据库的数据库连接池；创建预设数量的访问所述数据库的数据库连接，并将所述数据库连接存放到所述数据库连接池中。3.根据权利要求1所述的方法，其特征在于，所述划分所述文本文件，得到对应的字符文本，包括：以换段符、换行符为第一分界符，划分所述文本文件，得到至少一个单行文本文件；以字间隔符为第二分界符，划分所述至少一个单行文本文件，得到对应的字符文本。4.根据权利要求2所述的方法，其特征在于，所述将所述字符文本按照预设的顺序发送至目标数据库，包括：通过外接函数从所述数据库连接池中申请并获取一个数据库连接；通过获取的数据库连接将所述字符文本按照预设的顺序发送至目标数据库。5.根据权利要求1所述的方法，其特征在于，所述获取的文本文件缓存在内存中。6.一种文本导入数据库的装置，其特征在于，包括：文本获取模块，用于间...

【专利技术属性】
技术研发人员：谢永恒，朱飞飞，万月亮，
申请(专利权)人：北京锐安科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人