【技术实现步骤摘要】
文件的处理方法、设备及可读存储介质
本公开实施例涉及文件处理技术,尤其涉及一种文件的处理方法、设备及可读存储介质。
技术介绍
字符分割值(Comma-SeparatedValues,CSV)文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。CSV文件经常用来作为不同程序之间的数据交互的格式。因此,需要对CSV文件进行读取操作,但是,CSV文件的编码格式较多,在读取CSV文件时容易造成数据乱码、编码错误等问题。
技术实现思路
本公开实施例提供一种文件的处理方法、设备及可读存储介质,以解决在处理CSV文件时出现的数据乱码、编码错误等问题。第一方面,本公开实施例提供一种文件的处理方法,包括:接收字符分割值CSV文件,并将所述CSV文件中的文件内容转换为字节数组;根据所述字节数组确定所 ...
【技术保护点】
1.一种文件的处理方法,其特征在于,包括:/n接收字符分割值CSV文件,并将所述CSV文件中的文件内容转换为字节数组;/n根据所述字节数组确定所述CSV文件的编码格式;/n根据所述编码格式确定所述CSV文件中的文件数据。/n
【技术特征摘要】
1.一种文件的处理方法,其特征在于,包括:
接收字符分割值CSV文件,并将所述CSV文件中的文件内容转换为字节数组;
根据所述字节数组确定所述CSV文件的编码格式;
根据所述编码格式确定所述CSV文件中的文件数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述编码格式确定所述CSV文件中的文件数据,包括:
根据所述编码格式确定解读器,并通过所述解读器读取所述字节数组中包括的分隔符;
根据读取的所述分隔符确定所述CSV文件中的文件数据。
3.根据权利要求1所述的方法,其特征在于,所述根据所述字节数组确定所述CSV文件的编码格式,包括:
识别所述字节数组中的字符分布方式,并根据所述字符分布方式确定所述CSV文件的编码格式。
4.根据权利要求2所述的方法,其特征在于,所述根据读取的所述分隔符确定所述CSV文件中的文件数据,包括:
根据读取到的多种分隔符的数量确定目标分隔符;
根据所述目标分隔符确定所述CSV文件中的文件数据。
5.根据权利要求1-4任一项所述的方法,其特征在于,将所述CSV文件中的文件内容转换为字节数组时,若所述文件内容中包括预设字符,将所述CSV文件的编码格式由第一类型转换为第二类型。
6.根据权利要求5所述的方法,其特征在于,所述将所述CSV文件的编码格式由第一类型转换为第二类型,包括:
...
【专利技术属性】
技术研发人员:江国洲,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。