文件的处理方法、设备及可读存储介质技术

技术编号:26259764 阅读:38 留言:0更新日期:2020-11-06 17:54
本公开实施例提供的文件的处理方法、设备及可读存储介质,包括:接收字符分割值CSV文件,并将CSV文件中的文件内容转换为字节数组;根据字节数组确定CSV文件的编码格式;根据编码格式确定CSV文件中的文件数据。本公开实施例提供的方法、设备及可读存储介质能够将CSV文件转换为字节数组,再基于字节数组确定文件的编码格式,进而能够准确的解析CSV文件,避免由于不知道文件格式编码,导致出现数据乱码、编码错误的问题。

【技术实现步骤摘要】
文件的处理方法、设备及可读存储介质
本公开实施例涉及文件处理技术,尤其涉及一种文件的处理方法、设备及可读存储介质。
技术介绍
字符分割值(Comma-SeparatedValues,CSV)文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。CSV文件经常用来作为不同程序之间的数据交互的格式。因此,需要对CSV文件进行读取操作,但是,CSV文件的编码格式较多,在读取CSV文件时容易造成数据乱码、编码错误等问题。
技术实现思路
本公开实施例提供一种文件的处理方法、设备及可读存储介质,以解决在处理CSV文件时出现的数据乱码、编码错误等问题。第一方面,本公开实施例提供一种文件的处理方法,包括:接收字符分割值CSV文件,并将所述CSV文件中的文件内容转换为字节数组;根据所述字节数组确定所述CSV文件的编码格本文档来自技高网...

【技术保护点】
1.一种文件的处理方法,其特征在于,包括:/n接收字符分割值CSV文件,并将所述CSV文件中的文件内容转换为字节数组;/n根据所述字节数组确定所述CSV文件的编码格式;/n根据所述编码格式确定所述CSV文件中的文件数据。/n

【技术特征摘要】
1.一种文件的处理方法,其特征在于,包括:
接收字符分割值CSV文件,并将所述CSV文件中的文件内容转换为字节数组;
根据所述字节数组确定所述CSV文件的编码格式;
根据所述编码格式确定所述CSV文件中的文件数据。


2.根据权利要求1所述的方法,其特征在于,所述根据所述编码格式确定所述CSV文件中的文件数据,包括:
根据所述编码格式确定解读器,并通过所述解读器读取所述字节数组中包括的分隔符;
根据读取的所述分隔符确定所述CSV文件中的文件数据。


3.根据权利要求1所述的方法,其特征在于,所述根据所述字节数组确定所述CSV文件的编码格式,包括:
识别所述字节数组中的字符分布方式,并根据所述字符分布方式确定所述CSV文件的编码格式。


4.根据权利要求2所述的方法,其特征在于,所述根据读取的所述分隔符确定所述CSV文件中的文件数据,包括:
根据读取到的多种分隔符的数量确定目标分隔符;
根据所述目标分隔符确定所述CSV文件中的文件数据。


5.根据权利要求1-4任一项所述的方法,其特征在于,将所述CSV文件中的文件内容转换为字节数组时,若所述文件内容中包括预设字符,将所述CSV文件的编码格式由第一类型转换为第二类型。


6.根据权利要求5所述的方法,其特征在于,所述将所述CSV文件的编码格式由第一类型转换为第二类型,包括:
...

【专利技术属性】
技术研发人员:江国洲
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1