什么是CSV格式文件

​ 逗号分隔值(Comma-Separated Values,CSV),其文件以纯文本形式存储表格数据(数字和文本),文件的每一行都是一个数据记录。每个记录由一个或多个字段组成,用逗号分隔。使用逗号作为字段分隔符是此文件格式的名称的来源,因为分隔字符也可以不是逗号,有时也称为字符分隔值。

​ CSV广泛用于不同体系结构的应用程序之间交换数据表格信息,解决不兼容数据格式的互通问题,一般按照传输双方既定标准进行格式定义,而其本身并无明确格式标准。

​ CSV泛指满足以下条件的文件:

  • 纯文本,使用某个字符集,比如ASCII、Unicode、EBCDIC或GB2312;
  • 由记录组成(典型的是每行一条记录);
  • 每条记录被分隔符分隔为字段(典型分隔符有逗号、分号或制表符;有时分隔符可以包括可选的空格);
  • 每条记录都有同样的字段序列。

CSV的格式规范

  1. 每一行记录位于一个单独的行上,用回车换行符CRLF(也就是\r\n)分割。

  2. 文件中的最后一行记录可以有结尾回车换行符,也可以没有。

  3. 第一行可以存在一个可选的标题头,格式和普通记录行的格式一样。标题头要包含文件记录字段对应的名称,应该有和记录字段一样的数量。(在MIME类型中,标题头行的存在与否可以通过MIME type中的可选”header”参数指明)。

  4. 在标题头行和普通行每行记录中,会存在一个或多个由半角逗号(,)分隔的字段。整个文件中每行应包含相同数量的字段,空格也是字段的一部分,不应被忽略。每一行记录最后一个字段后不能跟逗号。(通常用逗号分隔,也有其他字符分隔的CSV,需事先约定)。

  5. 每个字段可用也可不用半角双引号(“)括起来(不过有些程序,如Microsoft的Excel就根本不用双引号)。如果字段没有用引号括起来,那么该字段内部不能出现双引号字符。

  6. 字段中若包含回车换行符、双引号或者逗号,该字段需要用双引号括起来。

  7. 如果用双引号括字段,那么出现在字段内的双引号前必须加一个双引号进行转义。

生成CSV文件

  1. 用Excel编辑完成,选择另存为.csv文件,提示什么都选择是。
  2. 用Notepad++打开.csv文件,将编码格式改为UTF-8,顺便检查下是不是分割之间有多余空格,有空格就得重新制作。