第四章 读取csv文件
00 min
2024-5-13

4.1 基本语法

4.2 常用参数

参数
参数值
作用
示例
header
n;None
n:将第n行作为列标签栏读取None:0开始的序列作为列标签默认第一行做列标签
header = None
n为整数
names
列表;元组等
设置列标签
names=list("abcde")
此为自定义列标签,header是指定某行为列标签
index_col
单个列标签名;[’便签名1’,’标签名2‘,….]
将某列作为行索引标签读取
index_col=["工号","姓名"] index_col = “工号”
行索引可以是多个,为多重索引
usecols
单个列标签名;[’便签名1’,’标签名2‘,….]
读取指定列
usecols=["工号","姓名"] usecols = “工号”
skiprows
n;[n,i,h,…..];[n]
跳过前n行读取数据 跳过第n,i,h行读取数据 跳过第n行数据
skiprows=2 skiprows = [1,2]
skipfooter
n(1开始)
跳过末尾倒数前n行
skipfooter = 1
需要配合参数engine="python" 一起使用(该参数不支持c语言解释器)
nrows
n
只读取文件的第0~n行数据(n+1行)
nrows = 3
如果自定义了列索引标签,那么参数就只读取文件的第0~n-1行(n行)
dtype
字典
正确指定每列的数据类型
dtype = {列标签名:数据类型;}
true_values
包含元素的列表
将文件内容中选定的列表元素转换成True
true_values = [”yes”,”no”]
示例中是将读取内容中所有yes,no转换成True来读取
false_values
包含元素的列表
将文件内容中选定的列表元素转换成False
false_values = [”yes”,”no”]
示例中是将读取内容中所有yes,no转换成False来读取
parse_dates
[列索引标签名]
将指定列数据作为日期类型数据进行读取
parse_dates=["最后一次参考日期"] parse_datas=[[”最后一次参考日期”,”参考时间”]]
示例中第二个例子,通过列表的列表的方式将两个数据合并在一块进行读取。两列标签名也通过下划线合并。并放置在第一列读取。
na_values
包含元素的列表
将特定的值做为缺失值读取
na_values=["no","yes"]
示例中是将读取内容中所有yes,no转换成缺失值来读取