读取excel文件read_excel()--Pandas

1. 函数功能

读取excel文件,支持读取xls,xlsx,xlsm等类型的EXCEL文件。能够读取一个sheet表或多个sheet表

2. 函数语法

pandas.read_excel(io, sheet_name=0, *, header=0, names=None, index_col=None, 
usecols=None, squeeze=None, dtype=None, engine=None, converters=None, 
true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, 
keep_default_na=True, na_filter=True, verbose=False, parse_dates=False, 
date_parser=None, thousands=None, decimal='.', comment=None, skipfooter=0, 
convert_float=None, mangle_dupe_cols=True, storage_options=None)

3. 函数参数

3.1 读取文件

参数含义
IO文件路径
sheetname读取的sheet表,取值可以是字符串、表示sheet索引的整数,或列表;取值为None时表示读取所有的sheet表数据;默认读取第一个sheet的数据

3.1.1 默认读取第一个sheet表

在这里插入图片描述

3.1.2 指定读取文件的索引

在这里插入图片描述

3.1.3 指定读取文件的名字

在这里插入图片描述

3.1.4 读取多个文件

可以使用文件名或文件索引组成的列表或者sheet_name=None:
读取的内容将: 以DataFrame组成的字典形式展示
在这里插入图片描述

3.2 其他常用参数

参数含义
IO文件路径
sheetname读取的sheet表,取值可以是字符串、表示sheet索引的整数,或列表;取值为None时表示读取所有的sheet表数据;默认读取第一个sheet的数据
header用于列名的行,默认取值为0,第一行作为列名 ,当文件中不存在列名时,指定header=None
names指定列名,当文件中不存在列名,可通过header=None,并指定列名names列表
index_col指定用于数据框行标签的列,默认值为None,不存在这样的列,会创建range(n)的行标签
usecols选取要读取的列,默认取值为None,表示读取所有列;取值可以是字符串或者字符串或索引值组成的列表
skiprows取值可以是要跳过的行索引组成的列表;也可以是整数表示要从头开始要跳过的行数
nrows整数,指定读取数据的行数
na_values指定识别为空值NA的内容,取值为字符串、数值、列表或字典
keep_default_na布尔值,默认取值为TRUE,是否将默认为空值的字符串识别为NaN

详细内容参见:读取csv格式的数据–Pandas