读取excel文件read_excel()--Pandas

1. 函数功能

读取excel文件，支持读取xls,xlsx,xlsm等类型的EXCEL文件。能够读取一个sheet表或多个sheet表

2. 函数语法

pandas.read_excel(io, sheet_name=0, *, header=0, names=None, index_col=None, 
usecols=None, squeeze=None, dtype=None, engine=None, converters=None, 
true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, 
keep_default_na=True, na_filter=True, verbose=False, parse_dates=False, 
date_parser=None, thousands=None, decimal='.', comment=None, skipfooter=0, 
convert_float=None, mangle_dupe_cols=True, storage_options=None)

3. 函数参数

3.1 读取文件

参数	含义
IO	文件路径
sheetname	读取的sheet表，取值可以是字符串、表示sheet索引的整数，或列表；取值为None时表示读取所有的sheet表数据；默认读取第一个sheet的数据

3.1.1 默认读取第一个sheet表

在这里插入图片描述

3.1.2 指定读取文件的索引

在这里插入图片描述

3.1.3 指定读取文件的名字

在这里插入图片描述

3.1.4 读取多个文件

可以使用文件名或文件索引组成的列表或者sheet_name=None：
读取的内容将：以DataFrame组成的字典形式展示
在这里插入图片描述

3.2 其他常用参数

参数	含义
IO	文件路径
sheetname	读取的sheet表，取值可以是字符串、表示sheet索引的整数，或列表；取值为None时表示读取所有的sheet表数据；默认读取第一个sheet的数据
header	用于列名的行，默认取值为0，第一行作为列名，当文件中不存在列名时，指定header=None
names	指定列名，当文件中不存在列名，可通过header=None,并指定列名names列表
index_col	指定用于数据框行标签的列，默认值为None，不存在这样的列，会创建range(n)的行标签
usecols	选取要读取的列，默认取值为None，表示读取所有列；取值可以是字符串或者字符串或索引值组成的列表
skiprows	取值可以是要跳过的行索引组成的列表；也可以是整数表示要从头开始要跳过的行数
nrows	整数，指定读取数据的行数
na_values	指定识别为空值NA的内容，取值为字符串、数值、列表或字典
keep_default_na	布尔值，默认取值为TRUE，是否将默认为空值的字符串识别为NaN

详细内容参见：读取csv格式的数据–Pandas