python怎么导入excel数据

蜗牛先森

2025-6-23

告别手动输入：Python导入Excel数据，高效办公利器！教你轻松玩转数据，告别繁琐，拥抱Python自动化！

想让你的Python技能更上一层楼？那就得学会Python导入Excel数据！这可不是什么高深的魔法，掌握它，你就拥有了自动化处理数据的强大能力。别再手动复制粘贴了，那效率简直低到尘埃里。今天，咱们就聊聊如何用Python轻松搞定Excel数据导入。

首先，得明确一点：Python本身并不能直接读取Excel文件，我们需要借助一些第三方库。最常用的就是 pandas 和 openpyxl。个人更偏爱pandas，因为它用起来更简洁，功能也相当强大。如果你还没安装这两个库，赶紧打开你的终端，输入以下命令：

bash pip install pandas openpyxl

耐心等待安装完成，接下来就可以开始实战了。

先来一个最简单的例子，假设你有一个名为 "data.xlsx" 的Excel文件，想要读取它的所有数据：

```python
import pandas as pd

try:
df = pd.read_excel("data.xlsx")
print(df)
except FileNotFoundError:
print("文件未找到，请检查文件名和路径是否正确。")
except Exception as e:
print(f"读取文件时发生错误: {e}")
```

这段代码做了什么呢？首先，我们导入了 pandas 库，并用 pd 作为它的别名，方便后续调用。然后，使用 pd.read_excel() 函数读取 "data.xlsx" 文件，并将读取到的数据存储在一个 DataFrame 对象 df 中。最后，打印 df 的内容，你就能在控制台上看到Excel里的数据了。

但是，生活总是充满意外，万一 "data.xlsx" 文件不存在，或者文件格式不正确，程序就会报错。所以，我加入了 try...except 块来捕获可能出现的异常，并给出友好的提示信息。这绝对是个好习惯，能让你的程序更健壮。

等等，如果你的Excel文件有多个sheet，而你只想读取其中一个sheet的数据怎么办？没问题， pd.read_excel() 函数提供了 sheet_name 参数，可以指定要读取的sheet的名称或索引。比如，要读取名为 "Sheet2" 的sheet：

```python
import pandas as pd

try:
df = pd.read_excel("data.xlsx", sheet_name="Sheet2")
print(df)
except FileNotFoundError:
print("文件未找到，请检查文件名和路径是否正确。")
except Exception as e:
print(f"读取文件时发生错误: {e}")
```

或者，你想读取第3个sheet（索引从0开始）：

```python
import pandas as pd

try:
df = pd.read_excel("data.xlsx", sheet_name=2)
print(df)
except FileNotFoundError:
print("文件未找到，请检查文件名和路径是否正确。")
except Exception as e:
print(f"读取文件时发生错误: {e}")
```

是不是很简单？

除了读取整个sheet，有时候你可能只需要读取Excel文件中的一部分数据。比如，只想读取前10行数据，或者只读取特定的几列。这时，可以结合 nrows 和 usecols 参数来实现。

读取前10行数据：

```python
import pandas as pd

try:
df = pd.read_excel("data.xlsx", nrows=10)
print(df)
except FileNotFoundError:
print("文件未找到，请检查文件名和路径是否正确。")
except Exception as e:
print(f"读取文件时发生错误: {e}")
```

读取 "A"、"C" 和 "E" 三列数据：

```python
import pandas as pd

try:
df = pd.read_excel("data.xlsx", usecols="A,C,E")
print(df)
except FileNotFoundError:
print("文件未找到，请检查文件名和路径是否正确。")
except Exception as e:
print(f"读取文件时发生错误: {e}")
```

usecols 参数还可以使用列的索引，例如 usecols=[0, 2, 4] 表示读取第1、3、5列。

还有一个常见的问题：Excel文件的第一行通常是表头，也就是列名。默认情况下，pd.read_excel() 会将第一行作为列名。但如果你的Excel文件没有表头，或者表头不在第一行，你需要使用 header 参数来指定。

如果你的Excel文件没有表头：

```python
import pandas as pd

try:
df = pd.read_excel("data.xlsx", header=None)
print(df)
except FileNotFoundError:
print("文件未找到，请检查文件名和路径是否正确。")
except Exception as e:
print(f"读取文件时发生错误: {e}")
```

如果表头在第3行：

```python
import pandas as pd

try:
df = pd.read_excel("data.xlsx", header=2) # 索引从0开始，所以2代表第3行
print(df)
except FileNotFoundError:
print("文件未找到，请检查文件名和路径是否正确。")
except Exception as e:
print(f"读取文件时发生错误: {e}")
```

如果你的Excel文件里有一些缺失值，通常用空单元格表示，pandas 默认会将其识别为 NaN（Not a Number）。你可以使用 na_values 参数来指定其他值作为缺失值。比如，你想将 "NA" 和 "Missing" 也识别为缺失值：

```python
import pandas as pd

try:
df = pd.read_excel("data.xlsx", na_values=["NA", "Missing"])
print(df)
except FileNotFoundError:
print("文件未找到，请检查文件名和路径是否正确。")
except Exception as e:
print(f"读取文件时发生错误: {e}")
```

导入数据之后，就可以开始进行各种数据分析和处理了。pandas 提供了丰富的功能，例如数据清洗、数据转换、数据筛选、数据聚合等等。

例如，筛选出 "年龄" 大于 30 的行：

```python
import pandas as pd

try:
df = pd.read_excel("data.xlsx")
df_filtered = df[df["年龄"] > 30]
print(df_filtered)
except FileNotFoundError:
print("文件未找到，请检查文件名和路径是否正确。")
except Exception as e:
print(f"读取文件时发生错误: {e}")
```

或者，计算 "工资" 的平均值：

```python
import pandas as pd

try:
df = pd.read_excel("data.xlsx")
average_salary = df["工资"].mean()
print(f"平均工资: {average_salary}")
except FileNotFoundError:
print("文件未找到，请检查文件名和路径是否正确。")
except Exception as e:
print(f"读取文件时发生错误: {e}")
```

总而言之，Python导入Excel数据 是一个非常实用的技能。掌握 pandas 库，你可以轻松地读取、处理和分析Excel数据，极大地提高工作效率。而且，pandas 的功能远不止这些，它还有很多高级用法等待你去探索。赶紧动手试试吧，相信你会爱上用Python处理数据的感觉！这绝对是告别手动输入，拥抱高效办公的最佳选择。

作者：蜗牛先森

链接：https://www.livip.net/373

文章版权归作者所有，未经允许请勿转载。

THE END

Python单引号怎么打？超实用教程：Python单引号使用技巧和注意事项，新手秒懂！

<<上一篇

Python安装完毕后如何启动？新手Python打开运行指南

下一篇>>