Python轻松解决：python怎么导入excel文件，数据处理从此不烦恼！

蜗牛先森

2025-6-23

唉，说起导入excel，我跟你说，这简直是每个跟数据打交道的人，绕不开的一道坎儿。尤其是咱们这些用Python搞事情的，时不时就得从那些密密麻麻的表格里把数据揪出来，放进程序里头遛一遛。刚开始那会儿，别提多愁人了，手动复制粘贴？那简直是自虐。还好有Python，这工具箱里啥都有，导入excel？小意思！

你知道吗？我第一次用Python处理Excel，那感觉，就像发现了新大陆！以前看那些Excel文件，头都大，感觉数据都“锁”在里面，想拿出来用，费老大劲。现在不一样了，几行代码下去，哗啦一下，数据全出来了，清清爽爽地摆在那里，随便我怎么搓扁揉圆。这成就感，杠杠的！

其实，Python怎么导入excel，说白了，就是借助一些强大的第三方库。最有名的那个，哎呀，你应该听过吧？就是pandas。pandas这玩意儿，简直是数据处理界的瑞士军刀，无敌好用。它不仅能帮你把Excel文件里的数据读进来，还能帮你做各种各样的数据清洗、转换、分析。所以，你想导入excel，首选就是它。

用pandas导入excel，简单到哭。首先你得把它装上，这跟装其他Python库一个样，打开你的终端或者命令提示符，输入 pip install pandas openpyxl。为啥后面还有个 openpyxl 呢？因为 pandas 自己其实不直接读写 .xlsx 格式的Excel文件，它需要一个“帮手”，openpyxl 就是其中一个。装好了，你就可以开始魔法表演了。

导入库，这是第一步，总不能赤手空拳上阵吧？import pandas as pd，这句代码几乎成了我的肌肉记忆。然后，就是读文件了。假设你的Excel文件叫 我的数据.xlsx，放在你运行Python脚本的同一个文件夹里，那代码就是这么简单：

python excel_file = '我的数据.xlsx' df = pd.read_excel(excel_file)

看见没？就这一行 pd.read_excel()！神奇不神奇？它就像一个超级吸尘器，瞬间就把整个Excel表格的数据吸进了 df 这个变量里。这个 df 是个啥？它是 pandas 里一个非常非常重要的数据结构，叫 DataFrame。你可以把它想象成一个更灵活、更强大的表格，带有列名和行索引，操作起来那叫一个顺滑。

当然了，实际情况总比理想复杂点。你的Excel文件可能不止一个工作表（Sheet），可能有好几个呢。默认情况下，pd.read_excel() 会读取第一个工作表。如果你想读特定的工作表，比如名字叫“销售数据”的那个，也没问题：

python df_sales = pd.read_excel(excel_file, sheet_name='销售数据')

看到那个 sheet_name 参数了吗？给它指定工作表的名称或者索引（从0开始），就能精准地读取到你想要的数据。有时候，工作表的名字里可能有中文或者空格，别担心，pandas 通常都能处理，但最好还是老老实实地把名字写对。

还有啊，有时候Excel文件里不是从第一行第一列就开始放数据的，上面可能有标题、注释什么的。你可能想从第三行开始读数据，或者只读前100行。pandas 也考虑到了这些情况。你可以用 header 参数指定哪一行是列名（默认是0，也就是第一行），用 skiprows 参数跳过前面的几行，用 nrows 参数指定只读多少行。

比如，我想从第三行开始读数据，并且第三行是表头：

python df_partial = pd.read_excel(excel_file, header=2) # header=2 意味着第3行 (索引从0开始) 是表头

再比如，我只想看看前100行数据：

python df_top100 = pd.read_excel(excel_file, nrows=100)

这些参数组合起来用，几乎能应付绝大多数复杂的Excel文件结构。是不是感觉 Python导入excel 没那么难了？

用 pandas 读进来的数据，就像我前面说的，是 DataFrame 格式。这个 DataFrame 可厉害了，它身上自带了一大堆的方法和属性，能让你方便地查看数据、选择列、过滤行、排序、分组、聚合……简直是数据分析的乐园。

比如，你想看看数据长啥样，用 df.head() 看看前5行，或者 df.tail() 看看后5行。想看看每一列的数据类型和非空值数量？df.info() 就搞定。想看看数值列的统计信息（均值、标准差、最小值、最大值等等）？df.describe() 给你安排得明明白白。

有时候，Excel文件里会有缺失值，就是那些空着的单元格。用 pandas 读进来后，它们会变成 NaN（Not a Number）。pandas 有很多方法来处理这些缺失值，比如 df.dropna() 删除有缺失值的行或列，df.fillna() 用某个值或者其他方法（比如均值、中位数）填充缺失值。处理这些“脏”数据，是数据清洗的重要一步，而 pandas 让这变得轻松很多。

当然，Python导入excel 不只有 pandas 这一条路。如果你处理的是 .xls 格式的老式Excel文件，或者只需要非常基础的读写功能，可能 xlrd 和 xlwt 这两个库更适合你。不过话说回来，.xlsx 格式现在才是主流，而且 pandas 结合 openpyxl 或者 xlsxwriter（另一个写入 .xlsx 文件的库）的功能已经非常全面了，所以我个人更推荐 pandas。毕竟，学会一个强大的工具，能解决一大堆问题，何乐而不为呢？

我还记得有一次，公司有个同事拿来一个巨大的Excel文件，几十兆，里面有几万行数据，还分了十几个工作表。领导让分析里面的数据，同事愁眉苦脸的，说手动复制粘贴整理得花一天。我当时拍着胸脯说：“放心，交给我，Python分分钟搞定！” 回去后，用 pandas 写了个小脚本，也就十几行代码，把所有工作表的数据都读进来，合并到一起，然后做了简单的清洗和统计。不到半小时，结果就出来了。同事看我的眼神都变了，哈哈。那种用技术解决实际问题的感觉，真的太棒了！

所以你看，学会 python怎么导入excel，不仅仅是掌握了一个技术点，更重要的是，它解放了你的生产力，让你能把更多精力放在思考数据本身，而不是被繁琐的重复性工作绊住脚。无论是做数据分析、报表自动化、还是构建数据驱动的应用，导入excel 都是基础中的基础。

如果你刚开始学，别怕，动手写代码试试。从最简单的 pd.read_excel() 开始，慢慢摸索那些参数，多看看官方文档或者网上的教程。你会发现，pandas 的设计非常人性化，很多操作都直观易懂。遇到问题，去Stack Overflow或者中文技术社区搜搜，导入excel 这种常见问题，早就有人遇到并解决了。

总之，python怎么导入excel 这个问题，在我看来，已经不是一个难题，而是一个机遇。掌握了它，你就打开了Python进行数据处理的大门。那些原本躺在Excel文件里“睡大觉”的数据，都能被你唤醒，发挥出巨大的价值。去试试吧！相信我，一旦你体验过用Python丝滑地处理Excel数据，你就再也不想回到手动操作的“石器时代”了！别犹豫了，现在就开始你的 pandas 之旅，让导入excel 成为你的拿手好戏！

作者：蜗牛先森

链接：https://www.livip.net/335

文章版权归作者所有，未经允许请勿转载。

THE END

Python新手指南：轻松学会怎么新建Python文件，告别迷茫，快速上手编程！

<<上一篇

怎么打开python文件？零基础也能懂，告别抓瞎，轻松玩转代码！

下一篇>>