效率翻倍秘籍：python怎么调用文件的全方位实用攻略

蜗牛先森

2025-6-23

坐在一堆文件堆前，心里嘀咕，这堆东西——日志、配置、报告、天知道啥格式的数据——怎么让我的Python程序认识它们、读懂它们、甚至改写它们？没错，这就是我们在写代码时绕不开的话题：python怎么调用文件。别小看这事儿，看似简单，里头门道可不少，一不留神就可能踩坑，轻则程序报错，重则数据丢失，或者更郁闷的是，程序跑得跟蜗牛一样慢。

咱就从最基础、也是最核心的那个函数说起吧——open()。这玩意儿，就像你敲开一扇门，告诉系统：“嘿，我想跟这个文件打交道。” 用法也直观：open(文件名, 模式, 编码)。文件名好说，就是你想折腾的那个文件路径。模式（mode），这可是个关键参数，决定了你是想读文件、写文件、还是追加内容，或者是处理二进制文件。

最常用的几种模式：
- 'r'：只读模式。文件必须存在，不然直接FileNotFoundError伺候。你只能看，不能改。
- 'w'：写入模式。如果文件存在，内容会被清空！对，是清空！然后从头开始写。如果文件不存在，就新建一个。使用这个模式要千万小心，一不注意就把老数据冲光了。
- 'a'：追加模式。如果文件存在，新内容会加到文件末尾。如果文件不存在，也新建一个。适合写日志什么的，旧数据不影响。
- 'b'：二进制模式。这个不能单独用，得跟上面几种组合，比如'rb'（读二进制）、'wb'（写二进制）。处理图片、音频、视频或者其他非文本文件时，就得用这个。文本模式（默认）会做编码转换，二进制模式则不会，直接按字节处理。
- '+'：读写模式。比如'r+'就是既能读也能写，打开时文件必须存在。'w+'也是读写，但会先清空文件（或新建）。'a+'也是读写，写入在末尾追加，读取可以从头开始。

你看，光是这个模式，就有这么多花样。python怎么调用文件的第一步，就是得搞清楚你到底想对文件干嘛，选对模式。

接着是编码（encoding）。哎呀，这个参数可是我踩过不少坑的地方！尤其是处理从不同系统或者不同地方拿来的文件，乱码简直是家常便饭。你满心欢喜地读进来，结果屏幕上蹦出一堆“��”或者奇奇怪怪的符号，那感觉……真是瞬间泄气。默认情况下，Python 3 会尝试使用系统的默认编码，但这玩意儿在Windows上可能是GBK，在Linux或macOS上通常是UTF-8。一旦文件编码跟系统默认的不一致，就等着看乱码吧。所以，我的经验是，处理文本文件时，最好显式指定编码，特别是encoding='utf-8'**。这是目前最通用、兼容性最好的编码。别偷懒，加上它能省你N多麻烦。比如open('my_data.txt', 'r', encoding='utf-8')。

打开文件后，你就得到了一个文件对象（file object）。这个对象有很多方法，让你跟文件内容互动。

怎么读文件呢？
- read(size=-1)：这就像一口气把整本书都塞进脑子里。size参数指定读取的字节数或字符数，默认-1就是全部读完。注意：如果文件特别大，比如几个G的日志文件，read()一下全部读到内存里，你的电脑可能直接就卡死给你看，甚至内存溢出。慎用！
- readline()：一行一行地读。每次调用读一行，直到文件末尾。适合逐行处理逻辑，比如解析配置文件或者分析日志。
- readlines()：把文件里所有行都读出来，然后放到一个列表中，列表里的每个元素就是文件里的一行（包含换行符）。跟read()类似，大文件下也可能吃掉大量内存。
- 直接迭代文件对象：这是读文件的Pythonic方式，也是处理大文件的黄金法则。for line in file_object: 这样写，Python会高效地一行一行读取，每次只加载一行到内存。内存占用低，速度快。推荐这种方式！

怎么写文件呢？
- write(string)：把一个字符串写入文件。记得，用'w'模式会先清空，用'a'模式会追加。写二进制文件就用write(bytes)。
- writelines(list_of_strings)：把一个字符串列表写入文件。注意，这个方法不会自动加换行符，如果需要每行一个元素，列表里的字符串本身就得带\n。

写完或者读完，千万记住要关闭文件！ 用完的资源得释放掉。手动关闭是调用文件对象的close()方法。file_object.close()。

但手动关闭文件，尤其是在代码逻辑复杂或者出现异常时，很容易忘记。文件没关会导致资源泄露，严重的可能影响系统性能，甚至文件数据损坏。有没有更省心的办法？当然有！

with open(...)：文件的守护神！
Python提供了with open(...) as file_object: 这种结构，这玩意儿实现了上下文管理协议。简单说，就是你把文件操作代码写在with块里面，不管里面的代码是正常执行完了，还是中间抛了异常，Python都保证在with块结束时，文件会被自动关闭。这简直是解放双手，避免低级错误的神器！ 写文件操作，强烈建议都用with open。这是写出健壮、可靠代码的基础。

比如：
python try: with open('my_config.txt', 'r', encoding='utf-8') as f: content = f.read() # 在这里处理文件内容 # with块结束，文件f自动关闭 except FileNotFoundError: print("啊哦，配置文件找不到了！") except Exception as e: print(f"读文件时出错了：{e}")
看，简洁又安全。异常处理也是文件操作不得不考虑的一环。文件可能不存在、路径不对、没权限写等等，用try...except把这些潜在的文件调用问题捕获住，程序才不会轻易崩溃。

文件路径也是个坑。有时候你代码在A目录，要调用的文件在B目录，写路径时就得小心了。相对路径（相对于当前脚本运行目录）和绝对路径（从文件系统根目录开始的完整路径）别搞混。跨平台时，路径分隔符（Windows用\，Linux/macOS用/）也可能捣乱。os.path模块提供了一些处理路径的函数，比如os.path.join()可以帮你稳妥地拼接路径，不用管平台差异。

更现代、更“Pythonic”处理路径的方式是使用pathlib模块。pathlib提供了面向对象的路径操作。你可以像操作字符串一样拼接路径，检查文件是否存在，获取文件信息等等，代码写起来更直观、更不容易出错。比如from pathlib import Path; p = Path('my_data') / 'config.json'; if p.exists(): print(f"文件 {p} 在这里！")。跟老式的os.path比，pathlib用起来感觉更顺畅。

当然，我们调用的文件不仅仅是简单的文本文件或者二进制文件。很多时候，我们处理的是结构化数据，比如CSV、JSON、XML、Excel等等。虽然底层还是文件读写，但我们通常不会直接用open()然后手动去解析那些逗号、花括号、标签。Python生态圈里有各种强大的库来帮你：
- CSV文件：csv模块。专门用来读写CSV，能帮你处理各种分隔符、引号、编码问题。
- JSON文件：json模块。读写JSON数据，非常方便，直接在Python字典/列表和JSON字符串之间转换。
- Excel文件（.xlsx）：openpyxl、xlrd/xlwt（虽然xlrd新版不再支持.xlsx）、pandas。特别是pandas，处理结构化数据简直是神器，读写Excel文件那是小菜一碟。
- XML文件：xml.etree.ElementTree等模块。

这些库的存在，让python怎么调用文件这件事，变得更加高效和便捷，尤其当你处理的是特定格式的数据时。你只需要调用库提供的高级接口（比如pandas.read_excel()），底层的文件操作和数据解析都帮你封装好了。

总的来说，掌握python怎么调用文件，核心是理解open()函数及其参数（模式、编码），熟练运用with open确保资源管理，知道不同的读取和写入方法及其适用场景（特别是迭代文件对象处理大文件），警惕编码和路径问题，并善于利用Python丰富的标准库和第三方库来处理特定文件格式。这不仅仅是记住几个函数的事儿，更是在实际应用中不断摸索、踩坑、然后找到最优雅、最高效解决方案的过程。多写写代码，多试试不同的文件，这些知识点自然就刻进你的脑子里了。

作者：蜗牛先森

链接：https://www.livip.net/331

文章版权归作者所有，未经允许请勿转载。

THE END

Python根号怎么打？3种实用方法，快速掌握Python数学运算技巧，根号计算不再是难题！

<<上一篇

Python删除文件：实用方法、安全考量与异常处理详解

下一篇>>