Python 文件操作指南：python怎么打开文件？入门到精通看这里！

蜗牛先森

2025-6-23

说起用python怎么打开文件，这事儿啊，就像咱们日常出门得先开门一样，是编程里再寻常不过、却又至关重要的一步。你想读个配置文件？想处理个日志文件？想把计算结果保存下来？统统绕不开“打开”这道坎儿。别看操作简单，里头门道可不少，特别是新手朋友，一不小心就可能踩坑，文件没关啦，编码错了啦，权限不够啦，头疼的事儿一箩筐。所以今天，咱们就敞开了聊聊，这python怎么打开文件，到底有哪些姿势，哪些细节，能让你写出来的代码既优雅又健壮。

最基础、最经典的，就是那个大名鼎鼎的open()函数了。这玩意儿，简直是Python文件操作的基石。你想打开文件？open()！你想读文件？open()！你想写文件？还是open()！就像万金油一样。但用它，得知道点规矩。

首先，最简单的用法是这样：

```python

打开一个文件进行读取

f = open('my_document.txt', 'r')

接下来就可以对文件对象 f 进行读写操作了

...

记得关掉文件

f.close()
```

看到了吧？open()函数至少需要两个参数：文件名（或者文件的完整路径），以及打开模式。这里的'r'就是模式之一，表示读取（read）。模式可不止这一种，这就像你开门，得知道你是进去拿东西（读），还是进去放东西（写），还是进去修修补补（追加）。常用的模式有：

'r'：读取模式。这是默认模式。文件必须存在，否则会报错。你只能读，不能写。
'w'：写入模式。如果文件存在，会清空原有内容再写入；如果文件不存在，会创建新文件。你只能写，不能读（虽然理论上可以，但不推荐，而且写模式打开的文件，光标是在开头，你写入内容后要读取，得先seek到开头，麻烦）。
'a'：追加模式。如果文件存在，新内容会追加到文件末尾；如果文件不存在，会创建新文件。光标默认就在文件末尾。
'b'：二进制模式。比如处理图片、音频等非文本文件时，就得用这个模式。它可以跟 'r'、'w'、'a' 结合使用，比如 'rb'、'wb'、'ab'。
't'：文本模式。这是默认模式。处理文本文件时用。它也可以跟 'r'、'w'、'a' 结合使用，比如 'rt'、'wt'、'at'。如果你不指定，默认就是文本模式（比如 'r' 等价于 'rt'）。
'+'：更新模式。这个厉害了，允许你同时进行读写操作。它可以跟 'r'、'w'、'a' 结合，比如 'r+'（读写，光标在开头，文件不存在报错）、'w+'（读写，文件存在清空，不存在创建，光标在开头）、'a+'（读写，文件存在追加，不存在创建，光标在末尾）。

模式这块儿，得根据你的实际需求来定。别稀里糊涂地用，特别是'w'模式，一不小心就可能把你的重要文件给“擦掉”了，哭都没地儿哭去。

现在，咱们回到刚才那个例子，有没有发现一个问题？f.close()！这玩意儿啊，特别容易忘。尤其是在代码写嗨了的时候，或者程序运行过程中出了异常，close()那行代码还没来得及执行，文件就没被关掉。这叫资源泄漏，小问题积累多了，就可能导致程序不稳定，甚至影响系统性能。这可不是闹着玩的。

那有没有更“保险”的方式呢？当然有！Python早就为咱们想好了，那就是with open(...) as ...:语法。这简直是处理文件的神器！

```python

使用 with 语句打开文件，进行读取

with open('my_document.txt', 'r') as f:
# 在这里对文件对象 f 进行操作，比如读取内容
content = f.read()
print(content)

程序块退出后，文件会自动关闭，即使中间发生异常

不再需要 f.close()

print("文件已经自动关闭了！")
```

看看，是不是清爽多了？使用了with语句后，不管你在with代码块里做了啥，哪怕是发生了天大的异常，Python都会保证文件在代码块结束时被妥善地关闭。这省去了咱们手动调用close()的麻烦，也大大降低了资源泄漏的风险。强烈推荐！以后打开文件，尽量都用with语句，养成好习惯，代码质量噌噌往上涨。

除了模式，open()函数还有其他一些有用的参数，比如encoding（编码）和errors（错误处理）。

编码（encoding）这事儿，在处理文本文件时尤为重要。咱们知道，计算机存取文字，不是直接存汉字、字母，而是存它们的数字表示，这就是编码。常见的有UTF-8、GBK、GB2312等等。如果你打开一个文件时，用的编码方式跟文件实际保存时的编码方式不一样，那读出来的内容就可能是乱码，或者直接报错。比如，你用UTF-8编码写了个文件，然后用默认的系统编码（可能是GBK）去读，就可能看到一堆“锟斤拷”之类的“火星文”。

```python

指定编码打开文件

with open('utf8_file.txt', 'r', encoding='utf-8') as f:
content = f.read()
print(content)

如果不知道文件编码，可能会这样（假设文件是UTF-8）

with open('utf8_file.txt', 'r') as f: # 此时默认编码可能是GBK

content = f.read() # 可能会报错或读出乱码

print(content)

```

所以，打开文本文件时，明确指定encoding参数是个非常好的习惯，特别是处理那些来自不同系统、不同来源的文件时。UTF-8是目前最通用的编码，能表示世界上绝大多数文字，首选它通常不会错。

错误处理（errors）参数，是用来告诉Python，当在编码/解码过程中遇到无法处理的字符时，该怎么办。默认是'strict'，也就是严格模式，遇到错误直接抛异常。其他选项还有：

'ignore'：忽略错误字符，直接跳过。读出来的内容可能不完整，但不会报错。
'replace'：用一个替代字符（通常是问号?或Unicode的\ufffd）替换错误字符。
'backslashreplace'：用Python的backslash escape序列（比如\xYY或\uXXXX）来表示错误字符。
'xmlcharrefreplace'：用XML的字符引用（比如&#NNNN;或&#xNNNN;）来表示错误字符。
'namereplace'：用\N{...}格式来表示错误字符的名字（如果字符有名字的话）。

这个参数用得相对少些，一般在处理“脏”数据或者做字符转换时可能会用到。大多数时候，如果你指定了正确的编码，不太会遇到编码错误。

除了open()函数本身，打开文件后得到的那个文件对象f，才是真正能让你“干活”的家伙。这个文件对象有很多有用的方法，比如：

read(size=-1)：读取文件内容。size是可选参数，表示读取的字节数（二进制模式）或字符数（文本模式）。如果省略或为负数，则读取整个文件。
readline()：读取文件的一行内容，包括换行符。
readlines()：读取文件的所有行，返回一个包含每行内容的列表。
write(str)：向文件写入一个字符串（文本模式）或字节串（二进制模式）。
writelines(lines)：向文件写入一个包含字符串（或字节串）的序列（比如列表）。注意，不会自动添加换行符，如果需要换行，得自己在字符串里加上\n。
seek(offset, whence=0)：改变文件当前的位置（光标）。offset是偏移量。whence是可选参数，表示从哪个位置开始计算偏移：0表示文件开头（默认），1表示当前位置，2表示文件末尾。
tell()：返回文件当前的偏移量。
flush()：将内部缓冲区的数据立刻写入文件。

这些方法就像工具箱里的各种工具，根据你的需要来选择。你想一行一行处理大文件？用readline()或者直接遍历文件对象（文件对象本身就是可迭代的，遍历它会一行一行地读取）。你想把一堆数据一次性写入文件？把数据放到列表里，然后用writelines()。想在文件里跳来跳去？seek()和tell()就派上用场了。

举个例子，咱们来个有点“画面感”的场景。假设你有个日志文件，叫server.log，记录着服务器的运行信息。你现在想找到所有包含“ERROR”的行，并且把它们保存到一个新的文件里，叫errors.log。

```python
try:
# 以读取模式打开日志文件，假设它是UTF-8编码
with open('server.log', 'r', encoding='utf-8') as infile:
# 以写入模式打开新的错误日志文件
with open('errors.log', 'w', encoding='utf-8') as outfile:
print("正在处理日志文件，查找错误信息...")
line_num = 0
# 逐行读取源文件
for line in infile:
line_num += 1
# 判断这一行是否包含 "ERROR"
if "ERROR" in line:
print(f"在第 {line_num} 行找到错误：{line.strip()}") # strip()去掉行末的换行符
# 如果包含，就写入到错误日志文件
outfile.write(line)
print("错误信息提取完毕！")
except FileNotFoundError:
print("呀！找不到 server.log 文件，请检查路径是否正确。")
except Exception as e:
print(f"处理文件时发生意外错误：{e}")

```

这段代码，是不是一下子就把前面讲的打开文件（用了with语句，指定了编码）、读取文件（逐行遍历）、判断内容、写入新文件这些操作串起来了？而且还加了try...except来处理文件找不到或者其他可能的异常，让程序更健壮。

最后，再提一点关于二进制模式的事儿。处理图片、音频、视频、或者一些特定的数据文件时，你得用'rb'、'wb'等模式。在二进制模式下，你读写的是bytes类型的数据，而不是字符串。比如，读取一张图片：

python try: with open('my_image.jpg', 'rb') as img_file: # 读取图片的全部二进制数据 img_data = img_file.read() print(f"成功读取图片文件，大小为 {len(img_data)} 字节。") # 你可以对 img_data 做进一步处理，比如保存到新的文件 # with open('new_image.jpg', 'wb') as new_img_file: # new_img_file.write(img_data) except FileNotFoundError: print("图片文件没找到，请检查路径。") except Exception as e: print(f"读取图片时出错了：{e}")

看到了吗？跟文本模式最大的区别就是读出来的数据类型。记住，二进制模式操作的是字节，文本模式操作的是字符（字符串）。两者不能混淆。

总结一下，python怎么打开文件，关键在于理解open()函数的用法，特别是模式和编码这两个重要参数。然后，务必使用with语句来确保文件被正确关闭。掌握了这些，再加上文件对象的各种读写方法，处理文件这事儿，对你来说就再也不是难事儿了。别怕写错，多练几次，自然就熟了。编程嘛，就是在不断地尝试和纠错中进步的！加油！

作者：蜗牛先森

链接：https://www.livip.net/363

文章版权归作者所有，未经允许请勿转载。

THE END

Python 怎么结束程序？三种方法教你轻松退出 Python 程序的运行

<<上一篇

新手必看：轻松学会python怎么打开idle图文详解

下一篇>>