嘿，伙计们，有没有哪个瞬间，你看着屏幕上那一堆乱糟糟的数据，心里就只有一个念头：怎么把它规规矩矩、完美无缺地塞进CSV里去？尤其是当你需要往一个已经存在的CSV文件里“加点料”，或者更高级一点，在特定位置“插入”些新信息时，Python怎么插入CSV，这事儿看似简单，可里头的弯弯绕绕，真能让人抓狂。我当年可是吃了不少亏，才摸索出点门道来，今天就跟大家伙儿掰扯掰扯，这背后的酸甜苦辣。

你瞧，这CSV文件，别看它朴素，逗号分隔，简直就是数据界的“万金油”，无论是数据分析师、程序员还是普通办公族，几乎没人能绕开它。它简单、直接、兼容性好，所以，学会用Python玩转它，尤其是高效、安全地往里面“塞”数据，那绝对是行走江湖的一把利器。

咱们先从最基本、也是最常用的“插入”方式聊起，那就是追加（Append）。没错，你没听错，很多时候我们嘴上说着“插入”，其实干的都是“追加”的活儿。这就像你往一摞纸的末尾再加几张，而不是非得在中间硬塞。对CSV这种纯文本文件来说，追加操作是最直接、最省力的。

在Python里，处理CSV文件，自带的 csv 模块那绝对是你的不二之选。它轻量、高效，无需安装第三方库，就能满足你大部分需求。

“`python
import csv
import os # 待会儿判断文件是否存在会用到

咱们先准备点数据

new_data_rows = [
[‘Python’, ‘3.9’, ‘数据处理’, ‘2020’],
[‘Pandas’, ‘1.3’, ‘数据分析’, ‘2021’],
[‘Numpy’, ‘1.20’, ‘科学计算’, ‘2020’]
]

文件的名字

csv_file_name = ‘my_software_list.csv’

print(f”准备向文件 ‘{csv_file_name}’ 追加数据…”)

第一次写入，通常需要先写入表头

这里有个小技巧，我一般会先检查文件是否存在或是否为空，避免重复写入表头

file_exists = os.path.exists(csv_file_name)
is_empty = False
if file_exists:
with open(csv_file_name, ‘r’, newline=”, encoding=’utf-8′) as f:
first_char = f.read(1)
if not first_char: # 文件存在但内容为空
is_empty = True
f.seek(0) # 读完一个字符后，把文件指针移回开头

核心来了：以追加模式打开文件，并处理表头

with open(csv_file_name, ‘a’, newline=”, encoding=’utf-8′) as f:
writer = csv.writer(f)

# 只有当文件不存在或者文件为空时，才写入表头
if not file_exists or is_empty:
    writer.writerow(['Name', 'Version', 'Category', 'Year'])
    print("已写入表头。")

# 逐行写入数据
for row in new_data_rows:
    writer.writerow(row)
    print(f"追加数据: {row}")

print(f”数据已成功追加到 ‘{csv_file_name}’。”)

读出来看看是不是真加进去了

print(“\n查看文件内容：”)
with open(csv_file_name, ‘r’, newline=”, encoding=’utf-8′) as f:
reader = csv.reader(f)
for row in reader:
print(row)
“`

你有没有注意到代码里有个newline=''？这可不是什么小打小闹，这玩意儿是关键中的关键！如果你不加它，尤其是在Windows系统上，每次写入CSV文件时，Python会把你代码里的换行符（\n）再给你自动转换一遍，结果就是每行数据之间多了一个空行，那画面，简直不忍直视，乱七八糟的。所以，newline=''，请务必铭记于心，它能保证你的CSV文件拥有干净利落的行尾符，跨平台不乱套。

当然了，很多时候我们的数据并不是简单的列表形式，它们可能更像是字典，每个数据项都有个明确的键（Key），比如{'name': 'Python', 'version': '3.9'}。这时候，csv 模块里的csv.DictWriter就显得尤为优雅和方便了。它能让你像操作字典一样，直接把字典数据写入CSV，再也不用担心数据列的顺序会乱掉，因为它会根据你指定的fieldnames（字段名）自动帮你匹配。

“`python

咱们再来点字典形式的数据

more_software_data = [
{‘Name’: ‘Django’, ‘Version’: ‘4.0’, ‘Category’: ‘Web Framework’, ‘Year’: ‘2021’},
{‘Name’: ‘Flask’, ‘Version’: ‘2.1’, ‘Category’: ‘Web Framework’, ‘Year’: ‘2022’}
]

字典形式写入需要指定字段名

field_names_for_dict_writer = [‘Name’, ‘Version’, ‘Category’, ‘Year’]

print(f”\n准备使用 DictWriter 向文件 ‘{csv_file_name}’ 追加字典数据…”)

判断是否需要写入表头

file_exists_dict = os.path.exists(csv_file_name)
is_empty_dict = False
if file_exists_dict:
with open(csv_file_name, ‘r’, newline=”, encoding=’utf-8′) as f:
first_char_dict = f.read(1)
if not first_char_dict:
is_empty_dict = True
f.seek(0)

with open(csv_file_name, ‘a’, newline=”, encoding=’utf-8′) as f:
writer = csv.DictWriter(f, fieldnames=field_names_for_dict_writer)

if not file_exists_dict or is_empty_dict:
    writer.writeheader() # 写入表头，这是DictWriter的专属方法
    print("已使用 DictWriter 写入表头。")

for data_row in more_software_data:
    writer.writerow(data_row)
    print(f"追加字典数据: {data_row}")

print(f”字典数据已成功追加到 ‘{csv_file_name}’。”)

再次查看文件内容，感受DictWriter的便利

print(“\n再次查看文件内容：”)
with open(csv_file_name, ‘r’, newline=”, encoding=’utf-8′) as f:
reader = csv.reader(f)
for row in reader:
print(row)
“`

但是，请注意了！ 咱们前面一直强调的“插入”，其实大多数时候指的都是追加。如果你真的想要在CSV文件的中间某个位置插入一行数据，那就得面对一个残酷的现实：CSV文件不是数据库！ 它没有索引，没有内置的“在第N行插入”功能。这意味着什么呢？这意味着你不能像数据库那样直接定位并改动某一行。

那怎么办？如果你真的有这种“在中间插入”的强迫症需求，通常的“土办法”是这样的：

把整个CSV文件读到内存里，把它变成一个Python列表的列表（或列表的字典），就好比你把所有纸都摊在桌上。
在内存中对这个数据结构进行修改：找到你想插入的位置，用列表的insert()方法把新数据塞进去。
清空原始CSV文件（或者直接创建一个新文件），然后把内存中已经修改好的所有数据，从头到尾重新写入这个文件。

这个过程，听起来就觉得有点“笨重”是吧？尤其是当你的CSV文件非常大，几百兆甚至几个G的时候，一次性读到内存里可能会让你的电脑“当机”。即便你的内存够大，这种“全量读写”的操作效率也会非常低，耗时耗力。

举个例子，假设你有一个日志文件access.csv，记录了网站的访问日志。你突然发现有一条重要的内部操作记录漏掉了，而且这条记录发生的时间点，正好在文件中间的某个位置。你不能直接跳到那个位置写入，你得把整个文件读进来，在内存里找到对应的日期/时间戳附近，把新的日志条目塞进去，然后，再把整个修订版写回去。这过程，想想都觉得头大。

“`python

模拟在中间插入数据的情景

注意：这个操作效率低，不推荐用于大型文件！

print(“\n模拟在文件中间插入数据（不推荐用于大文件，因为涉及全量读写）”)

现有数据，假设已经存在CSV中

existing_data = [
[‘Name’, ‘Version’, ‘Category’, ‘Year’],
[‘Python’, ‘3.9’, ‘数据处理’, ‘2020’],
[‘Pandas’, ‘1.3’, ‘数据分析’, ‘2021’],
[‘Django’, ‘4.0’, ‘Web Framework’, ‘2021’],
[‘Flask’, ‘2.1’, ‘Web Framework’, ‘2022’]
]

写入一个初始文件

with open(‘middle_insert_demo.csv’, ‘w’, newline=”, encoding=’utf-8′) as f:
writer = csv.writer(f)
writer.writerows(existing_data)
print(“已创建初始文件 ‘middle_insert_demo.csv’。”)
print(“初始内容:”)
with open(‘middle_insert_demo.csv’, ‘r’, newline=”, encoding=’utf-8′) as f:
for row in csv.reader(f):
print(row)

要插入的新数据

new_entry = [‘Scikit-learn’, ‘1.0’, ‘机器学习’, ‘2021’]
insert_after_name = ‘Pandas’ # 假设我们想在Pandas后面插入

1. 读入所有数据到内存

all_rows = []
try:
with open(‘middle_insert_demo.csv’, ‘r’, newline=”, encoding=’utf-8′) as f:
reader = csv.reader(f)
for row in reader:
all_rows.append(row)
print(“\n已将文件内容读入内存。”)

# 2. 在内存中找到位置并插入
insert_index = -1
for i, row in enumerate(all_rows):
    if row and row[0] == insert_after_name: # 假设第一列是Name
        insert_index = i + 1 # 插入到这一行的下一行
        break

if insert_index != -1:
    all_rows.insert(insert_index, new_entry)
    print(f"已在内存中插入新条目 '{new_entry}'，插入位置（行号，从0开始）：{insert_index}。")
else:
    print(f"未找到 '{insert_after_name}'，将在文件末尾追加。")
    all_rows.append(new_entry) # 如果没找到，就追加到末尾

# 3. 重新写入整个文件
with open('middle_insert_demo.csv', 'w', newline='', encoding='utf-8') as f:
    writer = csv.writer(f)
    writer.writerows(all_rows)
print(f"已将修改后的数据重新写入 'middle_insert_demo.csv'。")

print("\n插入后的文件内容:")
with open('middle_insert_demo.csv', 'r', newline='', encoding='utf-8') as f:
    for row in csv.reader(f):
        print(row)

except FileNotFoundError:
print(“文件不存在，无法进行中间插入操作。”)
except Exception as e:
print(f”操作过程中发生错误: {e}”)

“`

说到这里，不得不提一下编码问题。相信我，这个坑是老生常谈，也是最容易让人崩溃的。尤其是当你的CSV文件里包含中文、日文或者一些特殊符号时，如果文件编码不是UTF-8（或者你没有明确指定），写入或者读取的时候就极有可能出现乱码。那种看着一堆方框和问号的感觉，真是让人抓狂。所以，我的建议是：一律使用 encoding='utf-8'，这几乎是万能解药。

当然，如果你面对的数据量真的很大，或者你需要更复杂的数据操作，比如不仅仅是插入，还要筛选、合并、分组、甚至进行一些统计分析，那csv 模块就有点力不从心了。这时候，就轮到我们数据处理界的“瑞士军刀”——pandas出场了！

pandas 提供 DataFrame 结构，能让你把CSV文件当作一个Excel表格或数据库表来操作，无比方便。它在底层处理文件读写时，虽然也逃不过“全量读写”的命运（因为它要构建内存中的 DataFrame），但它把这些复杂的操作都封装得很好，你只需要几行代码就能完成看似复杂的数据处理。

例如，用 pandas 追加数据到CSV，那简直是小菜一碟：

“`python
import pandas as pd

print(“\n— 使用 Pandas 追加数据到 CSV —“)

准备 Pandas DataFrame

new_data_df = pd.DataFrame([
{‘Name’: ‘TensorFlow’, ‘Version’: ‘2.8’, ‘Category’: ‘机器学习框架’, ‘Year’: ‘2021’},
{‘Name’: ‘PyTorch’, ‘Version’: ‘1.11’, ‘Category’: ‘深度学习框架’, ‘Year’: ‘2022’}
])

追加到现有文件，header=False表示不写入表头（因为文件已有），index=False表示不写入行索引

mode=’a’ 就是追加模式

try:
new_data_df.to_csv(csv_file_name, mode=’a’, header=False, index=False, encoding=’utf-8′)
print(f”使用 Pandas 成功追加数据到 ‘{csv_file_name}’。”)
except FileNotFoundError:
print(f”文件 ‘{csv_file_name}’ 不存在，Pandas 将创建一个新文件并写入。”)
new_data_df.to_csv(csv_file_name, mode=’w’, header=True, index=False, encoding=’utf-8′)
print(f”文件不存在，Pandas 已创建新文件 ‘{csv_file_name}’ 并写入数据和表头。”)
except Exception as e:
print(f”Pandas 追加数据时发生错误: {e}”)

print(“\nPandas 追加后的文件内容:”)
df_read = pd.read_csv(csv_file_name, encoding=’utf-8′)
print(df_read)
“`

看到没？pandas 的 to_csv 方法简直是太友好了，一个 mode='a' 参数就能搞定追加。如果需要像前面那样进行“中间插入”的操作，pandas 也更灵活，你可以先用 pd.read_csv() 读取整个文件到 DataFrame，然后利用 DataFrame 的各种强大功能（比如 loc、iloc 或者 insert 方法）在内存中进行精确的插入操作，最后再用 to_csv() 覆盖写入。虽然本质上还是“读入内存-修改-全量写出”，但 pandas 把这个过程封装得更优雅，代码更简洁，也更不易出错。

最后，我想跟大家伙儿分享一点我的心得：代码的健壮性。无论你用 csv 模块还是 pandas，文件操作永远都带着风险，比如文件不存在、权限不足、磁盘空间不足、或者写入过程中程序崩溃。所以，养成用 try...except...finally 语句块来包围文件操作的习惯，至关重要。try 块里放你的正常操作，except 块里处理可能出现的错误，finally 块里则放置无论如何都要执行的代码，比如关闭文件句柄。虽然 with open(...) as f: 这种上下文管理器已经帮你自动处理了文件关闭，但在更复杂的场景或者你手动管理文件句柄时，finally 就能派上大用场了。

总而言之，Python怎么插入CSV，这个问题的答案远不止一个简单的函数调用。它背后涉及到文件操作模式的选择、编码的陷阱、数据结构的适配，以及对“插入”这个概念在纯文本文件语境下的深刻理解。对于简单的追加，csv 模块轻巧方便；对于复杂的数据处理和真正的“中间插入”需求，pandas 则是你的得力助手。理解这些细微之处，能让你在处理数据时少走很多弯路，真正做到心中有数，手下有剑！去实践吧，只有亲手敲过代码，你才能真正体会到其中的乐趣和挑战。

声明：本站所有资料均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。若您的权利被侵害，请联系214278591@qq.com。

Python操作CSV文件：数据插入的深度解析与实战技巧

咱们先准备点数据

文件的名字

第一次写入，通常需要先写入表头

这里有个小技巧，我一般会先检查文件是否存在或是否为空，避免重复写入表头

核心来了：以追加模式打开文件，并处理表头

读出来看看是不是真加进去了

咱们再来点字典形式的数据

字典形式写入需要指定字段名

判断是否需要写入表头

再次查看文件内容，感受DictWriter的便利

模拟在中间插入数据的情景

注意：这个操作效率低，不推荐用于大型文件！

现有数据，假设已经存在CSV中

写入一个初始文件

要插入的新数据

1. 读入所有数据到内存

准备 Pandas DataFrame

追加到现有文件，header=False表示不写入表头（因为文件已有），index=False表示不写入行索引

mode=’a’ 就是追加模式

文章展示

Python怎么写飞机？从零开始，用代码实现你的空中梦想！

Python Selenium 安装指南：轻松配置你的自动化测试环境，掌握 Python Selenium 安装

Python怎么发送HTTP请求？一看就会的实用指南！

Python编程：深度解析如何用代码生动表示各种概念与数据类型

Python列表取值精髓：list怎么取值Python的奥秘全解析

python怎么导入ipynb

Python操作CSV文件：数据插入的深度解析与实战技巧

咱们先准备点数据

文件的名字

第一次写入，通常需要先写入表头

这里有个小技巧，我一般会先检查文件是否存在或是否为空，避免重复写入表头

核心来了：以追加模式打开文件，并处理表头

读出来看看是不是真加进去了

咱们再来点字典形式的数据

字典形式写入需要指定字段名

判断是否需要写入表头

再次查看文件内容，感受DictWriter的便利

模拟在中间插入数据的情景

注意：这个操作效率低，不推荐用于大型文件！

现有数据，假设已经存在CSV中

写入一个初始文件

要插入的新数据

1. 读入所有数据到内存

准备 Pandas DataFrame

追加到现有文件，header=False表示不写入表头（因为文件已有），index=False表示不写入行索引

mode=’a’ 就是追加模式

相关文章

文章展示