Python怎么竖选？大神级攻略，从Pandas到Numpy一网打尽

蜗牛先森

2025-7-27

咱们聊点实在的，不扯那些虚头巴脑的。所谓“Python怎么竖选”，这词儿在官方文档里你可找不到。这纯粹是咱们这些跟数据打交道的人，脑子里最直观的一个想法：我有一张大表，就像Excel那样，我不要所有数据，就想要其中几列，或者干脆就一列。这个从上到下“唰”一下把一列（或几列）拎出来的动作，就是我们心心念念的“竖选”。

所以，别再傻乎乎地去搜“Python竖选函数”了，根本没这东西。关键在于，你手里的“表”到底是个什么玩意儿？是Pandas的DataFrame？是Numpy的Array？还是最原始的列表嵌套列表？搞清楚这个，问题就解决了一大半。

王者姿势：用Pandas搞定一切“竖选”

我跟你讲，只要你的数据带点表格的样子，甭管是CSV读进来的，还是数据库捞出来的，第一时间，请把它变成 Pandas 的 DataFrame。信我没错，这玩意儿就是为了处理表格数据而生的神兵利器。用它来做竖选，那叫一个随心所欲，姿势多到你眼花。

姿势一：最简单粗暴的单列选取

假设我们有个DataFrame，名叫df，长这样：

| | name | age | city |
|---|---|---|---|
| 0 | Alice | 25 | Beijing |
| 1 | Bob | 30 | Shanghai |
| 2 | Charlie | 35 | Beijing |

现在，我只想要age这一列。怎么办？

```python

直接用方括号，里面放列名字符串

ages = df['age']
```
就这么简单。你会得到一个叫做 Series 的东西，你可以把它想象成一列带索引的数据。这是最快、最直接的竖选。

但是，注意了啊，这里有个小坑。如果你想要的是一个只有一列的 DataFrame，而不是一个 Series，那你得用两层方括号。

```python

注意，是两层方括号！

ages_df = df[['age']]
`` 看到没？[['age']]`。这就像是告诉Pandas：“嘿，我要的不是一根柱子，我还是要一个‘表’，只不过这个表恰好只有一列而已。” 这在很多函数传参的时候特别重要，人家要的是DataFrame，你给个Series，程序直接给你撂挑子。

姿势二：潇洒自如的多列选取

想同时要name和city两列？简单，在刚才的双层方括号里，放一个列表就行。

```python

方括号里放一个包含所有目标列名的列表

subset = df[['name', 'city']]
`` 你看，这个逻辑是不是特别清晰？df[...]是选取操作，里面的['name', 'city']`是我要的东西的清单。这可能是你日常工作中用得最多的竖选方式了。

姿势三：高手进阶，`.loc` 和 `.iloc` 的骚操作

当你觉得上面两种方法已经满足不了你那颗骚动的心时，就该祭出.loc和.iloc这两个大杀器了。

.loc：基于标签（名字）的选取

.loc可以说是指名道姓地要人。它的语法是df.loc[行标签, 列标签]。我们现在只关心竖选，也就是列的选择，所以行的部分我们可以用一个冒号:来表示“所有行”。

python # 竖选 'name' 和 'city' 两列 # : 代表所有行，后面跟上列名的列表 subset_loc = df.loc[:, ['name', 'city']]
这看起来好像比df[['name', 'city']]麻烦？别急。.loc的强大之处在于它能行列联动，而且语义非常清晰，在写一些复杂的、需要长期维护的代码时，用.loc是绝对的“政治正确”，能避免很多意想不到的麻烦。

.iloc：基于位置（索引）的选取

有时候，你可能不关心列名叫啥，或者压根就没列名，你只想说：“我要第一列和第三列！” 这时候，.iloc就登场了。i就代表integer（整数）。

python t # 选取第0列（name）和第2列（city） # 记住，在编程世界里，数数都是从0开始的 subset_iloc = df.iloc[:, [0, 2]]
同样，:代表所有行，后面的[0, 2]就是我们想要的列的整数索引。这种方法在处理那些没有规整列名的数据时，简直是救星。

是不是感觉豁然开朗？在Pandas的世界里，所谓的“竖选”，就是这么几种招式翻来覆去的组合。老实说，掌握了[]、[[]]、.loc和.iloc对列的操作，你已经击败了90%的初学者。

退而求其次：当Numpy成为主角

当然，江湖不只有Pandas。在科学计算领域，Numpy才是那个不朽的传说。如果你的数据是一个Numpy的二维数组（array），那竖选的玩法又不一样了。

假设我们有个Numpy数组arr：

python import numpy as np arr = np.array([ [1, 2, 3], [4, 5, 6], [7, 8, 9] ])
这玩意儿可没有列名给你使唤。你的一切操作都得靠索引。它的竖选语法和Pandas的.iloc师出同门，异曲同工。

```python

选取第二列（索引为1）

同样，: 代表所有行，1代表第二列的索引

col_one = arr[:, 1] # 结果是 [2, 5, 8]

选取第一列和第三列（索引为0和2）

cols_two = arr[:, [0, 2]]

结果是：

[[1, 3],

[4, 6],

[7, 9]]

`` 看明白了吗？核心就是那个逗号和冒号的配合：arr[所有行, 我要的列]`。这个语法在Numpy里是基础中的基础，也是精髓所在。

原始部落的求生方式：列表嵌套列表

最后，我们来聊聊最“朴素”的情况。万一，你手上只有Python原生的列表嵌套列表，比如：

python data = [ ['Alice', 25, 'Beijing'], ['Bob', 30, 'Shanghai'], ['Charlie', 35, 'Beijing'] ]
这种情况下想做竖选，那就得返璞归真，自己动手写循环了。最Pythonic的方式是使用列表推导式。

```python

选取第一列（name）

names = [row[0] for row in data] # 结果是 ['Alice', 'Bob', 'Charlie']

选取第二列（age）

ages = [row[1] for row in data] # 结果是 [25, 30, 35]
`` 这种写法，坦白说，又慢又不直观，数据量一大，性能就是灾难。如果想同时选多列，代码会变得更丑。所以，我的建议是：**只要你发现你需要在原生列表上做类似“竖选”的操作，那就别犹豫了，立刻、马上，import pandas as pd`，然后把它转成DataFrame！** 这不是偷懒，这是专业。

总结一下我的心里话

“Python怎么竖选”这个问题的本质，其实是在问：“在Python中，如何从一个二维数据结构里，根据列的标识（无论是名字还是位置）抽取出指定的列数据？”

别再纠结于“竖选”这个词本身了。你需要做的，是抬起头，看清楚你面对的究竟是什么“妖魔鬼怪”：

是 Pandas DataFrame？恭喜你，你手握神器。用df['col']，df[['col1', 'col2']]，或者更规范的df.loc[:, 'col_name']和df.iloc[:, index]，想怎么切就怎么切。
是 Numpy Array？也还不错，你是数值计算的硬核玩家。记住arr[:, index]这个咒语，它能帮你搞定一切。
是 原生List？赶紧跑！别在原地挣扎了，马上把它变成DataFrame，拥抱现代文明。

掌握这个思路，你就从一个“问问题的人”变成了一个“解决问题的人”。数据在你手里，不再是一堆混乱的数字，而是可以任你揉捏、塑形的黏土。这个从“竖选”开始的小小飞跃，是你数据处理之路上，一次真正意义的“开窍”。

作者：蜗牛先森

链接：https://www.livip.net/1550

文章版权归作者所有，未经允许请勿转载。

THE END

彻底卸载Python指南：如何干净利落地把Python删了，告别残留困扰

<<上一篇

轻松找到Python页面：高效搜索技巧与实用指南，解决“Python页面怎么找”难题

下一篇>>

Python怎么竖选？大神级攻略，从Pandas到Numpy一网打尽

王者姿势：用Pandas搞定一切“竖选”

姿势一：最简单粗暴的单列选取

直接用方括号，里面放列名字符串

注意，是两层方括号！

姿势二：潇洒自如的多列选取

方括号里放一个包含所有目标列名的列表

姿势三：高手进阶，.loc 和 .iloc 的骚操作

退而求其次：当Numpy成为主角

选取第二列（索引为1）

同样，: 代表所有行，1代表第二列的索引

选取第一列和第三列（索引为0和2）

结果是：

[[1, 3],

[4, 6],

[7, 9]]

原始部落的求生方式：列表嵌套列表

选取第一列（name）

选取第二列（age）

总结一下我的心里话

姿势三：高手进阶，`.loc` 和 `.iloc` 的骚操作