
「目录」
6.1 => Pandas的数据结构
6.2 => Pandas的基本功能
--------> reindex重新索引
--------> drop丢弃数据
......
6.3 => 数学和统计方法
drop丢弃数据
在整理数据的时候可能需要删除一个或多个项(也许是不需要,也许是没用,或者数据不对),drop方法可以返回一个在指定轴删除了项的对象。
下面我们来看看对于Series和DataFrame怎么丢弃数据吧。
Series
我们先创建一个Series,值为0-5,索引是a-e:
In [7]: obj = pd.Series(np.arange(5.), index=['a', 'b', 'c', 'd', 'e'])
In [8]: obj
Out[8]:
a 0.0
b 1.0
c 2.0
d 3.0
e 4.0
dtype: float64复制
比如我们删除行索引为'c'的项:
In [9]: new_obj = obj.drop('c')
In [10]: new_obj
Out[10]:
a 0.0
b 1.0
d 3.0
e 4.0
dtype: float64复制
如果要删除多个行,可以将索引放入列表中,比如行'd'和'c':
In [11]: obj.drop(['d', 'c'])
Out[11]:
a 0.0
b 1.0
e 4.0
dtype: float64复制
DataFrame
若是DataFrame,可以删除任意轴上的索引值。
In [12]: data = pd.DataFrame(np.arange(16).reshape((4,4)), index=['New York', 'Shanghai', 'Beijing', 'Tokyo'], columns=['one', 'two', 'three', 'four'])
In [13]: data
Out[13]:
one two three four
New York 0 1 2 3
Shanghai 4 5 6 7
Beijing 8 9 10 11
Tokyo 12 13 14 15复制
对这个DataFrame调用drop方法会从行标签(axis 0)删除值:
In [14]: data.drop(['New York', 'Tokyo'])
Out[14]:
one two three four
Shanghai 4 5 6 7
Beijing 8 9 10 11复制
传递参数axis=1或axis='columns'可以删除列的值:
In [15]: data.drop('two', axis=1)
Out[15]:
one three four
New York 0 2 3
Shanghai 4 6 7
Beijing 8 10 11
Tokyo 12 14 15复制
同样,将列标签放入列表可以删除多个列:
In [16]: data.drop(['two', 'four'], axis=1)
Out[16]:
one three
New York 0 2
Shanghai 4 6
Beijing 8 10
Tokyo 12 14复制
上面使用drop方法不会改变原来的DataFrame,传入inplace=True参数可以就地改变DataFrame:
In [17]: data
Out[17]:
one two three four
New York 0 1 2 3
Shanghai 4 5 6 7
Beijing 8 9 10 11
Tokyo 12 13 14 15
In [18]: data.drop(['two', 'four'], axis=1, inplace=True)
In [19]: data
Out[19]:
one three
New York 0 2
Shanghai 4 6
Beijing 8 10
Tokyo 12 14复制
❝Note:需要注意的是,使用inplace会销毁所有被删除的数据
❞

往期回顾



stay hungry, stay foolish.
记得点在看啦

文章转载自Yuan的学习笔记,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
演讲实录|分布式 Python 计算服务 MaxFrame 介绍及场景应用方案
阿里云大数据AI技术
117次阅读
2025-03-17 13:27:37
[MYSQL] 服务器出现大量的TIME_WAIT, 每天凌晨就清零了
大大刺猬
101次阅读
2025-04-01 16:20:44
mysql提升10倍count(*)的神器
大大刺猬
96次阅读
2025-03-21 16:54:21
官宣,Milvus SDK v2发布!原生异步接口、支持MCP、性能提升
ZILLIZ
85次阅读
2025-04-02 09:34:13
[MYSQL] query_id和STATEMENT_ID在不同OS上的关系
大大刺猬
58次阅读
2025-03-26 19:08:13
DataWorks :Data+AI 一体化开发实战图谱
阿里云大数据AI技术
42次阅读
2025-03-19 11:00:55
国密算法介绍
漫步者
41次阅读
2025-03-21 09:20:39
迎接deepseek,助力企业AI整合
威哥
37次阅读
2025-03-09 20:54:43
AI 提示词魔法:教你用 AI 提升效率与创意
数智新知
36次阅读
2025-03-10 10:30:27
如何使用 RisingWave 和 PuppyGraph 构建高性能实时图分析框架
RisingWave中文开源社区
34次阅读
2025-03-18 10:49:54