暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

DataFrame的数据处理(Pandas读书笔记6)

阿凯的笔记 2018-02-06
274

本期和大家分享DataFrame数据的处理~

一、提取想要的列

第一种方法就是使用方法,略绕,使用.列名的方法可以提取对应的列!

第二张方法类似列表中提取元素!本方法是我们将来比较常用的方法。

需要说明的是在提取列后 dtype:int64这里的类型指的该列的存储形式,那本身提取出来的数据是什么呢?

我们提取出来的这一列就是Series。所以DataFrame可以看做是Series的集合,而提取出任意的列就是Series。


二、提取想要的行

DataFrame有个特性就是可以任意进行行列处理,那如何提取某行呢?

要利用ix方法,但是实际工作中按照序号提取数据很少,更多是获取筛选后的行。筛选功能后期会分享到。在这里分享另外两个经常用到的,提取前几行后几行的方法。

.head()可以提取整个表的任意多少行

.tail()可以提取整个表的任意多少行

如果在括号内不输入参数,则默认返回五行。

针对行的问题,暂时先介绍到这里,后续会再次分享到。


三、DataFrame的赋值

当我们先创建的DataFrame列数大于原始数据的时候,就会以NaN方式显示,这个上期已经介绍过,当我们对某一列进行赋值的时候,整个列会赋值给一个相同的值。

如果我们直接对某个不存在的列进行赋值,pandas同样会默认帮我们创建好新的列,然后将对应的值存进去。


四、DataFrame的转置

对象.T方法可以将DataFrame进行转置,这里需要说明,该方法并不改变原数据的存储,如果想改变原数据需要重新赋值一次!


文章转载自阿凯的笔记,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论