Pandas使用总结(四)：数据分析计算

一叶扁舟 2020-06-28

1497

怕你找不到
Pandas使用总结(一)：数据读写
 Pandas使用总结(二)：数据筛选
 Pandas使用总结(三)：数据处理
 Pandas使用总结(五)：数据可视化

本节总结Pandas在数据计算分析上的应用，主要包括：描述统计计算、时间计算、分组聚合、数据标准化。

一、基本统计量

# 按行求和
df['row_sum'] = df.apply(lambda x: x.sum(), axis=1)
# 按列求和
df.loc['col_sum'] = df.apply(lambda x: x.sum())
复制

二、时间计算

生成时间

# 生成时间序列(period「生成个数」，freq「10天一个值, 与end不共存」)
pd.date_range(start='2020-03-01', end='2020-12-03', periods=10, freq='10D')
复制

重采样

# 重采样
df = df.set_index('time', drop=True) # 要先把时间列设为索引列
df = df.resample('M').sum() # 将一个月的聚合在一起

复制

时间的计算

# 时间偏移计算
from datetime import timedelta
df['time'] = df['time'] + timedelta(days=10) # 往后推10天

# 计算时间差(dt用来抽取时间)
df['date_cha'] = (datetime.now() - data['time']).dt.days

复制

三、分组聚合

范围分组演示
- 另外cut,还可以不指定分组范围列表，直接指定分组数
- 离散的分类

附加：数据标准化

# 公式
x* = (x - min) / (max - min)
# 实现
df = (df - df.min()) / (df.max() - df.min())

复制

python 数据分析

最后修改时间：2020-07-08 18:36:42

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者

Pandas使用总结(四)：数据分析计算

一、基本统计量

二、时间计算

三、分组聚合

附加：数据标准化

评论

相关阅读