「目录」
绘图和可视化
Plotting and Visualization
9.1 => matplotlib
9.2 => pandas和seaborn绘图
-------> 线型图
-------> 柱状图
-------> 直方图和密度图
-------> 散布图或点图
-------> 分面网格(facet grid)和类型数据

线型图
感觉更新pandas的笔记是N年前了
,这段时间参加了一个有意思的kaggle比赛,题目是Happy Whale and Dolphin Identification,内容是我们会根据指纹和人脸来识别一个个体,对于Whale和dolphin我们会根据鳍来识别,比赛还有一个月结束吧,等结束了我想写篇笔记做一下总结。
另外kaggle比赛经常会用到pandas库对数据进行处理。
下面是本篇笔记会用到的库哦:
%matplotlib notebook
import numpy as np
import pandas as pd
import seaborn as sbs
import matplotlib.pyplot as plt
matplotlib是比较低级(或者说基础?)的工具引入,Pandas有内置的方法用于简化从DataFrame和Series绘制图形。Seaborn会修改matplotlib默认的颜色方案和绘图类型,以提高可读性和美观度
Series和DataFrame都有一个用于生成各类图表的plot方法。
默认情况下生成的是线型图。
Series对象的索引会被传给matplotlib,并用以绘制X轴。可以通过use_index=False禁用该功能。
s = pd.Series(np.random.randn(10).cumsum(), index=np.arange(0, 100, 10))
s.plot()

X轴的刻度和界限可以通过xticks和xlim选项进行调节,Y轴用yticks和ylim。
总结一下,Series的plot参数还包括:
rot : 旋转刻度标签
grid : 显示轴网格线
label : 用于图里的标签
alpha : 图表的填充不透明度(0-1)
style : 将要传给matplotlib的风格字符串,比如'ko--'
DataFrame的plot方法会在一个subplot中为各列绘制一条线,并自动创建图例:
df = pd.DataFrame(np.random.randn(10, 4).cumsum(0),
columns=['A', 'B', 'C', 'D'],
index=np.arange(0, 100, 10))
df.plot()

DataFrame的plot参数还有:
subplots : 将各个DataFrame列绘制到单独的subplot中
sharex : 如果subplots=True,则共用同一个x轴
sharey : 如果subplots=True,则共用同一个Y轴
title : 表示图像标题的字符串
legend : 添加一个subplot图例
sort_columns : 以字母表顺序绘制各列,默认使用当前列顺序
df.plot(subplots=True, sharey=True, alpha=0.8)

今天先更新pandas绘制线型图,明天写柱状图吧。
BYE-BYE
往期回顾



Stay hungry, stay foolish




