displot
:分布图
displot
用于在 FacetGrid 上绘制分布图的图形级界面,使用kind参数可以选择使用的方法:
- histplot()(kind="hist") # 默认
- kdeplot()(kind="kde")
- ecdfplot()(kind="ecdf")复制
使用displot
绘制分布直方图:
import seaborn as sns
penguins = sns.load_dataset("penguins")
sns.displot(data=penguins, x="flipper_length_mm")复制
使用displot
绘制密度直方图:
sns.displot(data=penguins, x="flipper_length_mm", kind="kde")
复制
使用displot
绘制累计分布图:
sns.displot(data=penguins, x="flipper_length_mm", kind="ecdf")
复制
histplot
:分布直方图
histplot
直方图是一种经典的可视化工具,它通过计算离散区间内的观测数量来表示一个或多个变量的分布。
histplot
可以对每个 bin 内计算的统计量进行归一化以估计频率、密度或概率质量,并且可以添加使用核密度估计获得的平滑曲线,
绘制两个变量的分布直方图:
sns.histplot(data=penguins, x="flipper_length_mm", hue="species")
复制
kdeplot
:密度直方图
kdeplot
核密度估计是一种可视化数据集中观测值分布的方法,类似于直方图。kdeplot
使用一维或多维的连续概率密度曲线表示数据。
相对于直方图,kdeplot
可以更具可解释性的图,特别是在绘制多个分布的情况下。
sns.kdeplot(data=tips, x="total_bill", hue="time", multiple="stack")
复制
ecdfplot
:累计分布图
ecdfplot
展示一列取值空间中数值的取值比例或计数。与kdeplot
和histplot
相比,ecdfplot
可以观测到每个取值。通过累计分布图可以观察到取值空间的分布情况,也可以看出是否存在缺失值。
绘制单个变量的累计分布图:
sns.ecdfplot(data=penguins, x="flipper_length_mm")
复制
rugplot
:边缘分布图
通过沿x轴和y轴绘制刻度来绘制二维变量的边缘分布。
绘制散点图和边缘分布图:
sns.scatterplot(data=tips, x="total_bill", y="tip")
sns.rugplot(data=tips, x="total_bill", y="tip", height=-.02, clip_on=False)复制
boxplot
:箱线图
boxplot
显示数据集的四分位数,而且根据分位点确定为极值和异常点。
ax = sns.boxplot(x="day", y="total_bill", data=tips)
复制

文章转载自Coggle数据科学,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
2025年4月中国数据库流行度排行榜:OB高分复登顶,崖山稳驭撼十强
墨天轮编辑部
1161次阅读
2025-04-09 15:33:27
2025年3月国产数据库大事记
墨天轮编辑部
691次阅读
2025-04-03 15:21:16
2025年3月国产数据库中标情况一览:TDSQL大单622万、GaussDB大单581万……
通讯员
488次阅读
2025-04-10 15:35:48
征文大赛 |「码」上数据库—— KWDB 2025 创作者计划启动
KaiwuDB
448次阅读
2025-04-01 20:42:12
数据库,没有关税却有壁垒
多明戈教你玩狼人杀
393次阅读
2025-04-11 09:38:42
优炫数据库成功应用于国家电投集团青海海南州新能源电厂!
优炫软件
378次阅读
2025-03-21 10:34:08
天津市政府数据库框采结果公布!
通讯员
294次阅读
2025-04-10 12:32:35
最近我为什么不写评论国产数据库的文章了
白鳝的洞穴
281次阅读
2025-04-07 09:44:54
从HaloDB体验到国产数据库兼容性
多明戈教你玩狼人杀
261次阅读
2025-04-07 09:36:17
OceanBase 单机版发布,针对中小规模业务场景
通讯员
223次阅读
2025-03-28 12:01:19