暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

python数据可视化--matplotlib绘制散点图

AI小白笔记 2021-11-18
1620

点击蓝字

关注我们


散点图是由一些散乱的点组成的图,这些点的位置由X轴坐标值与Y轴坐标值共同决定。散点图在数据分析中常用于表达数据关系的位置。


在matplotlib库,使用plt.scatter()函数生成散点图,比如:


import matplotlib.pyplot as plt
import numpy as np


x=[0,1,2,3,4,5,6,7,8,9]
y=[6,3,6,5,5,5,0,3,2,8]


plt.scatter(x,y)
plt.show()
复制



plt.scatter()函数取x列表第1个数与y列表第1个数组合成一个坐标(0,6),将其显示在坐标系中,然后取第2个数进行组合,以此类推。


下面介绍plt.scatter()函数的主要参数。


s


size的缩写,设置散点的大小。若是给定一个数值,则所有点的大小一致;若是给定一个数组,则每个点的大小不同。


c

color的缩写,设置散点的颜色。若只有一个值,则所有的点设置为同一个颜色,若给定一个颜色数组,则不同的点可以设置成不同的颜色,若给定浮点数的数组,则映射到相应的颜色。


marker

用于设置散点的标记,用法与折线图的marker参数一对称,具体参考《python数据可视化--matplotlib绘制折线图(2)》对marker的详细介绍。


cmap

表示数据点的颜色映射表,仅当参数c为浮点数的数组时才可用。cmap需要花很大的篇幅进行介绍,往后再详细讲解,在此先按下不表。


norm

表示数据的亮度,取值范围在0~1,只有c是一个浮点数的数组的时候才使用。


alpha

表示数据的透明度,取值范围在0~1。


linewidths

表示数据点边缘的宽度。


edgecolors

表示数据点边缘的颜色。


接下来看一段代码:

import matplotlib.pyplot as plt
import numpy as np
plt.rcParams['font.family']='SimHei'
plt.rcParams['axes.unicode_minus']=False


x=np.random.normal(-8,5,100)
y=np.random.normal(-8,5,100)
x1=np.random.normal(5,5,50)
y1=np.random.normal(5,5,50)


plt.scatter(x1,y1,marker='^',label='小学')
plt.scatter(x,y,s=30,label='大学')
plt.legend()
plt.title('某城市小学与大学分布图')
plt.show()
复制



代码第6-7行在均值为-8,方差为5的正态分布中随机抽样100个点,第8-9行在均值为5,方差为5的正态分布中随机抽样50个点,分别生成两部分的散点图。


用不同的颜色与不同的大小来显示两部分的数据点,整个图就显得区分度比较高。


其它参数的用法,留待下节慢慢细品。


THE END

文章转载自AI小白笔记,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论