[三] 3 图表绘制工具:Matplotlib -- 图表绘制之箱形图

九、箱形图

箱形图又称为盒须图、盒式图或箱线图,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。
在这里插入图片描述

  • 中位数:按顺序排列的一组数据中居于中间位置的数
  • 上四分位数Q3:一组数据排序后处于75%((1+n)/4*3)位置上的值
  • 下四分位数Q1:一组数据排序后处于25%((1+n)/4)位置上的值
  • 四分位距IQR=Q3-Q1
  • 内限:最大值Q3+1.5IQR,最小值Q1-1.5IQR
  • 外限:最大值Q3+3IQR,最小值Q1-3IQR
  • 异常值:内限与外限之间,中度异常,在外限以外,极度异常

箱形图的绘制步骤:

  • 画数轴:度量单位大小和数据批的单位一致,起点比最小值稍小,长度比该数据批的全距稍长;
  • 画一个矩形盒:两端分别对应数据批的上下四分位数(Q3和Q1)。在矩形盒内部中位数位置画中位线;
  • 画内限和外限:箱型图一般没有标出内限和外限;
  • 画上边缘和下边缘:从矩形盒两端边向外各画一条线段直到不是异常值的最远点,表示该批数据正常值的分布区间;
  • 用"〇"标出中度异常值,用"*"标出极度异常值;相同值的数据点并列标出在同一数据线位置上。

1、plt.plot.box()

  • vert:是否垂直,默认True
  • positions:占位

箱形图着色:

  • boxes:箱线的颜色
  • whiskers:竖线的颜色
  • medians:中位线的颜色
  • caps:边缘线的颜色
df = pd.DataFrame(np.random.rand(10, 5), columns = list("ABCDE"))

color = dict(boxes = 'DarkGreen', whiskers = 'DarkOrange', medians = 'DarkBlue', caps = 'Gray')

df.plot.box(ylim = [0, 1.2],
            color = color,
            positions = [1, 4, 5, 6, 
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值