首页/文章/ 详情

箱体图:简洁呈现数据分布的统计工具

6天前浏览34

箱体图(又称箱线图)是一种强大的数据可视化工具,它用五个关键统计量精简而全面地概括一组数据的分布特征

  1. 中位数 (Q2):

     箱体中间的线,代表数据的中心位置。  
  2. 四分位数:

    • 下四分位数 (Q1):

       箱体底部,表示数据中有25%的值低于此点。  
    • 上四分位数 (Q3):

       箱体顶部,表示数据中有25%的值高于此点。  
  3. 四分位距 (IQR):

     箱体的高度(Q3 - Q1),衡量数据中间50%的离散程度,IQR越大,数据越分散。  
  4. 触须(须线):

     从箱体延伸出的线,通常延伸至以下两者中的较小/较大值:  
    • 数据最小值 / 最大值
    • Q1 - 1.5 × IQR / Q3 + 1.5 × IQR (异常值的判断标准)
  5. 异常值(离群点):

     落在触须范围之外的数据点,通常以单个点标记,提示可能存在极端值或需要特别关注的数据。  

核心价值:

  • 直观显示分布:

     快速了解数据的中心趋势(中位数)、分散程度(箱体高度、触须长度)和对称性(中位数在箱体内的位置)。  
  • 识别异常值:

     明确标记潜在的极端值。  
  • 高效比较:

     非常适用于并排比较多个数据集的分布差异。  
  • 节省空间:

     用少量空间传达丰富信息,尤其适合大型数据集或多组比较。  

总结: 箱体图通过一个简洁图形,整合中位数、四分位距、极值和异常值信息,是探索数据分布、发现关键特征和进行比较分析的高效、直观且信息密集的统计图表工具。


来源:岩层书旅
控制曲面Origin
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-08-17
最近编辑:6天前
现代石油人
博士 签名征集中
获赞 32粉丝 127文章 1254课程 1
点赞
收藏
作者推荐
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈