什么是百分位数统计表P3、P10、P25、P50、P75、P90、P95
P3下面有一个对应的数,就是说有3%的人低于这个数,相应的,P10就是说有10%的人低于这个数,以此类推等等。p95就是有95%的人低于这个数。
百分位数是计学术语,如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数percentile 。
可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。
如何计算第p百分位数。以递增顺序排列原始数据即从小到大排列。计算指数i=np%,若 i 不是整数,将 i 向上取整。
大于i的毗邻整数即为第p百分位数的位置。若i是整数,则第p百分位数是第i项与第i+l项数据的平均值。
应用百分位数p95,需要的条件为什么是随机样本?
我觉得重点应该放在百分位数上,可以说应用百分位数的条件是什么。百分位数是用于描述一组观察值集中趋势的统计学指标。样本如果要描述总体的趋势,用百分位数时应用的样本一定要是随机的。也就是随机样本。
统计学入门(二)-连续变量的统计描述
首先来了解下什么是频数表,如下图
频数表(frequency table):是一种非常直观的方法,但是比较粗糙
频数表构建步骤:
1、分组:确定组数 如15~20 为一组 20~25为一组
2、确定组距 组距即为5 组距 ≈ 极差/组数(极差就是最大值与最小值之差)
3、确定各组段的上下线,起点称为下线,终点称为上线
从这个表里我们可以看出高峰组段(或平均水平)在什么位置出现(集中趋势),数据的分布范围是什么,最大最小值在哪里,分散程度有多大(分散趋势)。
在统计学里我们一般按照集中趋势和离散趋势分别对连续变量进行统计描述。
一、集中趋势的描述指标
平均数 :描述一组数据在数量上的平均水平;总体平均数用 μ表示 样本平均数用 X拔
适用范围:对称分布资料,特别是正态分布资料
Excel函数 Average()
中位数 :排列一下顺序。取数据最居中的那个数的值或者两个的平均值。也被称为二分位数,用M表示
优点:它的位置是平均数,不受极端值的影响
缺点:1、不是所有人都能理解 2、会损失很多信息 3、不稳定
适用范围:样本量大的情况,分布不均,平均数用不了的情况
Excel函数 Median()
几何均数 :在医学、化学领域经常会遇到一种特殊资料,其数值呈等比方式记录,本身为正偏态分布,但是如果进行对数变换,则数据呈正态分布
计算方法:先用对数 变成整体分布 求算数平均数 再把算数平均数幂 回来 就是几何平均数 用G表示
Excel函数 Geomean()
众数 :指的是所有数值里出现最多的那个数
Excel函数 Mode()
截尾均数 :去掉最低5%的值 最高5%的值 再求算数平均数 从而避免极端值的影响
Excel函数 Trimmean()
二、离散趋势的描述指标
全巨(Range) :最大值最小值之差
优点:1、容易理解 2、适用范围广
缺点:不稳定
方差(Variance) :离均差(个体值-总体均数)的平方和除以样本量
Excel公式:Var.p()
标准差 :方差开根号
总体标准差
Excel公式:Stdev.p()
样本标准差
Excel公式:Stdev.s()
变异系数 :解决了不同资料间变异程度对比的问题 (标准差 除以 样本均数)
百分位数 :先排序。是一种位置指标,用Px表示。一个百分位数Px将一组观察值分为两部分,理论上有x%的观察值比他小,(100-x)%的观察值比他大。P20代表排在前20%的位置;常用的百分数有 P2.5 ,P5 ,P10 ,P25 ,P50 ,P75 ,P90 ,P95 ,P97.5
Excel公式:PERCENTILE.INC()
四分位数 :P25、P50、P75将一组数据分为四段
四分位间距 :非对称分布一个很好的描述指标,正好将样本值四等分,且P25和P75中间包括了50%的观察值,因此四分位间距既排除了两侧极端值的影响,又能够反映较多数据的离散程度。
Excel函数 QUARTILE.INC()
根据分布形状是否对称,曲线是光滑曲线还是 特殊形状;正、负偏还是左、右偏 (高峰组段在左侧叫正偏,反之叫负偏)。针对某种分布形状进行进一步的特征描述,常见的是用于正态分布的两个指标。
偏度系数(Skewness) :正态峰 正偏态 负偏太
峰度系数(Kurtosis) :正态峰 平阔风 尖峭峰
身高和体重评价p85-P95是什么意思?
这是统计学中的术语。表示20%、50%的意思。一般您只要看平均数即可。
指导意见:
建议您参考其中的平均数加减标准差来对照自己的身高体重。
SPSS软件中,统计数据中有 P50 P95 ,P50 P95 是什么意思,数值越高代表着什么?谢谢大家帮忙
P是概率的简写,P50就是说:此数据有50%的准确率;P95就是说:此数据有95%的准确率;P值越高就以为着数据更准确。P是概率的简写,P50就是说:此数据有50%的准确率;P95就是说:此数据有95%的准确率;P值越高就以为着数据更准确。