[拼音]:baifenweishu
[外文]:percentile
统计学中把一组按大小排序的数据分为 100等分后,每一分点处的数据。每等分中含1%的观测数据。第x百分位数Px把全部观测数据分为两部分;有x%的观测数据比它小,有 (100-x)%的观测数据比它大。如果某样本有10000个观测数据,那么对于第5百分位数P5就有10000×5%=500个观测数据小于P5,有10000×95%=9500个观测数据大于P5。中位数(见平均数)就是第50百分位数P50。四分位数(即按大小排列数据中四等分处的数据)即P25、P50、P75。正如中位数表示分布的中心位置的数据,其他百分位数同样表示分布的不同位置的数据。描述一组观测数据,中心位置的数据固然重要,但如果能与其他位置的数据(如某几个百分位数)相结合,就能更加全面。当观测数据很多时,百分位数的数值相当稳定,即使是两端的百分位数也比较稳定。但当观测数据不多时,两端百分位数易受个别极端数据的影响,数值不够稳定,此时应用百分位数意义不大。
同一组观测数据中某两个百分位数的差称为百分位数间距,它说明有百分数为这两个百分数差的观测数据的变异程度。例如在对某地 8岁男孩身高的统计中P5=122.29cm,P95=137.00cm,则间距P95-P5=14.71cm,说明有90%的男孩身高处在122.29与137.00cm之间,它们的变异度为 14.71cm。因此百分位数间距也可作为描述数据分布离散程度的指标。
百分位数和百分位数间距在医学上有广泛的应用,如用以确定临床检验指标、身体发育指标的正常值范围等。