A. 如何分析數據的集中趨勢和離散趨勢
一、集中趨勢
集中趨勢是指一組數據所趨向的中心數值。對集中趨勢的度量就是採用具體的統計方握畝法和統計測度對這一中心數值的測量和計量,以一個綜合數值來表述數據所趨向的這一中心數值的一般水平。
二、離散趨勢
在統計學上描述觀測值偏離中心位置的趨勢,反映了所有觀測值偏離中心的分布情況。
異眾比率用於評價眾數的代表性測度。異眾比率越接近1,眾數的代表性越弱。四分位差是指上四分位數與下四分位數的絕對離差。平均差是指全部變數值與均值離差的絕對值的均值。
平均差以均值為中心,通過每個變數值與均值的絕對距離反應數據離散程度的測度。方差是指全部變數值與其均值的離差平方的均值。標准差是方差的算術平方根。離散系數是指同一總體的標准差與均值的比較。標准化值是以變數值與其均值的差除以同一數據的標准化的比值。
集中趨勢和離散程度是關於數據御皮歲分布的基本測度,要進一步描述數據分布的形態是否偏倚,偏倚的方向和程度;分布是尖聳還是扁平,尖聳或扁平的程度,以及數據分布形態與正態分布的差異等,還需要對數據分布的偏態和峰度進行測量。
(1)數據離散分析的主要方法擴展閱讀
一、描述集中趨勢的統計量
統計學中常用平均數來描述一組變數值的集中位置或平均水平。常用的統計量指標有算數均數、幾何均數、中位數和百分位數。
1、算數均數:即為均數,用以反映一組呈對稱分布的變數值在數量上的平均水平。
2、幾何均數:常用以反映一組經對數轉換後呈對稱分布的變數值在數量上的平均水平。
3、中位數:適用於偏態分布資料和一端或兩端無確切的數值的資料。是第50百分位數
4、百分位數:為一界值,用以確定醫學參考值范圍。
二、描述離散趨勢的統計量
離散趨勢是反映資料的變異程度,常用指標有極差、四分位間距、方差與標准差、變異系數。
1、極差:為一組數據的最大值和最小值之差,但極差不能反映所有數據的變異大小鎮睜,且極易受樣本含量的影響。常用以描述偏態分布。
2、四分位數間距:它是由第3四分位數與第1四分位數相減得到,常和中位數一起描述偏態分布資料的分布。
3、方差與標准差:反映一組數據的平均離散水平,消除了樣本含量的影響,常和均數一起用來描述一組數據中的離散和集中趨勢。
4、變異系數:多用於觀察指標單位不同時,可消除因單位不同而不能進行比較的困難。