發布時間: 2019-11-10 14:33:00
均值
?
均值描述的是樣本集合的中間點,它告訴我們的信息是有限的。
方差
方差(variance)是在概率論和統計方差衡量隨機變量或一組數據時離散程度的度量。概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度。統計中的方差(樣本方差)是各個數據分別與其平均數之差的平方的和的平均數。在許多實際問題中,研究方差即偏離程度有著重要意義。方差是衡量源數據和期望值相差的度量值。
例如:
方差是指一組數據中的各個數減這組數據的平均數的平方和的平均數,如(1,2,3,4,5)這組數據的方差,就先求出這組數據的平均數(1+2+3+4+5)÷5=3,然后再求各個數與平均數的差的平方和,用(1-3)?+(2-3)?+(3-3)?+(4-3)?+(5-3)?=10,再求平均數10÷5=2,即這組數據的方差為2
標準差
標準差給我們描述的是樣本集合的各個樣本點到均值的距離之平均
以這兩個集合為例,[0, 8, 12, 20]和[8, 9, 11, 12],兩個集合的均值都是10,但顯然兩個集合的差別是很大的,計算兩者的標準差,前者是8.3后者是1.8,顯然后者較為集中,故其標準差小一些,標準差描述的就是這種“散布度”。之所以除以n-1而不是n,是因為這樣能使我們以較小的樣本集更好地逼近總體的標準差,即統計上所謂的“無偏估計”。而方差則僅僅是標準差的平方。
方差和標準差的區別:
方差與我們要處理的數據的量綱是不一致的,多了個平方,雖然能很好的描述數據與均值的偏離程度,但是處理結果是不符合我們的直觀思維的。 而標準差的根號就抵消了這個平方,就能相對直觀了描述數據與均值之間的偏離程度。
上一篇: IPv6的本地聯網地址計算方法詳解
下一篇: 數據歸一化方法