導航:首頁 > 研究方法 > 主成分分析是一種特徵方法

主成分分析是一種特徵方法

發布時間:2022-05-29 05:51:21

① spss主成分分析是什麼

spss的主成分分析主要應用在因子分析里,目的是將原來很多的因素,通過他們內在的相關分析,整合成新的一個或多個相對獨立的綜合因素,來代表原來散亂的因素。

例如我們測量客戶滿意度設計了10個題目,那數據收集完後,就可以通過因子分析,來看看這10個題目是否能綜合成幾個因素。通過spss的主成分分析,就可以得出相應結果。

結果可能是其中5個題目的相關顯著,可以通過一個因素來歸納這5個因素,另外3個、 2個也可以分別組成一個,而且主成分對應的特徵值大於1,這樣就最後就可以通過3個綜合因素來研究和分析客戶滿意度了。

主成分分析可以理解為一種數據的處理理論,也可以理解為一種應用方法。而因子分析則可以理解為一種應用方法,因為做因子分析採用的比較多的就是用主成分分析的方法來濃縮因子。

所以其實所謂的區別只不過是在學科研究當中存在的,因為同屬於統計學的理論,所以一定要找出兩者的區別來。但是如果你只是應用的話,那就沒必要考慮兩者有什麼區別。

② 主成分分析法

在對災毀土地復墾效益進行分析時,會碰到眾多因素,各因素間又相互關聯,將這些存在相關關系的因素通過數學方法綜合成少數幾個最終參評因素,使這幾個新的因素既包含原來因素的信息又相互獨立。簡化問題並抓住其本質是分析過程中的關鍵,主成分分析法可以解決這個難題。

(一)主成分分析的基本原理

主成分分析法(Principal Components Analysis,PCA)是把原來多個變數化為少數幾個綜合指標的一種統計分析方法。從數學角度來看,這是一種降維處理方法,即通過對原始指標相關矩陣內部結果關系的研究,將原來指標重新組合成一組新的相互獨立的指標,並從中選取幾個綜合指標來反映原始指標的信息。假定有n個評價單元,每個評價單元用m個因素來描述,這樣就構成一個n×m階數據矩陣:

災害損毀土地復墾

如果記m個因素為 x1,x2,…,xm,它們的綜合因素為 z1,z2,…,zp(p≤m),則:

災害損毀土地復墾

系數lij由下列原則來決定:

(1)zi與zj(i≠j,i,j=1,2,…,p)相互無關;

(2)z1是x1,x2,…,xm的一切線性組合中方差最大者,依此類推。

依據該原則確定的綜合變數指標z1,z2,…,zp分別稱為原始指標的第1、第2、…、第p個主成分,分析時可只挑選前幾個方差最大的主成分。

(二)主成分分析法的步驟

(1)將原始數據進行標准化處理,以消除原始數據在數量級或量綱上的差異。

(2)計算標准化的相關數據矩陣:

災害損毀土地復墾

(3)用雅克比法求相關系數矩陣R的特徵值(λ1,λ2,…,λp)和與之相對應的特徵向量 αi=(αi1,αi2,…,αip),i=1,2,…,p。

(4)選擇重要的主成分,並寫出其表達式。

主成分分析可以得到P個主成分,但是由於各個主成分的方差與其包含的信息量皆是遞減的,所以在實際分析時,一般不選取P個主成分,而是根據各個主成分所累計的貢獻率的大小來選取前K個主成分,這里的貢獻率是指某個主成分的方差在全部方差中所佔的比重,實際上也是某個特徵值在全部特徵值合計中所佔的比重。即:

災害損毀土地復墾

這說明,主成分所包含的原始變數的信息越強,貢獻率也就越大。主成分的累計貢獻率決定了主成分個數K的選取情況,為了保證綜合變數能包括原始變數的絕大多數信息,一般要求累計貢獻率達到85%以上。

另外,在實際應用過程中,選擇主成分之後,還要注意主成分實際含義的解釋。如何給主成分賦予新的含義,給出合理的解釋是主成分分析中一個相當關鍵的問題。一般來說,這個解釋需要根據主成分表達式的系數而定,並與定性分析來進行有效結合。主成分是原來變數的線性組合,在這個線性組合中各變數的系數有正有負、有大有小,有的又大小相當,因此不能簡單地把這個主成分看作是某個原變數的屬性作用。線性組合中各變數系數的絕對值越大表明該主成分主要包含了該變數;如果有幾個大小相當的變數系數時,則認為這一主成分是這幾個變數的綜合,而這幾個變數綜合在一起具有什麼樣的實際意義,就需要結合具體的問題和專業,給出合理的解釋,進而才能達到准確分析的目的。

(5)計算主成分得分。根據標准化的原始數據,將各個樣品分別代入主成分表達式,就可以得到各主成分下的各個樣品的新數據,即為主成分得分。具體形式可如下:

災害損毀土地復墾

(6)依據主成分得分的數據,則可以進行進一步的統計分析。其中,常見的應用有主成分回歸,變數子集合的選擇,綜合評價等。

(三)主成分分析法的評價

通過主成分分析法來評價復墾產生的效益,可將多個指標轉化成盡可能少的綜合性指標,使綜合指標間互不相干,既減少了原指標信息的重疊度,又不丟失原指標信息的總含量。該方法不僅將多個指標轉化成綜合性指標,而且也能對每個主成分的影響因素進行分析,從而判別出影響整個評價體系的關鍵因素,並且主成分分析法在確定權重時可以科學地賦值,以避免主觀因素的影響。

需要注意的是,主成分分析法雖然可以對每個主成分的權重進行科學、定量的計算,避免人為因素及主觀因素的影響,但是有時候賦權的結果可能與客觀實際有一定誤差。因此,利用主成分分析法確定權重後,再結合不同專家給的權重,是最好的解決辦法。這樣可以在定量的基礎上作出定性的分析,通過一定的數理方法將兩種數據結合起來考慮。

③ 主成分分析法與因子分析法的區別

一、性質不同

1、主成分分析法性質:通過正交變換將一組可能存在相關性的變數轉換為一組線性不相關的變數,轉換後的這組變數。

2、因子分析法性質:研究從變數群中提取共性因子的統計技術。

二、應用不同

1、主成分分析法應用:比如人口統計學、數量地理學、分子動力學模擬、數學建模、數理分析等學科中均有應用,是一種常用的多變數分析方法。

2、因子分析法應用:

(1)消費者習慣和態度研究(U&A)

(2) 品牌形象和特性研究

(3)服務質量調查

(4) 個性測試

(5)形象調查

(6) 市場劃分識別

(7)顧客、產品和行為分類



(3)主成分分析是一種特徵方法擴展閱讀:

主成分分析的原理是設法將原來變數重新組合成一組新的相互無關的幾個綜合變數,同時,根據實際需要,盡量少取幾個求和變數,以反映原始變數的信息。

這種統計方法被稱為主成分分析或主成分分析,這也是一種處理降維的數學方法。主成分分析(PCA)是試圖用一組新的不相關的綜合指標來代替原來的指標。

因子分析為社會研究的一種有力工具,但不能確定一項研究中有幾個因子。當研究中選擇的變數發生變化時,因素的數量也會發生變化。此外,對每個因素的實際含義的解釋也不是絕對的。

④ 主成分分析法(PCA)

3.2.2.1 技術原理

主成分分析方法(PCA)是常用的數據降維方法,應用於多變數大樣本的統計分析當中,大量的統計數據能夠提供豐富的信息,利於進行規律探索,但同時增加了其他非主要因素的干擾和問題分析的復雜性,增加了工作量,影響分析結果的精確程度,因此利用主成分分析的降維方法,對所收集的資料作全面的分析,減少分析指標的同時,盡量減少原指標包含信息的損失,把多個變數(指標)化為少數幾個可以反映原來多個變數的大部分信息的綜合指標。

主成分分析法的建立,假設xi1,xi2,…,xim是i個樣品的m個原有變數,是均值為零、標准差為1的標准化變數,概化為p個綜合指標F1,F2,…,Fp,則主成分可由原始變數線性表示:

地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例

計算主成分模型中的各個成分載荷。通過對主成分和成分載荷的數據處理產生主成分分析結論。

3.2.2.2 方法流程

1)首先對數據進行標准化,消除不同量綱對數據的影響,標准化可採用極值法

及標准差標准化法

,其中s=

(圖3.3);

圖3.3 方法流程圖

2)根據標准化數據求出方差矩陣;

3)求出共變數矩陣的特徵根和特徵變數,根據特徵根,確定主成分;

4)結合專業知識和各主成分所蘊藏的信息給予恰當的解釋,並充分運用其來判斷樣品的特性。

3.2.2.3 適用范圍

主成分分析不能作為一個模型來描述,它只是通常的變數變換,主成分分析中主成分的個數和變數個數p相同,是將主成分表示為原始變數的線性組合,它是將一組具有相關關系的變數變換為一組互不相關的變數。適用於對具有相關性的多指標進行降維,尋求主要影響因素的統計問題。

⑤ 什麼是主成分分析主成分分析的步驟有哪些

主成分分析是指通過將一組可能存在相關性的變數轉換城一組線性不相關的變數,轉換後的這組變數叫主成分。

主成分分析步驟:1、對原始數據標准化,2、計算相關系數,3、計算特徵,4、確定主成分,5、合成主成分。

主成分分析的原理是設法將原來變數重新組合成一組新的相互無關的幾個綜合變數,同時根據實際需要從中可以取出幾個較少的總和變數盡可能多地反映原來變數的信息的統計方法叫做主成分分析或稱主分量分析,也是數學上處理降維的一種方法。

(5)主成分分析是一種特徵方法擴展閱讀

主成分分析的主要作用

1.主成分分析能降低所研究的數據空間的維數。

2.有時可通過因子負荷aij的結論,弄清X變數間的某些關系。

3.多維數據的一種圖形表示方法。

4.由主成分分析法構造回歸模型。即把各主成分作為新自變數代替原來自變數x做回歸分析。

5.用主成分分析篩選回歸變數。

最經典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Va(rF1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應該是方差最大的,故稱F1為第一主成分。

⑥ 數據分析 常用的降維方法之主成分分析

數據分析:常用的降維方法之主成分分析

主成分分析(Principal Component Analysis,PCA)也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。
在統計學中,主成分分析是一種簡化數據集的技術。它是一個線性變換。這個變換把數據變換到一個新的坐標系統中,使得任何數據投影的第一大方差在第一個坐標(稱為第一主成分)上,第二大方差在第二個坐標(第二主成分)上,依次類推。主成分分析經常用減少數據集的維數,同時保持數據集的對方差貢獻最大的特徵。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數據的最重要方面。但是,這也不是一定的,要視具體應用而定。
主成分分析的主要作用
1.主成分分析能降低所研究的數據空間的維數。即用研究m維的Y空間代替p維的X空間(m<p),而低維的Y空間代替 高維的x空間所損失的信息很少。即:使只有一個主成分Yl(即 m=1)時,這個Yl仍是使用全部X變數(p個)得到的。例如要計算Yl的均值也得使用全部x的均值。在所選的前m個主成分中,如果某個Xi的系數全部近似於零的話,就可以把這個Xi刪除,這也是一種刪除多餘變數的方法。
2.有時可通過因子負荷aij的結論,弄清X變數間的某些關系。
3.多維數據的一種圖形表示方法。我們知道當維數大於3時便不能畫出幾何圖形,多元統計研究的問題大都多於3個變數。要把研究的問題用圖形表示出來是不可能的。然而,經過主成分分析後,我們可以選取前兩個主成分或其中某兩個主成分,根據主成分的得分,畫出n個樣品在二維平面上的分布況,由圖形可直觀地看出各樣品在主分量中的地位,進而還可以對樣本進行分類處理,可以由圖形發現遠離大多數樣本點的離群點。
4.由主成分分析法構造回歸模型。即把各主成分作為新自變數代替原來自變數x做回歸分析。
5.用主成分分析篩選回歸變數。回歸變數的選擇有著重的實際意義,為了使模型本身易於做結構分析、控制和預報,好從原始變數所構成的子集合中選擇最佳變數,構成最佳變數集合。用主成分分析篩選變數,可以用較少的計算量來選擇量,獲得選擇最佳變數子集合的效果。
主成分分析法的計算步驟
1、原始指標數據的標准化採集p 維隨機向量x = (x1,X2,...,Xp)T)n 個樣品xi = (xi1,xi2,...,xip)T ,i=1,2,…,n,
n>p,構造樣本陣,對樣本陣元進行如下標准化變換:
Z_{ij}=frac{x_{ij}-bar{x}_j}{s_j},i=1,2,...,n; j=1,2,...,p
其中bar{x}_j=frac{sum^{n}_{i=1}x_{ij}}{n},s^2_j=frac{sum^n_{i=1}(x_{ij}-bar{x}_j)^2}{n-1},得標准化陣Z。
2、對標准化陣Z 求相關系數矩陣
R=left[r_{ij}right]_pxp=frac{Z^T Z}{n-1}
其中,r_{ij}=frac{sum z_{kj}cdot z_{kj}}{n-1},i,j=1,2,...,p 。
3、解樣本相關矩陣R 的特徵方程left|R-lambda I_pright|=0得p 個特徵根,確定主成分
按frac{sum^m_{j=1}lambda_j}{sum^p_{j=1}lambda_j}ge 0.85 確定m 值,使信息的利用率達85%以上,對每個λj, j=1,2,...,m, 解方程組Rb = λjb得單位特徵向量b^o_j 。
4、將標准化後的指標變數轉換為主成分
U_{ij}=z^{T}_{i}b^{o}_{j},j=1,2,...,m
U1稱為第一主成分,U2 稱為第二主成分,…,Up 稱為第p 主成分。
5 、對m 個主成分進行綜合評價
對m 個主成分進行加權求和,即得最終評價值,權數為每個主成分的方差貢獻率。
因子分析
因子分析法是指從研究指標相關矩陣內部的依賴關系出發,把一些信息重疊、具有錯綜復雜關系的變數歸結為少數幾個不相關的綜合因子的一種多元統計分析方法。基本思想是:根據相關性大小把變數分組,使得同組內的變數之間相關性較高,但不同組的變數不相關或相關性較低,每組變數代表一個基本結構一即公共因子。
因子分析法的步驟
(1)對數據樣本進行標准化處理。
(2)計算樣本的相關矩陣R。
(3)求相關矩陣R的特徵根和特徵向量。
(4)根據系統要求的累積貢獻率確定主因子的個數。
(5)計算因子載荷矩陣A。
(6)確定因子模型。
(7)根據上述計算結果,對系統進行分析。

以上是小編為大家分享的關於數據分析 常用的降維方法之主成分分析的相關內容,更多信息可以關注環球青藤分享更多干貨

⑦ PCA主成分分析原理

在多點地質統計學中,數據樣板構成了一個空間結構,不同方向節點就是一個變數。一個數據事件就是由眾多變數值構成的整體。在進行數據事件相似性計算與比較時,需要逐點計算其差異;在進行聚類時亦要對所有數據事件進行比較,導致計算效率非常低下。因此很有必要挖掘數據事件內部結構,將其變數進行組合,求取特徵值,並用少量特徵值完成數據事件的聚類,有效提高儲層建模效率。因此,PCA主成分分析被引入到多點地質統計學中。

主成分分析(Pirncipal Component Analysis,PCA)是一種掌握事物主要矛盾的統計分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質,簡化復雜的問題。PCA的目標是尋找r(r<n)個新變數,使它們反映事物的主要特徵,壓縮原有數據矩陣的規模。每個新變數是原有變數的線性組合,體現原有變數的綜合效果,具有一定的實際含義。這r個新變數稱為「主成分」,它們可以在很大程度上反映原來n個變數的影響,並且這些新變數是互不相關的,也是正交的。通過主成分分析,壓縮數據空間,將多元數據的特徵在低維空間里直觀地表示出來。

假設x=[x1,x2,…,xp]′是一個p維的隨機向量,它遵從正態分布x~N(u,σ2)。導出主成分的問題就是尋找x的線性函數a′x,並使a′x的相應的方差最大。

多點地質統計學原理、方法及應用

因此,在代數上就是尋找一個正交矩陣a,使a′a=1,並使方差:

多點地質統計學原理、方法及應用

設矩陣A的特徵值為λ1≥λ2≥…≥λp≥0對應λi的特徵向量記為ui,令Up×p=

多點地質統計學原理、方法及應用

則U是正交矩陣,即UU′=I,由於A是實對稱矩陣,所以有

多點地質統計學原理、方法及應用

多點地質統計學原理、方法及應用

當a=u1時,

多點地質統計學原理、方法及應用

因此,當a=u1時,就滿足了方差最大的要求,等於相應的特徵值λ1

同理,可推廣到一般:

多點地質統計學原理、方法及應用

並且協方差為

多點地質統計學原理、方法及應用

這就是說,綜合變數的系數aj是協方差矩陣A的特徵值λj對應的特徵向量ju,綜合變數Fj的重要性等同於特徵值λj,這樣,就可以用少數幾個變數來描述綜合變數的性質。

⑧ 主成分分析詳解

一、主成分分析
1、簡介
在用統計分析方法研究這個多變數的課題時,變數個數太多就會增加課題的復雜性。人們自然希望變數個數較少而得到的信息較多。在很多情形,變數之間是有一定的相關關系的,當兩個變數之間有一定相關關系時,可以解釋為這兩個變數反映此課題的信息有一定的重疊。主成分分析是對於原先提出的所有變數,建立盡可能少的新變數,使得這些新變數是兩兩不相關的,而且這些新變數在反映課題的信息方面盡可能保持原有的信息。
2、原理
設法將原來變數重新組合成一組新的互相無關的幾個綜合變數,同時根據實際需要從中可以取出幾個較少的綜合變數盡可能多地反映原來變數的信息的統計方法叫做主成分分析或稱主分量分析,也是數學上處理降維的一種方法。
二、主成分分析的基本思想及步驟
1、基本思想
主成分分析是設法將原來眾多具有一定相關性(比如P個指標),重新組合成一組新的互相無關的綜合指標來代替原來的指標。通常數學上的處理就是將原來P個指標作線性組合,作為新的綜合指標。最經典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來P個指標的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F1已有的信息就不需要再出現在F2中,用數學語言表達就是要求Cov(F1, F2)=0,則稱F2為第二主成分,依此類推可以構造出第三、第四,……,第P個主成分。
2、步驟
Fp=a1iZX1+a2iZX2+……+apiZXp 其中a1i, a2i, ……,api(i=1,……,m)為X的協方差陣Σ的特徵值所對應的特徵向量,ZX1, ZX2, ……, ZXp是原始變數經過標准化處理的值,因為在實際應用中,往往存在指標的量綱不同,所以在計算之前須先消除量綱的影響,而將原始數據標准化,本文所採用的數據就存在量綱影響[註:本文指的數據標准化是指Z標准化]。 A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R為相關系數矩陣,λi、ai是相應的特徵值和單位特徵向量,λ1≥λ2≥…≥λp≥0 。 進行主成分分析主要步驟如下: 1. 指標數據標准化(SPSS軟體自動執行); 2. 指標之間的相關性判定; 3. 確定主成分個數m; 4. 主成分Fi表達式; 5. 主成分Fi命名;

⑨ 什麼是主成分分析方法

主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。 在統計學中,主成分分析(principal components analysis,PCA)是一種簡化數據集的技術。它是一個線性變換。這個變換把數據變換到一個新的坐標系統中,使得任何數據投影的第一大方差在第一個坐標(稱為第一主成分)上,第二大方差在第二個坐標(第二主成分)上,依次類推。主成分分析經常用減少數據集的維數,同時保持數據集的對方差貢獻最大的特徵.這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數據的最重要方面.但是,這也不是一定的,要視具體應用而定.

⑩ 主成分分析中主成分的方差具有的特徵是什麼

主成分的方差具有的特徵:主成分分析中,主成分的方差越大,所含的信息越多。

主成分分析中,應該先進行標准化,根據標准化後的協差陣計算的特徵值才是准確的,特徵值就是主成分的方差。

有的時候就是有很多主成分的,你要分析的元素越多,主成分越多,主成分分析要求數據接近正態分布,不一定要嚴格的正態分布條件,一般來說樣本量在100以上就基本符合條件,聚類分析對數據的要求是聚類的各組的組內方差較小,而組間方差較大,正常來說只要方法選擇得當,這個要求會比較容易做到的。

應用

主成分分析作為基礎的數學分析方法,其實際應用十分廣泛,比如人口統計學、數量地理學、分子動力學模擬、數學建模、數理分析等學科中均有應用,是一種常用的多變數分析方法。

主成分分析是設法將原來眾多具有一定相關性(比如P個指標),重新組合成一組新的互相無關的綜合指標來代替原來的指標。

主成分分析,是考察多個變數間相關性一種多元統計方法,研究如何通過少數幾個主成分來揭示多個變數間的內部結構,即從原始變數中導出少數幾個主成分,使它們盡可能多地保留原始變數的信息,且彼此間互不相關.通常數學上的處理就是將原來P個指標作線性組合,作為新的綜合指標。

閱讀全文

與主成分分析是一種特徵方法相關的資料

熱點內容
提高電腦辦公的最好方法 瀏覽:116
隱形地暖正確安裝方法 瀏覽:279
心理治療的基本方法 瀏覽:429
蘭花水苔簡易種植方法 瀏覽:697
吉利博越正確鎖車方法 瀏覽:589
墨魚板磨粉的食用方法 瀏覽:103
創意聯想的方法有哪些 瀏覽:781
愛茉莉減肥茶使用方法 瀏覽:754
擋風玻璃喜字墨水清除的最佳方法 瀏覽:570
吃雞怎麼領皮膚方法 瀏覽:738
乳腺增生的治療方法刮痧 瀏覽:44
簡述兒童頭圍正確測量的方法 瀏覽:831
玻璃門玻璃安裝方法 瀏覽:12
煤的分析檢測方法 瀏覽:35
數學還原的方法和技巧 瀏覽:942
做香菇蒸肉餅的方法與步驟 瀏覽:940
在高中如何找到適合的學習方法 瀏覽:239
正確晾衣方法 瀏覽:908
三鮮酸菜腌制方法簡單 瀏覽:904
qq手機列印功能在哪裡設置方法 瀏覽:221