導航:首頁 > 知識科普 > 估計多重共線性的方法有哪些

估計多重共線性的方法有哪些

發布時間:2022-04-28 14:33:18

Ⅰ 多重共線性問題的幾種解決方法

多重共線性問題的幾種解決方法

在多元線性回歸模型經典假設中,其重要假定之一是回歸模型的解釋變數之間不存在線性關系,也就是說,解釋變數X1,X2,……,Xk中的任何一個都不能是其他解釋變數的線性組合。如果違背這一假定,即線性回歸模型中某一個解釋變數與其他解釋變數間存在線性關系,就稱線性回歸模型中存在多重共線性。多重共線性違背了解釋變數間不相關的古典假設,將給普通最小二乘法帶來嚴重後果。
這里,我們總結了8個處理多重共線性問題的可用方法,大家在遇到多重共線性問題時可作參考:
1、保留重要解釋變數,去掉次要或可替代解釋變數
2、用相對數變數替代絕對數變數
3、差分法
4、逐步回歸分析
5、主成份分析
6、偏最小二乘回歸
7、嶺回歸
8、增加樣本容量
這次我們主要研究逐步回歸分析方法如何處理多重共線性問題的。
逐步回歸分析方法的基本思想是通過相關系數r 、擬合優度R2 和標准誤差三個方面綜合判斷一系列回歸方程的優劣,從而得到最優回歸方程。具體方法分為兩步:
第一步,先將被解釋變數y對每個解釋變數作簡單回歸:
對每一個回歸方程進行統計檢驗分析(相關系數r 、擬合優度R2 和標准誤差),並結合經濟理論分析選出最優回歸方程,也稱為基本回歸方程。
第二步,將其他解釋變數逐一引入到基本回歸方程中,建立一系列回歸方程,根據每個新加的解釋變數的標准差和復相關系數來考察其對每個回歸系數的影響,一般根據如下標准進行分類判別:
1.如果新引進的解釋變數使R2 得到提高,而其他參數回歸系數在統計上和經濟理論上仍然合理,則認為這個新引入的變數對回歸模型是有利的,可以作為解釋變數予以保留。
2.如果新引進的解釋變數對R2 改進不明顯,對其他回歸系數也沒有多大影響,則不必保留在回歸模型中。
3.如果新引進的解釋變數不僅改變了R2 ,而且對其他回歸系數的數值或符號具有明顯影響,則認為該解釋變數為不利變數,引進後會使回歸模型出現多重共線性問題。不利變數未必是多餘的,如果它可能對被解釋變數是不可缺少的,則不能簡單舍棄,而是應研究改善模型的形式,尋找更符合實際的模型,重新進行估計。如果通過檢驗證明回歸模型存在明顯線性相關的兩個解釋變數中的其中一個可以被另一個很好地解釋,則可略去其中對被解釋變數影響較小的那個變數,模型中保留影響較大的那個變數。
下邊我們通過實例來說明逐步回歸分析方法在解決多重共線性問題上的具體應用過程。
具體實例
例1 設某地10年間有關服裝消費、可支配收入、流動資產、服裝類物價指數、總物價指數的調查數據如表1,請建立需求函數模型。
表1 服裝消費及相關變數調查數據
年份
服裝開支
C
(百萬元)
可支配收入
Y
(百萬元)
流動資產
L
(百萬元)
服裝類物價指數Pc
1992年=100
總物價指數
P0
1992年=100
1988
8.4
82.9
17.1
92
94
1989
9.6
88.0
21.3
93
96
1990
10.4
99.9
25.1
96
97
1991
11.4
105.3
29.0
94
97
1992
12.2
117.7
34.0
100
100
1993
14.2
131.0
40.0
101
101
1994
15.8
148.2
44.0
105
104
1995
17.9
161.8
49.0
112
109
1996
19.3
174.2
51.0
112
111
1997
20.8
184.7
53.0
112
111
(1)設對服裝的需求函數為

用最小二乘法估計得估計模型:

模型的檢驗量得分,R2=0.998,D·W=3.383,F=626.4634
R2接近1,說明該回歸模型與原始數據擬合得很好。由得出拒絕零假設,認為服裝支出與解釋變數間存在顯著關系。
(2)求各解釋變數的基本相關系數

上述基本相關系數表明解釋變數間高度相關,也就是存在較嚴重的多重共線性。
(3)為檢驗多重共線性的影響,作如下簡單回歸:

各方程下邊括弧內的數字分別表示的是對應解釋變數系數的t檢驗值。
觀察以上四個方程,根據經濟理論和統計檢驗(t檢驗值=41.937最大,擬合優度也最高),收入Y是最重要的解釋變數,從而得出最優簡單回歸方程。
(4)將其餘變數逐個引入,計算結果如下表2:
表2服裝消費模型的估計
結果分析:
①在最優簡單回歸方程中引入變數Pc,使R2由0.9955提高到0.9957;根據經濟理論分析,正號,負號是合理的。然而t檢驗不顯著(),而從經濟理論分析,Pc應該是重要因素。雖然Y與Pc高度相關,但並不影響收入Y回歸系數的顯著性和穩定性。依照第1條判別標准,Pc可能是「有利變數」,暫時給予保留。
②模型中引入變數L ,R2 由0.9957提高到0.9959, 值略有提高。一方面,雖然Y 與L ,Pc與L 均高度相關,但是L 的引入對回歸系數、的影響不大(其中的值由0.1257變為0.1387,值由-0.0361變為-0.0345,變化很小);另一方面,根據經濟理論的分析,L與服裝支出C之間應該是正相關關系,即的符號應該為正號而非負號,依照第2條判別標准,解釋變數L不必保留在模型中。
③捨去變數L ,加入變數P0 ,使R2 由0.9957提高到0.9980,R2 值改進較大。、、均顯著(這三個回歸系數的t檢驗值絕對值均大於),從經濟意義上看也是合理的(服裝支出C與Y,P0之間呈正相關,而與服裝價格Pc之間呈負相關關系)。根據判別標准第1條,可以認為Pc、P0皆為「有利變數」,給予保留。
④最後再引入變數L ,此時R2 =0.9980沒有增加(或幾乎沒有增加),新引入變數對其他三個解釋變數的參數系數也沒有產生多大影響,可以確定L 是多餘變數,根據判別標准第2條,解釋變數L 不必保留在模型中。
因此我們得到如下結論:回歸模型為最優模型。
通過以上案例的分析,我們從理論和實際問題兩方面具體了解了逐步回歸分析是如何對多重共線性問題進行處理的。事實上,一般統計軟體如SPSS,在回歸模型的窗口中都會提供變數逐步進入的選項,勾選後實際上就是選擇了運用逐步回歸的思想來構建回歸模型。運用SPSS軟體不需要我們懂得其背後的運行規律,然而作為分析師,了解並理解模型背後的理論知識,將更有助於我們理解模型、解釋結論背後的內在含義,從而達到更好地分析問題的目的。

Ⅱ 多重共線性的典型表現是什麼判斷是否存在多重共線性的方法有哪些

多重共線性的典型表現是,線性回歸模型中的解釋變數之間由於存在精確相關關系或高度相關關系而使模型估計失真或難以估計准確。由於經濟數據的限制使得模型設計不當,導致設計矩陣中解釋變數間存在普遍的相關關系。主要產生原因是經濟變數相關的共同趨勢,滯後變數的引入,樣本資料的限制。判斷是否存在多重共線性的方法有特徵值,存在維度為3和4的值約等於0,說明存在比較嚴重的共線性。條件索引列第3第4列大於10,可以說明存在比較嚴重的共線性。比例方差內存在接近1的數,可以說明存在較嚴重的共線性。判斷是否存在多重共線性的方法:1.方差膨脹因子:共線性主要考察的是自變數之間是否存在線性關系。所以很自然地,我們會考慮[公式]對[公式](除[公式]以外的其他自變數)的線性回歸擬合以及由此得到的可決系數[公式]。如果自變數之間存在很強的線性關系,則[公式]會很大,甚至會接近1。[公式]即為方差膨脹因子。其值若大於10,則認為存在較強的共線性問題。2.常用的評價指標有兩個:(1)容許度和膨脹因子(VIF)。容許度=1-Rj^2。其中的R是第j個自變數與其餘變數進行回歸時的判定系數。容許度越接近1,表示多重共線性越弱。膨脹因子:膨脹因子是容許度的倒數。膨脹因子越接近1(膨脹因子理論最小值是1),表示解釋變數之間的多重共線性越弱,通常膨脹因子<10是弱多重共線性。若膨脹因子>=10,說明膨脹因子存在嚴重多重共線性。 在SPSS中可以通過在回歸分析時勾選「統計」選項卡的「共線性診斷」自動計算容許度和膨脹因子,來判斷自變數是否高度相關,是否存在多重共線性問題。 多重共線性的處理方法 若自變數之間存在多重共線性就需要對自變數進行處理後才能進行回歸分析,處理方法為主成分分析(Principal Component Analysis,PCA)。 (2) PCA 主成分分析法是運用降維的思想將一組高度相關的自變數轉換為一組相互獨立的、不存在線性關系的變數,轉換後的變數稱為主成分,主成分可反映原始數據的大部分信息。一般在自變數個數太多或者存在嚴重相關關系時使用主成分分析對自變數進行處理,主成分分析一般作為研究中的一個中間環節。 3.常用統計量 主成分分析中的幾個統計量: ⑴特徵根。主成分特徵根的大小可反映該主成分的影響力度,表示該主成分可以解釋平均多少個原始變數的信息。例如若特徵根λi=3.998,表示該主成分可以解釋平均3.998個原始變數。若特徵根λi<1表示該主成分的解釋力度還不如一個原始變數的解釋力度大,因此常將特徵根大於1作為引入某個主成分的標准。 ⑵主成分Zi的方差貢獻率。主成分的方差反映該主成分含原變數總信息量的百分。 ⑶累積貢獻率。將k個主成分的方差貢獻率按照從大到小的順序排列,累計貢獻率指前k個主成分的方差貢獻率之和,反映前k個主成分可提取百分之多少的原始變數的信息。在確定主成分個數時,一般選擇累積貢獻率達到70%-85%的前k個主成分。

Ⅲ 多重共線性的解決方法

(1)排除引起共線性的變數
找出引起多重共線性的解釋變數,將它排除出去,以逐步回歸法得到最廣泛的應用。
(2)差分法
時間序列數據、線性模型:將原模型變換為差分模型。
(3)減小參數估計量的方差:嶺回歸法(Ridge Regression)。

怎麼判斷一個函數模型是否存在多重共線性

用eviews計算,看各參數的T檢驗及F檢驗是否通過,如果F檢驗通過,但是有兩個以上T檢驗不通過,就有很大的可能是多重共線性了。

還有就是看模型中所用的變數之間會不會明顯相關,就像,貨幣供應量和工資之類的。

可以嘗試直接聯立兩個變數的方差,看變數間的R平方是不是很接近1,越接近1,說明多重共線性越明顯。

由於經濟數據的限制使得模型設計不當,導致設計矩陣中解釋變數間存在普遍的相關關系。完全共線性的情況並不多見,出現的是在一定程度上的共線性,即近似共線性。

(4)估計多重共線性的方法有哪些擴展閱讀:

如果線性回歸模型存在完全共線性,則回歸系數的 LS 估計不存在,因此,在線性回歸分析中所談的共線性主要是非完全共線性。

多重共線性使參數估計值的方差增大,1/(1-r2)為方差膨脹因子如果方差膨脹因子值越大,說明共線性越強。相反因為,容許度是方差膨脹因子的倒數,所以,容許度越小,共線性越強。

可以這樣記憶:容許度代表容許,也就是許可,如果,值越小,代表在數值上越不容許,就是越小,越不要。

而共線性是一個負面指標,在分析中都是不希望它出現,將共線性和容許度聯系在一起,容許度越小,越不要,實際情況越不好,共線性這個「壞蛋」越強。進一步,方差膨脹因子因為是容許度倒數,所以反過來。

Ⅳ 計量經濟學中多重共線性的檢驗方法有哪些

作出各解釋變數的相關系數矩陣,利用相關系數矩陣可以很容易看出自變數之間的共線性。你也可以使用輔助回歸方法,即把多個解釋變數中的一個作為因變數其餘的作為自變數做回歸分析看顯著性。還可以更具OLS估計量的性質,得到估計參數的「方差膨脹因子」進行判斷。

Ⅵ 計量經濟學中多重共線性的檢驗方法有哪些

1、簡單相關系數矩陣法(輔助手段)

此法簡單易行;但要注意兩變數的簡單相關系數包含了其他變數的影響,並非它們真實的線性相關程度的反映,一般在0.8以上可初步判定它倆之間有線性相關。

2、變數顯著性與方程顯著性綜合判斷

(修正)可決系數大,F值顯著大於臨界值,而值不顯著;那麼可認為存在多重共線性。

3、輔助回歸

將每個解釋變數對其餘變數回歸,若某個回歸方程顯著成立,則該解釋變數和其餘變數有多重共線性。

(4)方差擴大(膨脹)因子法

(5)直觀判斷法

增加或者減少一個解釋變數,或者改變一個觀測值時,回歸參數發生較大變化。重要解釋變數沒有通過t檢驗。有些解釋變數的回歸系數符號與定性分析的相反。

(6)估計多重共線性的方法有哪些擴展閱讀:

解決方法

(1)、排除引起共線性的變數

找出引起多重共線性的解釋變數,將它排除出去,以逐步回歸法得到最廣泛的應用。

(2)、差分法

時間序列數據、線性模型:將原模型變換為差分模型。

(3)、減小參數估計量的方差:嶺回歸法(Ridge Regression)。

Ⅶ 如何用SPSS檢驗多重共線性

在進行線性回歸分析時,容易出現自變數(解釋變數)之間彼此相關,這種情況被稱作多重共線性問題。在SPSS 22中檢驗多重共線性的方法如下。

1、首先導入數據,如下所示:

Ⅷ 多重共線性的檢驗方法

,出現了相關系數與回歸方程系數符號相反的問題,經過研究,確認是多重共線性問題並探索了解決方法。
在此將多重共線性的相關知識整理如下。

解釋變數理論上的高度相關與觀測值高度相關沒有必然關系,有可能兩個解釋變數理論上高度相關,但觀測值未必高度相關,反之亦然。所以多重共線性本質上是數據問題。
造成多重共線性的原因有一下幾種:
1、解釋變數都享有共同的時間趨勢;
2、一個解釋變數是另一個的滯後,二者往往遵循一個趨勢;
3、由於數據收集的基礎不夠寬,某些解釋變數可能會一起變動;
4、某些解釋變數間存在某種近似的線性關系;

判別:
1、發現系數估計值的符號不對;
2、某些重要的解釋變數t值低,而R方不低
3、當一不太重要的解釋變數被刪除後,回歸結果顯著變化;

檢驗;
1、相關性分析,相關系數高於0.8,表明存在多重共線性;但相關系數低,並不能表示不存在多重共線性;
2、vif檢驗;
3、條件系數檢驗;

解決方法:
1、增加數據;
2、對模型施加某些約束條件;
3、刪除一個或幾個共線變數;
4、將模型適當變形;
5、主成分回歸

處理多重共線性的原則:

1、 多重共線性是普遍存在的,輕微的多重共線性問題可不採取措施;
2、 嚴重的多重共線性問題,一般可根據經驗或通過分析回歸結果發現。如影響系數符號,重要的解釋變數t值很低。要根據不同情況採取必要措施。
3、 如果模型僅用於預測,則只要擬合程度好,可不處理多重共線性問題,存在多重共線性的模型用於預測時,往往不影響預測結果;

閱讀全文

與估計多重共線性的方法有哪些相關的資料

熱點內容
鋰電池電量顯示器安裝方法 瀏覽:814
墊腳石的鑒別方法 瀏覽:595
幼兒活動教學組織方法有哪些 瀏覽:57
用球怎麼做地球儀簡易方法 瀏覽:14
平滑移動計算方法 瀏覽:988
華碩手機電池校對方法 瀏覽:220
如何自製去除汗漬的方法 瀏覽:899
結構化系統分析方法主要特點 瀏覽:193
測量血清白蛋白的方法 瀏覽:25
鑒別茅台酒的方法每年不一樣 瀏覽:267
貂衣服怎麼保養方法 瀏覽:858
設置左邊距20像素的方法有哪些 瀏覽:511
金枝玉葉怎麼養殖方法圖片 瀏覽:345
轉碼器正確使用方法 瀏覽:803
機器人正確安裝方法 瀏覽:361
沙煲鍋使用方法 瀏覽:756
正確的卸妝方法 瀏覽:862
土豆第一次種植方法 瀏覽:801
有什麼方法糾正nl不分 瀏覽:992
頸部淋巴瘤治療方法 瀏覽:301