導航:首頁 > 研究方法 > 線性回歸模型分析方法

線性回歸模型分析方法

發布時間:2022-05-02 02:43:49

① 線性回歸方程公式b怎麼

第一:用所給樣本求出兩個相關變數的(算術)平均值:
x_=(x1+x2+x3+...+xn)/n
y_=(y1+y2+y3+...+yn)/n

第二:分別計算分子和分母:(兩個公式任選其一)
分子=(x1y1+x2y2+x3y3+...+xnyn)-nx_Y_
分母=(x1^2+x2^2+x3^2+...+xn^2)-n*x_^2

第三:計算 b : b=分子 / 分母

用最小二乘法估計參數b,設服從正態分布,分別求對a、b的偏導數並令它們等於零,得方程組解為

其中 ,且為觀測值的樣本方差.線性方程稱為關於的線性回歸方程,稱為回歸系數,對應的直線稱為回歸直線.順便指出,將來還需用到,其中為觀測值的樣本方差.

先求x,y的平均值X,Y

再用公式代入求解:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)

後把x,y的平均數X,Y代入a=Y-bX

求出a並代入總的公式y=bx+a得到線性回歸方程

(X為xi的平均數,Y為yi的平均數)

(1)線性回歸模型分析方法擴展閱讀

分析按照自變數和因變數之間的關系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個自變數和一個因變數,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。

如果回歸分析中包括兩個或兩個以上的自變數,且因變數和自變數之間是線性關系,則稱為多元線性回歸分析。

② 一線性回歸分析法

一元線性回歸分析預測法,是根據自變數x和因變數Y的相關關系,建立x與Y的線性回歸方程進行預測的方法。由於市場現象一般是受多種因素的影響,而並不是僅僅受一個因素的影響。所以應用一元線性回歸分析預測法,必須對影響市場現象的多種因素做全面分析。只有當諸多的影響因素中,確實存在一個對因變數影響作用明顯高於其他因素的變數,才能將它作為自變數,應用一元相關回歸分析市場預測法進行預測。

一元線性回歸分析法的預測模型為:

(1)

式中,xt代表t期自變數的值;

代表t期因變數的值;

a、b代表一元線性回歸方程的參數。

a、b參數由下列公式求得(用代表):為簡便計算,我們作以下定義:

(2)

式中:

這樣定義a、b後,參數由下列公式求得:

(3)

將a、b代入一元線性回歸方程Yt = a + bxt,就可以建立預測模型,那麼,只要給定xt值,即可求出預測值。

在回歸分析預測法中,需要對X、Y之間相關程度作出判斷,這就要計算相關系數Y,其公式如下:相關系數r的特徵有:

①相關系數取值范圍為:-1≤r≤1 。

②r與b符合相同。當r>0,稱正線性相關,Xi上升,Yi呈線性增加。當r<0,稱負線性相關,Xi上升,Yi呈線性減少。

③|r|=0,X與Y無線性相關關系;|r|=1,完全確定的線性相關關系;0<|r|<1,X與Y存在一定的線性相關關系;|r|>0.7,為高度線性相關;0.3<|r|≤0.7,為中度線性相關;|r|≤0.3,為低度線性相關。

③ 回歸分析的認識及簡單運用

回歸分析的認識及簡單運用

回歸分析(regression analysis)是確定兩種或兩種以上變數間相互依賴的定量關系的一種統計分析方法。運用十分廣泛,回歸分析按照涉及的自變數的多少,分為回歸和多重回歸分析;按照自變數的多少,可分為一元回歸分析和多元回歸分析;按照自變數和因變數之間的關系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個自變數和一個因變數,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變數,且因變數和自變數之間是線性關系,則稱為多重線性回歸分析。

定義

回歸分析是應用極其廣泛的數據分析方法之一。它基於觀測數據建立變數間適當的依賴關系,以分析數據內在規律,並可用於預報、控制等問題。

方差齊性

線性關系

效應累加

變數無測量誤差

變數服從多元正態分布

觀察獨立

模型完整(沒有包含不該進入的變數、也沒有漏掉應該進入的變數)

誤差項獨立且服從(0,1)正態分布。

現實數據常常不能完全符合上述假定。因此,統計學家研究出許多的回歸模型來解決線性回歸模型假定過程的約束。

研究一個或多個隨機變數Y1 ,Y2 ,…,Yi與另一些變數X1、X2,…,Xk之間的關系的統計方法,又稱多重回歸分析。通常稱Y1,Y2,…,Yi為因變數,X1、X2,…,Xk為自變數。回歸分析是一類數學模型,特別當因變數和自變數為線性關系時,它是一種特殊的線性模型。最簡單的情形是一個自變數和一個因變數,且它們大體上有線性關系,這叫一元線性回歸,即模型為Y=a+bX+ε,這里X是自變數,Y是因變數,ε是隨機誤差,通常假定隨機誤差的均值為0,方差為σ^2(σ^2大於0)σ^2與X的值無關。若進一步假定隨機誤差遵從正態分布,就叫做正態線性模型。一般的情形,它有k個自變數和一個因變數,因變數的值可以分解為兩部分:一部分是由於自變數的影響,即表示為自變數的函數,其中函數形式已知,但含一些未知參數;另一部分是由於其他未被考慮的因素和隨機性的影響,即隨機誤差。當函數形式為未知參數的線性函數時,稱線性回歸分析模型;當函數形式為未知參數的非線性函數時,稱為非線性回歸分析模型。當自變數的個數大於1時稱為多元回歸,當因變數個數大於1時稱為多重回歸。

回歸分析的主要內容為:

①從一組數據出發,確定某些變數之間的定量關系式,即建立數學模型並估計其中的未知參數。估計參數的常用方法是最小二乘法。

②對這些關系式的可信程度進行檢驗。

③在許多自變數共同影響著一個因變數的關系中,判斷哪個(或哪些)自變數的影響是顯著的,哪些自變數的影響是不顯著的,將影響顯著的自變數入模型中,而剔除影響不顯著的變數,通常用逐步回歸、向前回歸和向後回歸等方法。

④利用所求的關系式對某一生產過程進行預測或控制。回歸分析的應用是非常廣泛的,統計軟體包使各種回歸方法計算十分方便。

在回歸分析中,把變數分為兩類。一類是因變數,它們通常是實際問題中所關心的一類指標,通常用Y表示;而影響因變數取值的的另一類變數稱為自變數,用X來表示。

回歸分析研究的主要問題是:

(1)確定Y與X間的定量關系表達式,這種表達式稱為回歸方程;

(2)對求得的回歸方程的可信度進行檢驗;

(3)判斷自變數X對因變數Y有無影響;

(4)利用所求得的回歸方程進行預測和控制。

回歸分析可以說是統計學中內容最豐富、應用最廣泛的分支。這一點幾乎不帶誇張。包括最簡單的t檢驗、方差分析也都可以歸到線性回歸的類別。而卡方檢驗也完全可以用logistic回歸代替。

眾多回歸的名稱張口即來的就有一大片,線性回歸、logistic回歸、cox回歸、poission回歸、probit回歸等等等等,可以一直說的你頭暈。為了讓大家對眾多回歸有一個清醒的認識,這里簡單地做一下總結:

1、線性回歸,這是我們學習統計學時最早接觸的回歸,就算其它的你都不明白,最起碼你一定要知道,線性回歸的因變數是連續變數,自變數可以是連續變數,也可以是分類變數。如果只有一個自變數,且只有兩類,那這個回歸就等同於t檢驗。如果只有一個自變數,且有三類或更多類,那這個回歸就等同於方差分析。如果有2個自變數,一個是連續變數,一個是分類變數,那這個回歸就等同於協方差分析。所以線性回歸一定要認准一點,因變數一定要是連續變數。

2、logistic回歸,與線性回歸並成為兩大回歸,應用范圍一點不亞於線性回歸,甚至有青出於藍之勢。因為logistic回歸太好用了,而且太有實際意義了。解釋起來直接就可以說,如果具有某個危險因素,發病風險增加2.3倍,聽起來多麼地讓人通俗易懂。線性回歸相比之下其實際意義就弱了。logistic回歸與線性回歸恰好相反,因變數一定要是分類變數,不可能是連續變數。分類變數既可以是二分類,也可以是多分類,多分類中既可以是有序,也可以是無序。二分類logistic回歸有時候根據研究目的又分為條件logistic回歸和非條件logistic回歸。條件logistic回歸用於配對資料的分析,非條件logistic回歸用於非配對資料的分析,也就是直接隨機抽樣的資料。無序多分類logistic回歸有時候也成為多項logit模型,有序logistic回歸有時也稱為累積比數logit模型。

3、cox回歸,cox回歸的因變數就有些特殊,因為他的因變數必須同時有2個,一個代表狀態,必須是分類變數,一個代表時間,應該是連續變數。只有同時具有這兩個變數,才能用cox回歸分析。cox回歸主要用於生存資料的分析,生存資料至少有兩個結局變數,一是死亡狀態,是活著還是死亡?二是死亡時間,如果死亡,什麼時間死亡?如果活著,從開始觀察到結束時有多久了?所以有了這兩個變數,就可以考慮用cox回歸分析。

4、poisson回歸,poisson回歸相比就不如前三個用的廣泛了。但實際上,如果你能用logistic回歸,通常也可以用poission回歸,poisson回歸的因變數是個數,也就是觀察一段時間後,發病了多少人?或者死亡了多少人?等等。其實跟logistic回歸差不多,因為logistic回歸的結局是是否發病,是否死亡,也需要用到發病例數、死亡例數。大家仔細想想,其實跟發病多少人,死亡多少人一個道理。只是poission回歸名氣不如logistic回歸大,所以用的人也不如logistic回歸多。但不要因此就覺得poisson回歸沒有用。

5、probit回歸,在醫學里真的是不大用,最關鍵的問題就是probit這個詞太難理解了,通常翻譯為概率單位。probit函數其實跟logistic函數十分接近,二者分析結果也十分接近。可惜的是,probit回歸的實際含義真的不如logistic回歸容易理解,由此導致了它的默默無名,但據說在社會學領域用的似乎更多一些。

6、負二項回歸。所謂負二項指的是一種分布,其實跟poission回歸、logistic回歸有點類似,poission回歸用於服從poission分布的資料,logistic回歸用於服從二項分布的資料,負二項回歸用於服從負二項分布的資料。說起這些分布,大家就不願意聽了,多麼抽象的名詞,我也很頭疼。如果簡單點理解,二項分布你可以認為就是二分類數據,poission分布你可以認為是計數資料,也就是個數,而不是像身高等可能有小數點,個數是不可能有小數點的。負二項分布呢,也是個數,只不過比poission分布更苛刻,如果你的結局是個數,而且結局可能具有聚集性,那可能就是負二項分布。簡單舉例,如果調查流感的影響因素,結局當然是流感的例數,如果調查的人有的在同一個家庭里,由於流感具有傳染性,那麼同一個家裡如果一個人得流感,那其他人可能也被傳染,因此也得了流感,那這就是具有聚集性,這樣的數據盡管結果是個數,但由於具有聚集性,因此用poission回歸不一定合適,就可以考慮用負二項回歸。既然提到這個例子,用於logistic回歸的數據通常也能用poission回歸,就像上面案例,我們可以把結局作為二分類,每個人都有兩個狀態,得流感或者不得流感,這是個二分類結局,那就可以用logistic回歸。但是這里的數據存在聚集性怎麼辦呢,幸虧logistic回歸之外又有了更多的擴展,你可以用多水平logistic回歸模型,也可以考慮廣義估計方程。這兩種方法都可以處理具有層次性或重復測量資料的二分類因變數。

7、weibull回歸,有時中文音譯為威布爾回歸。weibull回歸估計你可能就沒大聽說過了,其實這個名字只不過是個噱頭,嚇唬人而已。上一篇說過了,生存資料的分析常用的是cox回歸,這種回歸幾乎統治了整個生存分析。但其實夾縫中還有幾個方法在頑強生存著,而且其實很有生命力,只是國內大多不願用而已。weibull回歸就是其中之一。cox回歸為什麼受歡迎呢,因為它簡單,用的時候不用考慮條件(除了等比例條件之外),大多數生存數據都可以用。而weibull回歸則有條件限制,用的時候數據必須符合weibull分布。怎麼,又是分布?!估計大家頭又大了,是不是想直接不往下看了,還是用cox回歸吧。不過我還是建議看下去。為什麼呢?相信大家都知道參數檢驗和非參數檢驗,而且可能更喜歡用參數檢驗,如t檢驗,而不喜歡用非參數檢驗,如秩和檢驗。那這里的weibull回歸和cox回歸基本上可以說是分別對應參數檢驗和非參數檢驗。參數檢驗和非參數檢驗的優缺點我也在前面文章里通俗介紹了,如果數據符合weibull分布,那麼直接套用weibull回歸當然是最理想的選擇,他可以給出你最合理的估計。如果數據不符合weibull分布,那如果還用weibull回歸,那就套用錯誤,肯定結果也不會真實到哪兒去。所以說,如果你能判斷出你的數據是否符合weibull分布,那當然最好的使用參數回歸,也就是weibull回歸。但是如果你實在沒什麼信心去判斷數據分布,那也可以老老實實地用cox回歸。cox回歸可以看作是非參數的,無論數據什麼分布都能用,但正因為它什麼數據都能用,所以不可避免地有個缺點,每個數據用的都不是恰到好處。weibull回歸就像是量體裁衣,把體形看做數據,衣服看做模型,weibull回歸就是根據你的體形做衣服,做出來的肯定對你正合身,對別人就不一定合身了。cox回歸呢,就像是到商場去買衣服,衣服對很多人都合適,但是對每個人都不是正合適,只能說是大致合適。至於到底是選擇麻煩的方式量體裁衣,還是圖簡單到商場直接去買現成的,那就根據你的喜好了,也根據你對自己體形的了解程度,如果非常熟悉,當然就量體裁衣了。如果不大了解,那就直接去商場買大眾化衣服吧。

8、主成分回歸。主成分回歸是一種合成的方法,相當於主成分分析與線性回歸的合成。主要用於解決自變數之間存在高度相關的情況。這在現實中不算少見。比如你要分析的自變數中同時有血壓值和血糖值,這兩個指標可能有一定的相關性,如果同時放入模型,會影響模型的穩定,有時也會造成嚴重後果,比如結果跟實際嚴重不符。當然解決方法很多,最簡單的就是剔除掉其中一個,但如果你實在捨不得,畢竟這是辛辛苦苦調查上來的,刪了太可惜了。如果捨不得,那就可以考慮用主成分回歸,相當於把這兩個變數所包含的信息用一個變數來表示,這個變數我們稱它叫主成分,所以就叫主成分回歸。當然,用一個變數代替兩個變數,肯定不可能完全包含他們的信息,能包含80%或90%就不錯了。但有時候我們必須做出抉擇,你是要100%的信息,但是變數非常多的模型?還是要90%的信息,但是只有1個或2個變數的模型?打個比方,你要診斷感冒,是不是必須把所有跟感冒有關的症狀以及檢查結果都做完?還是簡單根據幾個症狀就大致判斷呢?我想根據幾個症狀大致能能確定90%是感冒了。不用非得100%的信息不是嗎?模型也是一樣,模型是用於實際的,不是空中樓閣。既然要用於實際,那就要做到簡單。對於一種疾病,如果30個指標能夠100%確診,而3個指標可以診斷80%,我想大家會選擇3個指標的模型。這就是主成分回歸存在的基礎,用幾個簡單的變數把多個指標的信息綜合一下,這樣幾個簡單的主成分可能就包含了原來很多自變數的大部分信息。這就是主成分回歸的原理。

9、嶺回歸。嶺回歸的名稱由來我也沒有查過,可能是因為它的圖形有點像嶺。不要糾結於名稱。嶺回歸也是用於處理自變數之間高度相關的情形。只是跟主成分回歸的具體估計方法不同。線性回歸的計算用的是最小二乘估計法,當自變數之間高度相關時,最小二乘回歸估計的參數估計值會不穩定,這時如果在公式里加點東西,讓它變得穩定,那就解決了這一問題了。嶺回歸就是這個思想,把最小二乘估計里加個k,改變它的估計值,使估計結果變穩定。至於k應該多大呢?可以根據嶺跡圖來判斷,估計這就是嶺回歸名稱的由來。你可以選非常多的k值,可以做出一個嶺跡圖,看看這個圖在取哪個值的時候變穩定了,那就確定k值了,然後整個參數估計不穩定的問題就解決了。

10、偏最小二乘回歸。偏最小二乘回歸也可以用於解決自變數之間高度相關的問題。但比主成分回歸和嶺回歸更好的一個優點是,偏最小二乘回歸可以用於例數很少的情形,甚至例數比自變數個數還少的情形。聽起來有點不可思議,不是說例數最好是自變數個數的10倍以上嗎?怎麼可能例數比自變數還少,這還怎麼計算?可惜的是,偏最小二乘回歸真的就有這么令人發指的優點。所以,如果你的自變數之間高度相關、例數又特別少、而自變數又很多(這么多無奈的毛病),那就現在不用發愁了,用偏最小二乘回歸就可以了。它的原理其實跟主成分回歸有點像,也是提取自變數的部分信息,損失一定的精度,但保證模型更符合實際。因此這種方法不是直接用因變數和自變數分析,而是用反映因變數和自變數部分信息的新的綜合變數來分析,所以它不需要例數一定比自變數多。偏最小二乘回歸還有一個很大的優點,那就是可以用於多個因變數的情形,普通的線性回歸都是只有一個因變數,而偏最小二乘回歸可用於多個因變數和多個自變數之間的分析。因為它的原理就是同時提取多個因變數和多個自變數的信息重新組成新的變數重新分析,所以多個因變數對它來說無所謂。

看了以上的講解,希望能對大家理解回歸分析的運用有些幫助。

以上是小編為大家分享的關於回歸分析的認識及簡單運用的相關內容,更多信息可以關注環球青藤分享更多干貨

④ 請問SPSS怎麼做線性回歸分析

回歸分析用於研究影響關系情況,實質上就是研究自變數X對因變數Y的影響關系情況。

具體可以使用在線spss平台SPSSAU進行分析,分析步驟如下:

1、上傳數據,選擇線性回歸

配合輸出智能文字分析,可以結合數據進行解讀。

⑤ 線性回歸分析和指數回歸分析有什麼區別,如何使用

線性回歸分析和指數回歸分析其實理論基礎是一樣的,基本沒有區別。回歸模型一個是直線,一個是指數曲線,簡單地說數據點畫出來象直線就用線性回歸。

相關系數與回歸系數的方向,即符號相同。回歸系數與相關系數的正負號都有兩變數離均差積之和的符號業決定,所以同一資料的b與其r的符號相同。回歸系數有單位,形式為(應變數單位/自變數單位)相關系數沒有單位。相關系數的范圍在-1~+1之間,而回歸系數沒有這種限制。

基本含義

在統計學中,線性回歸(Linear Regression)是利用稱為線性回歸方程的最小平方函數對一個或多個自變數和因變數之間關系進行建模的一種回歸分析。這種函數是一個或多個稱為回歸系數的模型參數的線性組合。只有一個自變數的情況稱為簡單回歸,大於一個自變數情況的叫做多元回歸。(這反過來又應當由多個相關的因變數預測的多元線性回歸區別,而不是一個單一的標量變數)。

⑥ 線性回歸分析的原理是什麼

摘要 你好親,久等了,很高興為您解答。

⑦ 線性回歸方程公式

簡單線性回歸方程,可以表示為下圖:

線性回歸方程是利用數理統計中的回歸分析,來確定兩種或兩種以上變數間相互依賴的定量關系的一種統計分析方法之一。線性回歸也是回歸分析中第一種經過嚴格研究並在實際應用中廣泛使用的類型。按自變數個數可分為一元線性回歸分析方程和多元線性回歸分析方程。


分析按照自變數和因變數之間的關系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個自變數和一個因變數,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。

如果回歸分析中包括兩個或兩個以上的自變數,且因變數和自變數之間是線性關系,則稱為多元線性回歸分析。

⑧ 多元線性回歸分析的基本假定包括什麼

多元線性回歸分析的基本假定包括:

1、零均值假定:假設隨機擾動項的期望或均值為零。

2、同方差和無自相關假定:假設隨機擾動項互不相關且方差相同。

3、隨機擾動項與解釋變數不相關假定:假設隨機擾動項與自變數的協方差為0。

4、無多重共線性:假設各解釋變數之間不存在線性相關關系。

5、正態性假定:假設隨機擾動項服從正態分布。

多元線性回歸模型的檢驗方法有:

1、判定系數檢驗。多元線性回歸模型判定系數的定義與一元線性回歸分析類似。判定系數R的計算公式為:R = R接近於1表明Y與X1,X2,…,Xk之間的線性關系程度密切;R接近於0表明Y與X1,X2,…,Xk之間的線性關系程度不密切。

2、回歸系數顯著性檢驗。在多元回歸分析中,回歸系數顯著性檢驗是檢驗模型中每個自變數與因變數之間的線性關系是否顯著。顯著性檢驗是通過計算各回歸系數的t檢驗值進行的。回歸系數的t檢驗值的計算公式為:=(j = 1,2,…,k),式中是回歸系數的標准差。

3、回歸方程的顯著性檢驗。回歸方程的顯著性檢驗是檢驗所有自變數作為一個整體與因變數之間是否有顯著的線性相關關系。顯著性檢驗是通過F檢驗進行的。F檢驗值的計算公式是:F(k,n-k-1)=多元回歸方程的顯著性檢驗與一元回歸方程類似,在此也不再贅述。

⑨ 回歸分析方法

§3.2 回歸分析方法
回歸分析方法,是研究要素之間具體的數量關系的一種強有力的工具,能夠建立反映地理要素之間具體的數量關系的數學模型,即回歸模型。
1. 一元線性回歸模型
1) 一元線性回歸模型的基本結構形式
假設有兩個地理要素(變數)x和y,x為自變數,y為因變數。則一元線性回歸模型的基本結構形式:

a和b為待定參數;α=1,2,…,n為各組觀測數據的下標; εa為隨機變數。如果記a^和b^ 分別為參數a與b的擬合值,則得到一元線性回歸模型

ÿ 是y 的估計值,亦稱回歸值。回歸直線——代表x與y之間相關關系的擬合直線

2) 參數a、b的最小二ÿ乘估計
參數a與b的擬合值:

,

建立一元線性回歸模型的過程,就是用變數 和 的實際觀測數據確定參數a和b的最小二乘估計值α^和β^ 的過程。
3) 一元線性回歸模型的顯著性檢驗
線性回歸方程的顯著性檢驗是藉助於F檢驗來完成的。
檢驗統計量F:

誤差平方和:

回歸平方和:

F≈F(1,n-2)。在顯著水平a下,若 ,則認為回歸方程效果在此水平下顯著;當 時,則認為方程效果不明顯。

[舉例說明]
例1:在表3.1.1中,將國內生產總值(x1)看作因變數y,將農業總產值(x2)看作自變數x,試建立它們之間的一元線性回歸模型並對其進行顯著性檢驗。
解:
(1) 回歸模型
將y和x的樣本數據代入參數a與b的擬合公式,計算得:

故,國內生產總值與農業總產值之間的回歸方程為

(2) 顯著性檢驗

在置信水平α=0.01下查F分布表得:F0.01(1,46)=7.22。由於F=4951.098 >> F0.01(1,46)=7.22,所以回歸方程(3.2.7)式在置信水平a=0.01下是顯著的。

2. 多元線性回歸模型
在多要素的地理系統中,多個(多於兩個)要素之間也存在著相關影響、相互關聯的情況。因此,多元地理回歸模型更帶有普遍性的意義。
1) 多元線性回歸模型的建立
(1) 多元線性回歸模型的結構形式
假設某一因變數y受k 個自變數 的影響,其n組觀測值為 。則多元線性回歸模型的結構形式:

為待定參數, 為隨機變數。如果 分別為 的擬合值,則回歸方程為

b0為常數, 稱為偏回歸系數。
偏回歸系數 ——當其它自變數都固定時,自變數 每變化一個單位而使因變數xi平均改變的數值。

(2) 求解偏回歸系數

,

2) 多元線性回歸模型的顯著性檢驗
用F檢驗法。
F統計量:

當統計量F計算出來之後,就可以查F分布表對模型進行顯著性檢驗。
[舉例說明]
例2:某地區各城市的公共交通營運總額(y)與城市人口總數(x1 )以及工農業總產值(x2)的年平均統計數據如表3.2.1(點擊展開顯示該表)所示。試建立y與x1及x2之間的線性回歸模型並對其進行顯著性檢驗。

表3.2.1 某地區城市公共交通營運額、人口數及工農業總產值的年平均數據

城市序號

公共交通營運額y/103人公里 人口數x1/103人 工農業總產值x2
/107元
1 6825.99 1298.00 437.26
2 512.00 119.80 1286.48
... ... ... ...
14 192.00 12.47 1072.27
註:本表數據詳見書本P54。
解:
(1) 計算線性回歸模型
由表3.2.1中的數據,有

計算可得:

故y與x1 及y2之間的線性回歸方程

(2) 顯著性檢驗

故:

在置信水平a=0.01下查F分布表知:F0.01(2,11)=7.21。由於F=38.722> F0.01(2,11)=7.21,所以在置信水平a=0.01下,回歸方程式是顯著的。

3. 非線性回歸模型的建立方法
1) 非線性關系的線性化
(1) 非線性關系模型的線性化
對於要素之間的非線性關系通過變數替換就可以將原來的非線性關系轉化為新變數下的線性關系。
[幾種非線性關系模型的線性化]

① 於指數曲線 ,令 , ,將其轉化為直線形式:
,其中, ;
② 對於對數曲線 ,令 , ,將其轉化為直線形式:

③ 對於冪函數曲線 ,令 , ,將其轉化為直線形式:
,其中,
④ 對於雙曲線 ,令 ,將其轉化為直線形式:

⑤ 對於S型曲線 ,將其轉化為直線形式:


⑥ 對於冪函數乘積:

令 將其轉化為直線形式:

其中, ;
⑦ 對於對數函數和:

令 ,將其化為線性形式:

(2) 建立非線性回歸模型的一般方法
① 通過適當的變數替換將非線性關系線性化;
② 用線性回歸分析方法建立新變數下的線性回歸模型:
③ 通過新變數之間的線性相關關系反映原來變數之間的非線性相關關系。
3) 非線性回歸模型建立的實例

非線性回歸模型建立的實例

景觀是地理學的重要研究內容之一。有關研究表明(Li,2000;徐建華等,2001),任何一種景觀類型的斑塊,其面積(Area)與周長(Perimeter)之間的數量關系可以用雙對數曲線來描述,即

例3:表3.2.2給出了某地區林地景觀斑塊面積(Area)與周長(Perimeter)的數據。試建立林地景觀斑塊面積A與周長P之間的雙對數相關關系模型。

表3.2.2某地區各個林地景觀斑塊面積(m2)與周長(m)

序號 面積A 周長P 序號 面積A 周長P
1 10447.370 625.392 42 232844.300 4282.043
2 15974.730 612.286 43 4054.660 289.307
... ... ... ... ... ...
41 1608.625 225.842 82 564370.800 12212.410

註:本表數據詳見書本57和58頁。

解:因為林地景觀斑塊面積(A)與周長(P)之間的數量關系是雙對數曲線形式,即

所以對表3.2.2中的原始數據進行對數變換,變換後得到的各新變數對應的觀測數據如表3.2.3所示。

⑩ 線性回歸方程公式是什麼

線性回歸方程公式:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)。線性回歸方程是利用數理統計中的回歸分析,來確定兩種或兩種以上變數間相互依賴的定量關系的一種統計分析方法之一。


線性回歸方程公式求法:


第一:用所給樣本求出兩個相關變數的(算術)平均值:


x_=(x1+x2+x3+...+xn)/n


y_=(y1+y2+y3+...+yn)/n


第二:分別計算分子和分母:(兩個公式任選其一)


分子=(x1y1+x2y2+x3y3+...+xnyn)-nx_Y_


分母=(x1^2+x2^2+x3^2+...+xn^2)-n*x_^2


第三:計算b:b=分子/分母


用最小二乘法估計參數b,設服從正態分布,分別求對a、b的偏導數並令它們等於零,得方程組解為


其中,且為觀測值的樣本方差.線性方程稱為關於的線性回歸方程,稱為回歸系數,對應的直線稱為回歸直線.順便指出,將來還需用到,其中為觀測值的樣本方差。


先求x,y的平均值X,Y


再用公式代入求解:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)


後把x,y的平均數X,Y代入a=Y-bX


求出a並代入總的公式y=bx+a得到線性回歸方程


(X為xi的平均數,Y為yi的平均數)



應用


線性回歸方程是回歸分析中第一種經過嚴格研究並在實際應用中廣泛使用的類型。這是因為線性依賴於其未知參數的模型比非線性依賴於其位置參數的模型更容易擬合,而且產生的估計的統計特性也更容易確定。


線性回歸有很多實際用途。分為以下兩大類:


如果目標是預測或者映射,線性回歸可以用來對觀測數據集的和X的值擬合出一個預測模型。當完成這樣一個模型以後,對於一個新增的X值,在沒有給定與它相配對的y的情況下,可以用這個擬合過的模型預測出一個y值。


給定一個變數y和一些變數X1,...,Xp,這些變數有可能與y相關,線性回歸分析可以用來量化y與Xj之間相關性的強度,評估出與y不相關的Xj,並識別出哪些Xj的子集包含了關於y的冗餘信息。


以上內容參考網路-線性回歸方程

閱讀全文

與線性回歸模型分析方法相關的資料

熱點內容
生態科學研究方法 瀏覽:234
種植石斛的方法視頻 瀏覽:369
解決孩子背課文難的10種方法 瀏覽:268
車里起霧的正確方法 瀏覽:279
夢中情人使用方法 瀏覽:538
蛋雞養殖場老鼠的最佳處理方法 瀏覽:7
電子經緯儀測量方法 瀏覽:162
治療駝背的方法圖 瀏覽:69
火龍果種植創意小盆栽管理方法 瀏覽:168
什麼叫學習方法 瀏覽:664
可以用相同的方法來解決 瀏覽:32
紫銅銅焊接方法視頻 瀏覽:999
蘋果手機沒插卡進系統方法 瀏覽:695
抓魚雷最簡單方法 瀏覽:291
天然南紅掛墜真假鑒別方法 瀏覽:353
兩個路由器不用手機連接的方法 瀏覽:655
蓋被子用什麼方法好 瀏覽:606
電腦車調節器使用方法 瀏覽:810
第三橫突綜合征鍛煉方法 瀏覽:898
狗子宮脫落治療方法 瀏覽:86