導航:首頁 > 研究方法 > 逐步判別是判別分析方法嗎

逐步判別是判別分析方法嗎

發布時間:2022-06-26 04:58:23

什麼是逐步判別分析

逐步判別法:按照所指定的納入/排除標准,依次引入和剔除變數,直到方程穩定為止。該方法實質和多元回歸分析中的逐步法等價。

⑵ 數據統計分析

判別分析又稱「分辨法」,是在分類確定的條件下,根據某一研究對象的各種特徵值判別其類型歸屬問題的一種多變數統計分析方法
其基本原理是按照一定的判別准則,建立一個或多個判別函數,用研究對象的大量資料確定判別函數中的待定系數,並計算判別指標。據此即可確定某一樣本屬於何類。
當得到一個新的樣品數據,要確定該樣品屬於已知類型中哪一類,這類問題屬於判別分析問題。
分類:根據判別中的組數,可以分為兩組判別分析和多組判別分析;
根據判別函數的形式,可以分為線性判別和非線性判別;
根據判別式處理變數的方法不同,可以分為逐步判別、序貫判別等;
根據判別標准不同,可以分為距離判別、Fisher判別、Bayes判別法等

⑶ 判別分析的應用

在氣候分類、農業區劃、土地類型劃分中有著廣泛的應用。
在市場調研中,一般根據事先確定的因變數(例如產品的主要用戶、普通用戶和非用戶、自有房屋或租賃、電視觀眾和非電視觀眾)找出相應處理的區別特性。在判別分析中,因變數為類別數據,有多少類別就有多少類別處理組;自變數通常為可度量數據。通過判別分析,可以建立能夠最大限度的區分因變數類別的函數,考查自變數的組間差異是否顯著,判斷那些自變數對組間差異貢獻最大,評估分類的程度,根據自變數的值將樣本歸類。
應用范圍
1)信息丟失
2)直接的信息得不到
3)預報
4)破壞性實驗
假設條件
1)分組類型在兩種以上,且組間樣本在判別值上差別明顯。
2)組內樣本數不得少於兩個,並且樣本數量比變數起碼多兩個。
3)所確定的判別變數不能是其他判別變數的線性組合。
4)各組樣本的協方差矩陣相等。
5)各判別變數之間具有多元正態分布。
6)樣品量應在所使用的自變數個數的10~20倍以上時,建立的判別函數才比較穩定;而自變數個數在8~10之間時,函數的判別效果才能比較理想。當然,在實際工作中判別函數的自變數個數往往會超過10個,但應該注意的是,自變數的個數多並不代表效果好
spss操作:「分析」~「分類」~「判別」~進入判別分析主對話框。
這里有容易引起歧義的二個變數,最上面的為分組變數。對分組變數的了解需要聯系判別分析的原理以及適用范圍。因為判別分析是已知分類數目的情況下,進行分析,這個已知的分類數目就是這個分組變數。其實,一般分析步驟中,都是先進行聚類分析,聚類之後得到的分類結果就是這個分組變數,然後再選擇這個分組變數,進行分析。也就是,聚類分析是母親,母親的孩子就是判別分析。得到的判別函數就是預測想要知道的個案究竟屬於哪一類。另一個變數就是選擇變數,它位於主對話框的最下面。這個選擇變數在回歸分析相應的對話框中也有,意思就是選擇你需要的變數,這個變數可以為數據窗口的一個整個變數,也可以利用子設置「值」進行選擇,所以,它的名字叫做選擇變數。
「統計量」子對話框:「描述性」欄,包括「均值」「單變數ANOVA」「BoxsM」
需要特別說明,以後只要見到ANOVA這個單詞,它的意思就是方差分析,也就是進一步輸出方差分析表,其中最重要的就是P值也就是Sig值。
BoxsM復選框:指的是輸出對組協方差矩陣的等同性檢驗的檢驗結果。也就是對各類協方差矩陣相等的假設進行檢驗。
「函數系數」欄:其實就是將判別函數系數進行設置。包括「費雪」和「未標准化」。費雪指的是對每一類給出一組系數,並且給出該組中判別分數最大的觀測量。
「矩陣」欄:都是復選框,對應相應的矩陣也就是在結果表中的四種數陣。「組內相關」「組內協方差」「分組協方差」「總體協方差」這個都是計算機自動計算,人工計算是不可能完成的任務。
「分類」子對話框:本文也提到過先驗概率,先驗概率就是已知一部分信息,來了解未知信息也就是後驗概率。
「所有組相等」也就是如果分為幾類,這所有的類中的先驗概率都相等。
「根據組大小計算」各類先驗概率按照和各類樣本量呈正比。
「使用協方差矩陣」欄:是二個單選框。「在組內」指使用合並組內協方差矩陣進行分析
「分組」指使用各組協方差矩陣進行分析。
「輸出」欄~「個案結果」:對每一個觀測量輸出判別分數,也就是選定變數的個案的分進哪個組的資格得分。實際類,預測類,也就是根據判別得分計算的古今對比。實際類就是目前實際上分為幾類,預測類就是過去對未來預測,它們一對比,就可以知道過去和現在差別在哪裡。附屬選項「將個案限制在」在後面的小矩形框中輸入觀測量數,含義為僅輸出設置的觀測量結果,當個案也就是觀測量太多,可以用此法。
「摘要表」輸出分類小結,給出正確和錯分的觀測量數,和錯判率。
「不考慮該個案時的分類」這個根據字面就可以理解,不贅述。
「圖」欄:「合並組」生成一張包括各類的散點圖,該散點圖根據前兩個判別函數得到,如果只有一個判別函數,則生成直方圖。
「分組」復選框:有幾類就有幾張散點圖,和上面一樣,如果只有一個判別函數,就生成直方圖。
「區域圖」復選框:將觀測量分到各組中去的區域圖。此圖將一張圖的平面劃分出類數,相同的區域,每一類占據一個區,各類的均值在各區中用星號標出,如果僅有一個判別函數,即沒有此圖。
「保存」子對話框:這個設置是非常重要的,並且特別直觀,只要選擇,就可以在數據窗口生成相應的新變數。這個新變數分別是:「預測組成員」這個預測組成員是根據判別分數,以及後驗概率最大的預測分類。也就是,每個個案的預測分類。
「判別得分」這個根據名字就可以理解。該分數=沒有標准化的判別系數×自變數的值+一個常數。每次運行判別過程都給出一組表明判別分數的新變數。有幾個判別函數就建立幾個判別函數減1的新變數。新變數名稱詞頭為dis-。
舉例:1 醫學實踐中根據各種化驗結果,疾病症狀等判斷病人患有什麼疾病。
2 體育人才選拔根據運動員的體形,運動成績,生理指標,心理素質指標判斷是否繼續培養。
3 動植物分類
判別分析最主要的分析目的:得到判別函數,對未知個案進行預測分類。
「組成員概率」表示觀測量屬於哪一類的概率,有幾類,就給出幾類概率值,新變數默認名為dis預測分類數-判別概率,例如有三類,二個判別函數,則新變數名稱可以為dis1-1,dis2-1,dis3-1,dis3-2以此類推。
逐步判別分析:只要在主對話框中選擇「使用步進式方法」,就可以篩選變數,同時,方法對話框將激活。
「方法」對話框中「標准」欄的設置和線性回歸的一樣,不贅述。
「方法」欄:原則就是,負面指標越小越好,正面指標越大越好。負面指標是wilks lambda和未解釋方差,正面指標是馬氏距離,最小F值,Raos V。馬氏距離在回歸中越大代表這個個案為影響點可能越大,也就是,只有這個個案為影響點,它越重要,越對判別函數影響越大,把它挑出來,也就是馬氏距離最大。
結果:1 sig值小於0.05,說明可以繼續分析,函數具有判別作用,也就是有統計學意義。
2 數據窗口對話框,將在「保存」子對話框設置的新變數和在主對話框的分組變數進行對比,每個個案被分到哪類,以及判別得分,都一目瞭然。
3 根據輸出表中的系數,可以寫出判別函數,進行以後的預測。

⑷ stepwise discriminant analysis是什麼意思

stepwise discriminant analysis
逐步判別分析;逐步監別分析;逐步區別分析
例句篩選
1.
The Application of Classified Diagnosis on Apoplexy Using StepwiseDiscriminant Analysis with Nonparametric Method
非參數逐步判別分析在腦中風分類診斷中的應用

2.
Stepwise Discriminant Analysis Used for Discriminant Sediment Source of the South of the Yellow Sea
南黃海表層沉積物物質來源的逐步判別分析

⑸ 含油氣性評價數學模型

一般使用聚類分析等綜合評判和專家系統對一個圈閉乃至一個區域的含油氣性進行評價。

6.2.1 聚類分析

聚類分析又稱群分析,簇分析。聚類分析的方法較多,主要是根據一批研究對象(樣品或變數)在性質、特徵、數量等方面的相似程度進行分類。油氣資源評價中聚類分析通常思路是:選擇部分勘探和研究程度高、含油氣性已明確的圈閉、區塊、盆地(包括含油氣的和不含油氣的)等作為標型單元,與勘探和研究程度相對較低,含油氣性不確定的評價對象一起,依據這些樣品(標型單元和評價對象)的多個變數指標(包括性質、特徵等)應用多種方法確定距離系數或相似系數,然後編制分類譜系圖,直觀顯示樣品間相似程度,最後在不同相似性尺度上進行粗細不等的分類。

距離系數確定如下:對於幾個樣品,若我們選定m個變數指標進行分析,則可以把每個樣品看成是m維空間上由其m個變數指標確定的一個點。兩兩樣品(即點)之間的距離可由下式(即Minkowski距離公式)計算:

油氣資源評價方法與實踐

式中q為1時稱為絕對(值)距離,為2時稱為歐幾里得距離。研究中通常應用歐幾里得距離。

上述距離確定方法中存在兩個問題:①距離與各變數的量綱有關,也就是說與變數的數值大小(量綱變化,數值會相應變化)有關,解決此難題的一個辦法即是數據標准化,如標准差標准化、極差標准化、極差正規化等;②在計算距離時沒考慮變數之間的相關性,解決這一問題的辦法主要是要對變數進行分析,篩選主要變數,剔除次要變數和非獨立變數。

表6-1 資源評價方法分類及其主要方法適用范圍列表

相似系數通常指夾角餘弦和相似系數。

夾角餘弦定義:若把每個樣品看成m維變數空間中的一個向量,那麼樣品i和樣品j之間的相似性就可用兩個向量間夾角餘弦cosθij來表示,其計算公式為

油氣資源評價方法與實踐

相似系數定義:它是經過標准化後的夾角餘弦,一般用rij表示,計算公式為

油氣資源評價方法與實踐

圖6-1即是夾角餘弦繪制的聚類分析譜系圖,可見,該圖非常明確地顯示了17個樣品間相似程度,當我們以cosθ=-0.2為劃分界線時,可將17個樣品分為2個組,但以cosθ=0為劃分界線時,則分為3個組,若以cosθ=0.4為劃分界線則又分為5個組,以此類推。

圖6-1 聚類分析譜系圖

6.2.2 判別分析

油氣資源評價中,常常會遇到判斷某個目標(如圈閉、區塊、盆地)是否含油的問題,這就可用判別分析,即由一組已知樣品,建立樣品含油氣性(或其他性質)與地質變數間的定量關系,即建立判別方程,並確定出類型歸屬的界線值。然後對於一個新樣品(即未知樣品,通常是評價目標),用該判別方程計算出判別值,再把此判別值與界線值比較,從而確定新樣品的類型歸屬。

判別分析通常分為兩組判別、多組判別和逐步判別。

兩組判別分析是指把樣品歸類為兩種,如一個勘探目標(如圈閉、區塊)要麼含油,要麼不含油。當然,對於地質目標而言,用某個單項指標(即單一變數)進行判斷是比較困難的,故一般都用多項指標(即多個變數)建立判別方程。為簡化問題,判別方程一般是用線性方程,對於每個樣品,當用m個可供判別分類的變數建立線性判別方程時,一般採用待定系數法。即設線性判別方程為

油氣資源評價方法與實踐

式中c1,c2,…,cm為待定系數。應用n個樣品(其中n1個為1類,n2個為2類)的m個變數的觀測值,按照兩類樣品間差別最大,而同類樣品間差別最小的原則,通過解偏微分方程等一系列演算法求取待定系數。

所謂多組判別就是指樣品歸屬的類型多於兩個,如某一勘探目標可能是大型油田,也可能是中型油田,也可能是小型油田甚至還可能不含油。多組判別方程建立的方法與兩組判別方程建立方法相同,只是兩組判別只一個判別函數,把空間分成兩個域;三組判別有3個判別函數,把空間分成3個域;而4組判別需要6個判別函數,以此類推。因此,對於多組判別分析,計算組間的判別函數很不方便。

逐步判別就是對變數按其對判別分類的重要性,在計算過程中有進有出,保留那些對判別類型起主要作用的變數,剔除那些不起作用或作用不大的變數。

6.2.3 特徵分析

在油氣資源評價中,特徵分析是通過已知圈閉、區塊或盆地(統稱為標型區)含油氣性評價的主要控油地質變數,經最優化模型計算後,確定各地質變數的權系數,建立關聯值計算公式,作為各地質變數具有的綜合特徵,依此進行未知盆地、區塊、圈閉(統稱為評價區)含油性評價。因此,特徵分析更能反映事物的本質。特徵分析法的基本思路是:通過標型區建立最優模型公式,並計算標型區和評價區的關聯值,然後用下式計算標型區與評價區的相對偏差,即:

油氣資源評價方法與實踐

並定義為:|相對偏差|≤0.2,完全相似,地質類比系數為1;|相對偏差|=0.2~0.4,比較相似,地質類比系數為1.2或0.8;|相對偏差|=0.4~0.6,基本相似,地質類比系數1.4或0.6;|相對偏差|>0.6,基本不相似,不能類比。

特徵分析法一般評價步驟是:

(1)依據各項地質變數含油氣性判別的准則,確定評價的閾限值,將各項地質參數轉換成1、0、-1三元邏輯表達式。

(2)用乘積矩陣的平方和法、主分量法及匹配概率矩陣主分量法等對標型區進行最優化模型特徵的定量化,確立各項地質變數的權系數,建立關聯值計算公式:

油氣資源評價方法與實踐

式中:y為關聯值,

xi項地質變數的三元邏輯值,

ai為xi的權系數。

(3)計算標型區與待判區的關聯值,並進行類比,確定未知盆地、區塊、圈閉的含油氣性。類比准則是:凡與已知油氣田(區塊、盆地)關聯值可比的列入Ⅰ級含油氣圈閉(區塊、盆地),與已知含油氣圈閉(區塊、盆地)關聯值可比的列入Ⅱ級含油氣圈閉(區塊、盆地);關聯值介於含油與非含油圈閉(區塊、盆地)之間的,列入Ⅲ級含油氣圈閉(區塊、盆地);關聯值在非含油氣圈閉(區塊、盆地)范圍內的,則圈閉(區塊、盆地)不含油氣。

6.2.4 邏輯信息法

邏輯信息法屬於「數量化」理論的范疇,是數理邏輯、組合分析及數理統計為基礎的綜合評價方法。主要是通過已知不同級別含油氣性的圈閉(如已知油氣田、含油氣圈閉、有油氣顯示圈閉和干圈閉),按一定序列建立圈閉含油氣性評價的變異序列,以此作為評價模型。依據「位移帕斯卡三角形」,求得各地質參數的相對標志權,挑選評價的主要地質變數,計算各地質變數的標志信息權、標志分權及各圈閉的對象權,然後與已知圈閉對象權分布范圍進行比較,作出圈閉含油氣性評價。具體步驟如下:

(1)選擇已知圈閉為標型,對各控油地質變數進行0,1二態變數轉換,構成m組變異序列。

(2)依據「位移帕斯卡三角形」計算各地質變數取值為1的相對標志權Pk*(1)及取值為0的相對標志權Pk*(0)(k為地質變數,k=1,2,…,p),然後將m個變異序列中相同級別的圈閉進行相互調換,分別計算各地質變數的Pk*(1)、Pk*(0)。若在所有變異序列中幾乎都是Pk*(1)≥-Pk*(O)或Pk*(0)≥Pk*(1),則地質變數k與圈閉含油性關系密切,挑選該項變數,反之則剔除。

(3)對已選地質變數,劃分最小區分標志組合,計算各標志信息權Pk:Pk=包含k標志的最小區分標志組合數/總的最小區分標志組合數信息權愈大,反映該標志對圈閉含油氣性評價意義愈大。

(4)依據各地質變數相對標志權及信息權計算標志分權及標志分權的絕對差。標志分權Pk(1)及Pk(0)按下式求得

Pk(1)=Pk(1)·Pk Pk(0)=Pk(0)·Pk

標志分權的絕對差Rk=|Pk(1)-Pk(0)|

若Pk(1)>Pk(0),則將分權差Rk賦予1,而將0值賦予0;

若Pk(1)<Pk(0),則將分權差Rk賦予0,而將0值賦予1。

(5)據各圈閉每個標志的取值,應用下式求得各圈閉對象權:

油氣資源評價方法與實踐

式中:Ii為對象權(i=1,2,…,m)

Rk(1,0):據第i個圈閉k標志的取值(0或1)而賦予Rk(0)或Rk(1)(k=1,…,n)。

(6)將各圈閉對象權與標型圈閉的對象權分布范圍進行類比,按其相應范圍,評價圈閉含油氣性。

6.2.5 油氣資源評價專家系統

油氣資源評價經歷了幾十年的發展,而今已形成了以統計學為基礎的綜合評價系統和以數字模擬為基礎的盆地模擬系統,但此二系統適用范圍局限,當定量資料欠缺時無法評價或評價結果可靠性很低,為充分利用各種定量和定性資料,必須引入專家系統技術。

所謂專家系統即是應用專家知識,按照專家思路解決某一特定范圍內的專業問題,得出與專家分析類似的結論的計算機軟體系統。

在我國,油氣資源評價專家系統的研製還是近十幾年的事,已研製的較成熟油氣資源評價專家系統有兩個:一個是海洋石油勘探開發研究中心與吉林大學「七五」期間合作研製的油氣資源評價專家系統(Petroleum Resources Evaluation System,簡稱PRES),包括6個推理及程序模塊、9個知識庫和3個資料庫,可在PC機和VAX11/78O機上運行,對凹陷與圈閉進行資源評價。另一個是地礦部石油地質研究所等多家合作研製的油氣資源評價專家系統,其評價對象主要是圈閉,但也可對凹陷進行評價。

嚴格地講,不管國內還是國外,目前油氣資源評價專家系統尚屬發展趨向,處在開發試驗階段,成功者很少,上述二系統即是成功者之一。自1994年下半年以來,地礦部研製的油氣資源評價專家系統分別在東海陸架盆地西湖凹陷、松遼盆地南部地區、四川盆地川東北地區、鄂爾多斯盆地伊陝斜坡、南沙海域萬安盆地進行了推廣應用,特別是在新星公司圈閉管理中得到了廣泛應用,取到了令人滿意的結果,系統的先進性、科學性和合理性正越來越得到專家們的承認。下面即對該專家系統進行介紹。

6.2.5.1 油氣資源評價專家系統簡介

油氣資源評價專家系統由知識庫、知識庫維護模塊、綜合資料庫、推理機、解釋模塊組成(圖6-2)。其中知識庫、推理機和解釋模塊是核心,實現評價模型的具體演算法。

圖6-2 專家系統結構示意圖

知識庫主要是規則庫。規則庫之基本構件是節點(地質事實)和邊(地質事實間相互關系),邊依產生式原則和框架式結構將節點連接起來,邊與邊之間的關系或用特性表示,或用「與」、「或」、「異或」、「加權」、「新與」和「獨立」六種關系表示,並加上邊信度(即規則信度),形成有機的網路,其中最底層節點沒有前提,叫葉節點;頂層節點沒有結論,叫根節點;其餘叫中間節點(如圖6-3所示)。該專家系統就是以此網路實現評價模型的。建立評價模型,構造知識庫特別是規則庫,是建立專家系統的中心任務,也是難點所在,即所謂「瓶頸」問題。由於各地區氣藏成藏模式不同,故知識庫採取模塊化結構,推理時,根據具體研究區實際成藏模式,調入相應的模塊生成一個適合本區的臨時知識庫,以提高推理效率。現在系統已依據松遼盆地南部東南隆起區泉頭組—登樓庫組、東海陸架盆地西湖凹陷平湖組—花港組、鄂爾多斯盆地伊陝斜坡奧陶系頂部風化殼、四川盆地川東北地區二疊系—中三疊統和川西坳陷上三疊統5種不同的成藏模式「調入生成」了相應含油氣性評價的臨時知識庫。

圖6-3 節點關系示意圖

該專家系統推理機推理為不確定推理,推理方式主要為向前推理,類似人類專家思維那樣,依據葉節點或中間節點(前提)按一定規則推理、判斷另一些中間節點或根節點(結論)成立的可能性,其實質是進行大量的信度運算,以此實現評價過程。該系統的解釋模塊以人機會話方式,在推理的一些重要環節允許用戶詢問並向用戶解答諸如「本中間結論是怎樣得到的?」、「為什麼需要在這里提供信息?」等問題,增加了推理透明度,使用戶能更好地參與推理。

6.2.5.2 評價模型在專家系統里的實現

6.2.5.2.1 規則庫建立

按產生式規則和框架式結構,應用特性表和「與」、「或」、「異或」、「加權」、「新與」、「獨立」6種關系將具體研究區利用典型油氣藏解剖、油氣藏形成模式及控制因素分析、油氣成藏條件及油氣藏分布規律研究等成果而建立的評價模型中各種規則有機連接起來,並輸入專家系統知識庫內,即建成一個規則庫。在規則庫建立中,採取了模塊化結構,分為總模塊、含油氣標志子模塊、油氣源條件子模塊、儲集條件子模塊、圈閉條件子模塊、聚集條件子模塊和保存條件子模塊共7個模塊,各模塊結構如圖6-4~6-10所示。

6.2.5.2.2 推理方式及6種推理演算法

專家系統評價的實質就是根據規則庫里一系列規則及其相互關系(即評價模型)進行推理。本專家系統主要推理方式是不確定推理,即結論信度可在(-1,1)范圍內連續取值,符合地質現象間關系復雜,多為不確定性的這一特點。按照推理方向以向前推理為主,輔以反向推理的設計思路,系統選用了大量的計算方法模型,其中主要的是推理演算法,以下僅就6種邏輯關系的推理演算法作一簡介:

圖6-4 總模塊結構圖

圖6-5A 含油氣標志子模塊結構圖

圖6-5B 含油氣標志子模塊結構圖

(1)只有一個前提的情形

若H是結論,E是前提,並假定E的信度cf(E)和從E到H的邊信度a,b已知,則:

圖6-5C 含油氣標志子模塊結構圖

1)若cf(E)>0,則cf(H)=a·cf(E);

2)若cf(E)<0,則cf(H)=b·cf(E)。

由於a,b取值都可在[-1,1]之間變化,因此可以反映E對H的多種影響,例如E是H的充分條件(a=1,b=0),必要條件(a=0,b=1),充要條件(a=b=1)等等。

(2)具有多個前提的情形

設H是結論,且,E1,E2,…,En是前提,cfi(H)表示由單一前提Ei所求出的H的信度,i=1,2,…,n,則H的最終信度cf(H)計算方法如下:

1)若諸Ei之間的關系為「與」,則令

油氣資源評價方法與實踐

2)若諸Ei之間的關系為「或」,則令

油氣資源評價方法與實踐

3)若諸Ei之間的關系為「加權」,則令

油氣資源評價方法與實踐

圖6-6 油氣源條件子模塊結構圖

諸Wi是權值。在特殊情形下,規定cf(H)》ΣWi·cfi(H),以表示「突變」關系。

4)若諸Ei之間的關系為「異或」,則諸Ei中必定只有且恰有一個滿足cf(H)>t>0(t是閾值),因此,可令

油氣資源評價方法與實踐

圖6-7A 儲集條件子模塊結構圖

圖6-7B 儲集條件子模塊結構圖

圖6-8 圈閉條件子模塊結構圖

5)若諸Ei之間的關系為「獨立」,為了簡單起見,先設n=2,則令

油氣資源評價方法與實踐

當n>2時,先將同號的諸cfi(H)分別按上式合並,再求其代數和得到cf(H)。

6)若諸Ei之間的關系是「新與」,且Ei為主要節點(起決定性作用),則令:

油氣資源評價方法與實踐

圖6-9 聚集條件子模塊結構圖

如果一個結論H的諸前提E1,E2,…,En之間存在著多種關系,則通過設置運算節點(虛節點)來反映各種關系之間的優先順序。

如果對信度計算有特定要求,例如需經查表、計算(調用子程序)、類比或詢問來確定結論H的信度值,則知識庫中標明之。另外,對於邊信度可能需要修改的情形,某個前提可以單獨肯定或否定結論的情形等,也在規則庫中註明,以便通過有關元知識及時處理。

圖6-10A 保存條件子模塊結構圖

6.2.5.2.3 解釋功能

當系統推出某個重要中間結果時,系統顯示這一結論並暫停推理,等待用戶提問並予以回答;另一方面,當推理到某一步時,系統需要用戶提供某種信息,也允許用戶在輸入信息前詢問並進行回答,然後等候用戶輸入此信息;最後,系統還能通過列表方式顯示最終結論或中間結論是如何推得的。

圖6-10B 保存條件子模塊結構圖

⑹ 求統計分析方面的演算法

判別分析通常都要建立一個判別函數,然後利用次判別函數來進行判別。為了建立判別函數就必須有一個訓練樣本。判別分析的任務就是向這份樣本學習,學判斷類別的規則,並非多方考核。訓練樣本的質量與數量至關重要。每一個體所屬類別必須用「金標准」予以確認;解釋變數X1,X2,...XP必須確實與分類有關;個體的觀察值必須准確;個體的數目必須足夠多.
.逐步判別分析 建立在Bayes判別分析基礎上,它像逐步回歸分析一樣,可以在眾多指標中挑選一些有顯著作用的指標來建立一個判別函數,使方程內的指標都有顯著地判別作用而方程外的指標作用都不顯著。

從逐步回歸分析中我們已經知道,回歸方程中的自變數並非越多越好。作用不大的變數進入方程中不但無益,反而有害。在判別分析中也有類似情況,解釋變數並非越多越好。解釋變數的特異性越強,判別能力越強,這類解釋變數當然越多越好;相反,那些判別能力不強的解釋變數如果引入分類函數,同樣也是有益無害的,不但增加了搜集數據和處理數據的工作量,而且還可能削弱判別效果。因此我們希望在建立分類函數時既不要遺漏有顯著判別能力的變數,也不要引入不必要的判別能力很弱的變數。
逐步判別分析是達到上述目標的重要方法。它象逐步回歸分析一樣,可以在很多候選變數中挑選一些有重要作用的變數來建立分類函數,使方程內的變數都較重要而方程外的變數都不甚重要。分類函數內的變數是否有重要作用可用F檢驗,檢驗的零假設是:該變數對判別的貢獻為零。若P值較小便拒絕零假設,認為該變數的貢獻具有統計學意義。
要求要用C語言嗎?

⑺ 判別分析的基本思想

根據判別中的組數,可以分為兩組判別分析和多組判別分析;
根據判別函數的形式,可以分為線性判別和非線性判別;
根據判別式處理變數的方法不同,可以分為逐步判別、序貫判別等;
根據判別標准不同,可以分為距離判別、Fisher判別、Bayes判別法等。

⑻ 判別分析法用邏輯判斷,屬於定型分析是對還是錯

判別分析又稱「分辨法」,是在分類確定的條件下,根據某一研究對象的各種特徵值判別其類型歸屬問題的一種多變數統計分析方法。
其基本原理是按照一定的判別准則,建立一個或多個判別函數,用研究對象的大量資料確定判別函數中的待定系數,並計算判別指標。據此即可確定某一樣本屬於何類。
當得到一個新的樣品數據,要確定該樣品屬於已知類型中哪一類,這類問題屬於判別分析問題。

閱讀全文

與逐步判別是判別分析方法嗎相關的資料

熱點內容
廁所臭怎麼辦最有效方法 瀏覽:421
檢測m1和m3基因簇的檢測方法 瀏覽:601
720除45的簡便運算方法 瀏覽:575
如何用化學方法鑒別松節油甲苯 瀏覽:604
如何支持地方法人銀行補充資本 瀏覽:763
公園跑步鍛煉方法 瀏覽:133
軟體技術可行性分析的方法 瀏覽:528
常用化學固液分離方法 瀏覽:989
員工福利工資計算方法 瀏覽:959
小黑板三腳架安裝方法 瀏覽:707
草木灰的正確使用方法 瀏覽:598
手指鍛煉正確方法 瀏覽:933
念珠菌的治療方法女 瀏覽:394
日本藝妓面膜使用方法 瀏覽:118
滑行盤使用方法視頻教學 瀏覽:943
產婦出虛汗用什麼方法治療 瀏覽:617
賓士電機異響解決方法 瀏覽:675
屬於幼兒教育的什麼方法 瀏覽:481
快速進入主頁方法 瀏覽:909
孩子有什麼方法驅邪 瀏覽:701