导航:首页 > 研究方法 > 逐步判别是判别分析方法吗

逐步判别是判别分析方法吗

发布时间:2022-06-26 04:58:23

什么是逐步判别分析

逐步判别法:按照所指定的纳入/排除标准,依次引入和剔除变量,直到方程稳定为止。该方法实质和多元回归分析中的逐步法等价。

⑵ 数据统计分析

判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法
其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。据此即可确定某一样本属于何类。
当得到一个新的样品数据,要确定该样品属于已知类型中哪一类,这类问题属于判别分析问题。
分类:根据判别中的组数,可以分为两组判别分析和多组判别分析;
根据判别函数的形式,可以分为线性判别和非线性判别;
根据判别式处理变量的方法不同,可以分为逐步判别、序贯判别等;
根据判别标准不同,可以分为距离判别、Fisher判别、Bayes判别法等

⑶ 判别分析的应用

在气候分类、农业区划、土地类型划分中有着广泛的应用。
在市场调研中,一般根据事先确定的因变量(例如产品的主要用户、普通用户和非用户、自有房屋或租赁、电视观众和非电视观众)找出相应处理的区别特性。在判别分析中,因变量为类别数据,有多少类别就有多少类别处理组;自变量通常为可度量数据。通过判别分析,可以建立能够最大限度的区分因变量类别的函数,考查自变量的组间差异是否显着,判断那些自变量对组间差异贡献最大,评估分类的程度,根据自变量的值将样本归类。
应用范围
1)信息丢失
2)直接的信息得不到
3)预报
4)破坏性实验
假设条件
1)分组类型在两种以上,且组间样本在判别值上差别明显。
2)组内样本数不得少于两个,并且样本数量比变量起码多两个。
3)所确定的判别变量不能是其他判别变量的线性组合。
4)各组样本的协方差矩阵相等。
5)各判别变量之间具有多元正态分布。
6)样品量应在所使用的自变量个数的10~20倍以上时,建立的判别函数才比较稳定;而自变量个数在8~10之间时,函数的判别效果才能比较理想。当然,在实际工作中判别函数的自变量个数往往会超过10个,但应该注意的是,自变量的个数多并不代表效果好
spss操作:“分析”~“分类”~“判别”~进入判别分析主对话框。
这里有容易引起歧义的二个变量,最上面的为分组变量。对分组变量的了解需要联系判别分析的原理以及适用范围。因为判别分析是已知分类数目的情况下,进行分析,这个已知的分类数目就是这个分组变量。其实,一般分析步骤中,都是先进行聚类分析,聚类之后得到的分类结果就是这个分组变量,然后再选择这个分组变量,进行分析。也就是,聚类分析是母亲,母亲的孩子就是判别分析。得到的判别函数就是预测想要知道的个案究竟属于哪一类。另一个变量就是选择变量,它位于主对话框的最下面。这个选择变量在回归分析相应的对话框中也有,意思就是选择你需要的变量,这个变量可以为数据窗口的一个整个变量,也可以利用子设置“值”进行选择,所以,它的名字叫做选择变量。
“统计量”子对话框:“描述性”栏,包括“均值”“单变量ANOVA”“BoxsM”
需要特别说明,以后只要见到ANOVA这个单词,它的意思就是方差分析,也就是进一步输出方差分析表,其中最重要的就是P值也就是Sig值。
BoxsM复选框:指的是输出对组协方差矩阵的等同性检验的检验结果。也就是对各类协方差矩阵相等的假设进行检验。
“函数系数”栏:其实就是将判别函数系数进行设置。包括“费雪”和“未标准化”。费雪指的是对每一类给出一组系数,并且给出该组中判别分数最大的观测量。
“矩阵”栏:都是复选框,对应相应的矩阵也就是在结果表中的四种数阵。“组内相关”“组内协方差”“分组协方差”“总体协方差”这个都是计算机自动计算,人工计算是不可能完成的任务。
“分类”子对话框:本文也提到过先验概率,先验概率就是已知一部分信息,来了解未知信息也就是后验概率。
“所有组相等”也就是如果分为几类,这所有的类中的先验概率都相等。
“根据组大小计算”各类先验概率按照和各类样本量呈正比。
“使用协方差矩阵”栏:是二个单选框。“在组内”指使用合并组内协方差矩阵进行分析
“分组”指使用各组协方差矩阵进行分析。
“输出”栏~“个案结果”:对每一个观测量输出判别分数,也就是选定变量的个案的分进哪个组的资格得分。实际类,预测类,也就是根据判别得分计算的古今对比。实际类就是目前实际上分为几类,预测类就是过去对未来预测,它们一对比,就可以知道过去和现在差别在哪里。附属选项“将个案限制在”在后面的小矩形框中输入观测量数,含义为仅输出设置的观测量结果,当个案也就是观测量太多,可以用此法。
“摘要表”输出分类小结,给出正确和错分的观测量数,和错判率。
“不考虑该个案时的分类”这个根据字面就可以理解,不赘述。
“图”栏:“合并组”生成一张包括各类的散点图,该散点图根据前两个判别函数得到,如果只有一个判别函数,则生成直方图。
“分组”复选框:有几类就有几张散点图,和上面一样,如果只有一个判别函数,就生成直方图。
“区域图”复选框:将观测量分到各组中去的区域图。此图将一张图的平面划分出类数,相同的区域,每一类占据一个区,各类的均值在各区中用星号标出,如果仅有一个判别函数,即没有此图。
“保存”子对话框:这个设置是非常重要的,并且特别直观,只要选择,就可以在数据窗口生成相应的新变量。这个新变量分别是:“预测组成员”这个预测组成员是根据判别分数,以及后验概率最大的预测分类。也就是,每个个案的预测分类。
“判别得分”这个根据名字就可以理解。该分数=没有标准化的判别系数×自变量的值+一个常数。每次运行判别过程都给出一组表明判别分数的新变量。有几个判别函数就建立几个判别函数减1的新变量。新变量名称词头为dis-。
举例:1 医学实践中根据各种化验结果,疾病症状等判断病人患有什么疾病。
2 体育人才选拔根据运动员的体形,运动成绩,生理指标,心理素质指标判断是否继续培养。
3 动植物分类
判别分析最主要的分析目的:得到判别函数,对未知个案进行预测分类。
“组成员概率”表示观测量属于哪一类的概率,有几类,就给出几类概率值,新变量默认名为dis预测分类数-判别概率,例如有三类,二个判别函数,则新变量名称可以为dis1-1,dis2-1,dis3-1,dis3-2以此类推。
逐步判别分析:只要在主对话框中选择“使用步进式方法”,就可以筛选变量,同时,方法对话框将激活。
“方法”对话框中“标准”栏的设置和线性回归的一样,不赘述。
“方法”栏:原则就是,负面指标越小越好,正面指标越大越好。负面指标是wilks lambda和未解释方差,正面指标是马氏距离,最小F值,Raos V。马氏距离在回归中越大代表这个个案为影响点可能越大,也就是,只有这个个案为影响点,它越重要,越对判别函数影响越大,把它挑出来,也就是马氏距离最大。
结果:1 sig值小于0.05,说明可以继续分析,函数具有判别作用,也就是有统计学意义。
2 数据窗口对话框,将在“保存”子对话框设置的新变量和在主对话框的分组变量进行对比,每个个案被分到哪类,以及判别得分,都一目了然。
3 根据输出表中的系数,可以写出判别函数,进行以后的预测。

⑷ stepwise discriminant analysis是什么意思

stepwise discriminant analysis
逐步判别分析;逐步监别分析;逐步区别分析
例句筛选
1.
The Application of Classified Diagnosis on Apoplexy Using StepwiseDiscriminant Analysis with Nonparametric Method
非参数逐步判别分析在脑中风分类诊断中的应用

2.
Stepwise Discriminant Analysis Used for Discriminant Sediment Source of the South of the Yellow Sea
南黄海表层沉积物物质来源的逐步判别分析

⑸ 含油气性评价数学模型

一般使用聚类分析等综合评判和专家系统对一个圈闭乃至一个区域的含油气性进行评价。

6.2.1 聚类分析

聚类分析又称群分析,簇分析。聚类分析的方法较多,主要是根据一批研究对象(样品或变量)在性质、特征、数量等方面的相似程度进行分类。油气资源评价中聚类分析通常思路是:选择部分勘探和研究程度高、含油气性已明确的圈闭、区块、盆地(包括含油气的和不含油气的)等作为标型单元,与勘探和研究程度相对较低,含油气性不确定的评价对象一起,依据这些样品(标型单元和评价对象)的多个变量指标(包括性质、特征等)应用多种方法确定距离系数或相似系数,然后编制分类谱系图,直观显示样品间相似程度,最后在不同相似性尺度上进行粗细不等的分类。

距离系数确定如下:对于几个样品,若我们选定m个变量指标进行分析,则可以把每个样品看成是m维空间上由其m个变量指标确定的一个点。两两样品(即点)之间的距离可由下式(即Minkowski距离公式)计算:

油气资源评价方法与实践

式中q为1时称为绝对(值)距离,为2时称为欧几里得距离。研究中通常应用欧几里得距离。

上述距离确定方法中存在两个问题:①距离与各变量的量纲有关,也就是说与变量的数值大小(量纲变化,数值会相应变化)有关,解决此难题的一个办法即是数据标准化,如标准差标准化、极差标准化、极差正规化等;②在计算距离时没考虑变量之间的相关性,解决这一问题的办法主要是要对变量进行分析,筛选主要变量,剔除次要变量和非独立变量。

表6-1 资源评价方法分类及其主要方法适用范围列表

相似系数通常指夹角余弦和相似系数。

夹角余弦定义:若把每个样品看成m维变量空间中的一个向量,那么样品i和样品j之间的相似性就可用两个向量间夹角余弦cosθij来表示,其计算公式为

油气资源评价方法与实践

相似系数定义:它是经过标准化后的夹角余弦,一般用rij表示,计算公式为

油气资源评价方法与实践

图6-1即是夹角余弦绘制的聚类分析谱系图,可见,该图非常明确地显示了17个样品间相似程度,当我们以cosθ=-0.2为划分界线时,可将17个样品分为2个组,但以cosθ=0为划分界线时,则分为3个组,若以cosθ=0.4为划分界线则又分为5个组,以此类推。

图6-1 聚类分析谱系图

6.2.2 判别分析

油气资源评价中,常常会遇到判断某个目标(如圈闭、区块、盆地)是否含油的问题,这就可用判别分析,即由一组已知样品,建立样品含油气性(或其他性质)与地质变量间的定量关系,即建立判别方程,并确定出类型归属的界线值。然后对于一个新样品(即未知样品,通常是评价目标),用该判别方程计算出判别值,再把此判别值与界线值比较,从而确定新样品的类型归属。

判别分析通常分为两组判别、多组判别和逐步判别。

两组判别分析是指把样品归类为两种,如一个勘探目标(如圈闭、区块)要么含油,要么不含油。当然,对于地质目标而言,用某个单项指标(即单一变量)进行判断是比较困难的,故一般都用多项指标(即多个变量)建立判别方程。为简化问题,判别方程一般是用线性方程,对于每个样品,当用m个可供判别分类的变量建立线性判别方程时,一般采用待定系数法。即设线性判别方程为

油气资源评价方法与实践

式中c1,c2,…,cm为待定系数。应用n个样品(其中n1个为1类,n2个为2类)的m个变量的观测值,按照两类样品间差别最大,而同类样品间差别最小的原则,通过解偏微分方程等一系列算法求取待定系数。

所谓多组判别就是指样品归属的类型多于两个,如某一勘探目标可能是大型油田,也可能是中型油田,也可能是小型油田甚至还可能不含油。多组判别方程建立的方法与两组判别方程建立方法相同,只是两组判别只一个判别函数,把空间分成两个域;三组判别有3个判别函数,把空间分成3个域;而4组判别需要6个判别函数,以此类推。因此,对于多组判别分析,计算组间的判别函数很不方便。

逐步判别就是对变量按其对判别分类的重要性,在计算过程中有进有出,保留那些对判别类型起主要作用的变量,剔除那些不起作用或作用不大的变量。

6.2.3 特征分析

在油气资源评价中,特征分析是通过已知圈闭、区块或盆地(统称为标型区)含油气性评价的主要控油地质变量,经最优化模型计算后,确定各地质变量的权系数,建立关联值计算公式,作为各地质变量具有的综合特征,依此进行未知盆地、区块、圈闭(统称为评价区)含油性评价。因此,特征分析更能反映事物的本质。特征分析法的基本思路是:通过标型区建立最优模型公式,并计算标型区和评价区的关联值,然后用下式计算标型区与评价区的相对偏差,即:

油气资源评价方法与实践

并定义为:|相对偏差|≤0.2,完全相似,地质类比系数为1;|相对偏差|=0.2~0.4,比较相似,地质类比系数为1.2或0.8;|相对偏差|=0.4~0.6,基本相似,地质类比系数1.4或0.6;|相对偏差|>0.6,基本不相似,不能类比。

特征分析法一般评价步骤是:

(1)依据各项地质变量含油气性判别的准则,确定评价的阈限值,将各项地质参数转换成1、0、-1三元逻辑表达式。

(2)用乘积矩阵的平方和法、主分量法及匹配概率矩阵主分量法等对标型区进行最优化模型特征的定量化,确立各项地质变量的权系数,建立关联值计算公式:

油气资源评价方法与实践

式中:y为关联值,

xi项地质变量的三元逻辑值,

ai为xi的权系数。

(3)计算标型区与待判区的关联值,并进行类比,确定未知盆地、区块、圈闭的含油气性。类比准则是:凡与已知油气田(区块、盆地)关联值可比的列入Ⅰ级含油气圈闭(区块、盆地),与已知含油气圈闭(区块、盆地)关联值可比的列入Ⅱ级含油气圈闭(区块、盆地);关联值介于含油与非含油圈闭(区块、盆地)之间的,列入Ⅲ级含油气圈闭(区块、盆地);关联值在非含油气圈闭(区块、盆地)范围内的,则圈闭(区块、盆地)不含油气。

6.2.4 逻辑信息法

逻辑信息法属于“数量化”理论的范畴,是数理逻辑、组合分析及数理统计为基础的综合评价方法。主要是通过已知不同级别含油气性的圈闭(如已知油气田、含油气圈闭、有油气显示圈闭和干圈闭),按一定序列建立圈闭含油气性评价的变异序列,以此作为评价模型。依据“位移帕斯卡三角形”,求得各地质参数的相对标志权,挑选评价的主要地质变量,计算各地质变量的标志信息权、标志分权及各圈闭的对象权,然后与已知圈闭对象权分布范围进行比较,作出圈闭含油气性评价。具体步骤如下:

(1)选择已知圈闭为标型,对各控油地质变量进行0,1二态变量转换,构成m组变异序列。

(2)依据“位移帕斯卡三角形”计算各地质变量取值为1的相对标志权Pk*(1)及取值为0的相对标志权Pk*(0)(k为地质变量,k=1,2,…,p),然后将m个变异序列中相同级别的圈闭进行相互调换,分别计算各地质变量的Pk*(1)、Pk*(0)。若在所有变异序列中几乎都是Pk*(1)≥-Pk*(O)或Pk*(0)≥Pk*(1),则地质变量k与圈闭含油性关系密切,挑选该项变量,反之则剔除。

(3)对已选地质变量,划分最小区分标志组合,计算各标志信息权Pk:Pk=包含k标志的最小区分标志组合数/总的最小区分标志组合数信息权愈大,反映该标志对圈闭含油气性评价意义愈大。

(4)依据各地质变量相对标志权及信息权计算标志分权及标志分权的绝对差。标志分权Pk(1)及Pk(0)按下式求得

Pk(1)=Pk(1)·Pk Pk(0)=Pk(0)·Pk

标志分权的绝对差Rk=|Pk(1)-Pk(0)|

若Pk(1)>Pk(0),则将分权差Rk赋予1,而将0值赋予0;

若Pk(1)<Pk(0),则将分权差Rk赋予0,而将0值赋予1。

(5)据各圈闭每个标志的取值,应用下式求得各圈闭对象权:

油气资源评价方法与实践

式中:Ii为对象权(i=1,2,…,m)

Rk(1,0):据第i个圈闭k标志的取值(0或1)而赋予Rk(0)或Rk(1)(k=1,…,n)。

(6)将各圈闭对象权与标型圈闭的对象权分布范围进行类比,按其相应范围,评价圈闭含油气性。

6.2.5 油气资源评价专家系统

油气资源评价经历了几十年的发展,而今已形成了以统计学为基础的综合评价系统和以数字模拟为基础的盆地模拟系统,但此二系统适用范围局限,当定量资料欠缺时无法评价或评价结果可靠性很低,为充分利用各种定量和定性资料,必须引入专家系统技术。

所谓专家系统即是应用专家知识,按照专家思路解决某一特定范围内的专业问题,得出与专家分析类似的结论的计算机软件系统。

在我国,油气资源评价专家系统的研制还是近十几年的事,已研制的较成熟油气资源评价专家系统有两个:一个是海洋石油勘探开发研究中心与吉林大学“七五”期间合作研制的油气资源评价专家系统(Petroleum Resources Evaluation System,简称PRES),包括6个推理及程序模块、9个知识库和3个数据库,可在PC机和VAX11/78O机上运行,对凹陷与圈闭进行资源评价。另一个是地矿部石油地质研究所等多家合作研制的油气资源评价专家系统,其评价对象主要是圈闭,但也可对凹陷进行评价。

严格地讲,不管国内还是国外,目前油气资源评价专家系统尚属发展趋向,处在开发试验阶段,成功者很少,上述二系统即是成功者之一。自1994年下半年以来,地矿部研制的油气资源评价专家系统分别在东海陆架盆地西湖凹陷、松辽盆地南部地区、四川盆地川东北地区、鄂尔多斯盆地伊陕斜坡、南沙海域万安盆地进行了推广应用,特别是在新星公司圈闭管理中得到了广泛应用,取到了令人满意的结果,系统的先进性、科学性和合理性正越来越得到专家们的承认。下面即对该专家系统进行介绍。

6.2.5.1 油气资源评价专家系统简介

油气资源评价专家系统由知识库、知识库维护模块、综合数据库、推理机、解释模块组成(图6-2)。其中知识库、推理机和解释模块是核心,实现评价模型的具体算法。

图6-2 专家系统结构示意图

知识库主要是规则库。规则库之基本构件是节点(地质事实)和边(地质事实间相互关系),边依产生式原则和框架式结构将节点连接起来,边与边之间的关系或用特性表示,或用“与”、“或”、“异或”、“加权”、“新与”和“独立”六种关系表示,并加上边信度(即规则信度),形成有机的网络,其中最底层节点没有前提,叫叶节点;顶层节点没有结论,叫根节点;其余叫中间节点(如图6-3所示)。该专家系统就是以此网络实现评价模型的。建立评价模型,构造知识库特别是规则库,是建立专家系统的中心任务,也是难点所在,即所谓“瓶颈”问题。由于各地区气藏成藏模式不同,故知识库采取模块化结构,推理时,根据具体研究区实际成藏模式,调入相应的模块生成一个适合本区的临时知识库,以提高推理效率。现在系统已依据松辽盆地南部东南隆起区泉头组—登楼库组、东海陆架盆地西湖凹陷平湖组—花港组、鄂尔多斯盆地伊陕斜坡奥陶系顶部风化壳、四川盆地川东北地区二叠系—中三叠统和川西坳陷上三叠统5种不同的成藏模式“调入生成”了相应含油气性评价的临时知识库。

图6-3 节点关系示意图

该专家系统推理机推理为不确定推理,推理方式主要为向前推理,类似人类专家思维那样,依据叶节点或中间节点(前提)按一定规则推理、判断另一些中间节点或根节点(结论)成立的可能性,其实质是进行大量的信度运算,以此实现评价过程。该系统的解释模块以人机会话方式,在推理的一些重要环节允许用户询问并向用户解答诸如“本中间结论是怎样得到的?”、“为什么需要在这里提供信息?”等问题,增加了推理透明度,使用户能更好地参与推理。

6.2.5.2 评价模型在专家系统里的实现

6.2.5.2.1 规则库建立

按产生式规则和框架式结构,应用特性表和“与”、“或”、“异或”、“加权”、“新与”、“独立”6种关系将具体研究区利用典型油气藏解剖、油气藏形成模式及控制因素分析、油气成藏条件及油气藏分布规律研究等成果而建立的评价模型中各种规则有机连接起来,并输入专家系统知识库内,即建成一个规则库。在规则库建立中,采取了模块化结构,分为总模块、含油气标志子模块、油气源条件子模块、储集条件子模块、圈闭条件子模块、聚集条件子模块和保存条件子模块共7个模块,各模块结构如图6-4~6-10所示。

6.2.5.2.2 推理方式及6种推理算法

专家系统评价的实质就是根据规则库里一系列规则及其相互关系(即评价模型)进行推理。本专家系统主要推理方式是不确定推理,即结论信度可在(-1,1)范围内连续取值,符合地质现象间关系复杂,多为不确定性的这一特点。按照推理方向以向前推理为主,辅以反向推理的设计思路,系统选用了大量的计算方法模型,其中主要的是推理算法,以下仅就6种逻辑关系的推理算法作一简介:

图6-4 总模块结构图

图6-5A 含油气标志子模块结构图

图6-5B 含油气标志子模块结构图

(1)只有一个前提的情形

若H是结论,E是前提,并假定E的信度cf(E)和从E到H的边信度a,b已知,则:

图6-5C 含油气标志子模块结构图

1)若cf(E)>0,则cf(H)=a·cf(E);

2)若cf(E)<0,则cf(H)=b·cf(E)。

由于a,b取值都可在[-1,1]之间变化,因此可以反映E对H的多种影响,例如E是H的充分条件(a=1,b=0),必要条件(a=0,b=1),充要条件(a=b=1)等等。

(2)具有多个前提的情形

设H是结论,且,E1,E2,…,En是前提,cfi(H)表示由单一前提Ei所求出的H的信度,i=1,2,…,n,则H的最终信度cf(H)计算方法如下:

1)若诸Ei之间的关系为“与”,则令

油气资源评价方法与实践

2)若诸Ei之间的关系为“或”,则令

油气资源评价方法与实践

3)若诸Ei之间的关系为“加权”,则令

油气资源评价方法与实践

图6-6 油气源条件子模块结构图

诸Wi是权值。在特殊情形下,规定cf(H)》ΣWi·cfi(H),以表示“突变”关系。

4)若诸Ei之间的关系为“异或”,则诸Ei中必定只有且恰有一个满足cf(H)>t>0(t是阈值),因此,可令

油气资源评价方法与实践

图6-7A 储集条件子模块结构图

图6-7B 储集条件子模块结构图

图6-8 圈闭条件子模块结构图

5)若诸Ei之间的关系为“独立”,为了简单起见,先设n=2,则令

油气资源评价方法与实践

当n>2时,先将同号的诸cfi(H)分别按上式合并,再求其代数和得到cf(H)。

6)若诸Ei之间的关系是“新与”,且Ei为主要节点(起决定性作用),则令:

油气资源评价方法与实践

图6-9 聚集条件子模块结构图

如果一个结论H的诸前提E1,E2,…,En之间存在着多种关系,则通过设置运算节点(虚节点)来反映各种关系之间的优先级。

如果对信度计算有特定要求,例如需经查表、计算(调用子程序)、类比或询问来确定结论H的信度值,则知识库中标明之。另外,对于边信度可能需要修改的情形,某个前提可以单独肯定或否定结论的情形等,也在规则库中注明,以便通过有关元知识及时处理。

图6-10A 保存条件子模块结构图

6.2.5.2.3 解释功能

当系统推出某个重要中间结果时,系统显示这一结论并暂停推理,等待用户提问并予以回答;另一方面,当推理到某一步时,系统需要用户提供某种信息,也允许用户在输入信息前询问并进行回答,然后等候用户输入此信息;最后,系统还能通过列表方式显示最终结论或中间结论是如何推得的。

图6-10B 保存条件子模块结构图

⑹ 求统计分析方面的算法

判别分析通常都要建立一个判别函数,然后利用次判别函数来进行判别。为了建立判别函数就必须有一个训练样本。判别分析的任务就是向这份样本学习,学判断类别的规则,并非多方考核。训练样本的质量与数量至关重要。每一个体所属类别必须用“金标准”予以确认;解释变量X1,X2,...XP必须确实与分类有关;个体的观察值必须准确;个体的数目必须足够多.
.逐步判别分析 建立在Bayes判别分析基础上,它像逐步回归分析一样,可以在众多指标中挑选一些有显着作用的指标来建立一个判别函数,使方程内的指标都有显着地判别作用而方程外的指标作用都不显着。

从逐步回归分析中我们已经知道,回归方程中的自变量并非越多越好。作用不大的变量进入方程中不但无益,反而有害。在判别分析中也有类似情况,解释变量并非越多越好。解释变量的特异性越强,判别能力越强,这类解释变量当然越多越好;相反,那些判别能力不强的解释变量如果引入分类函数,同样也是有益无害的,不但增加了搜集数据和处理数据的工作量,而且还可能削弱判别效果。因此我们希望在建立分类函数时既不要遗漏有显着判别能力的变量,也不要引入不必要的判别能力很弱的变量。
逐步判别分析是达到上述目标的重要方法。它象逐步回归分析一样,可以在很多候选变量中挑选一些有重要作用的变量来建立分类函数,使方程内的变量都较重要而方程外的变量都不甚重要。分类函数内的变量是否有重要作用可用F检验,检验的零假设是:该变量对判别的贡献为零。若P值较小便拒绝零假设,认为该变量的贡献具有统计学意义。
要求要用C语言吗?

⑺ 判别分析的基本思想

根据判别中的组数,可以分为两组判别分析和多组判别分析;
根据判别函数的形式,可以分为线性判别和非线性判别;
根据判别式处理变量的方法不同,可以分为逐步判别、序贯判别等;
根据判别标准不同,可以分为距离判别、Fisher判别、Bayes判别法等。

⑻ 判别分析法用逻辑判断,属于定型分析是对还是错

判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。
其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。据此即可确定某一样本属于何类。
当得到一个新的样品数据,要确定该样品属于已知类型中哪一类,这类问题属于判别分析问题。

阅读全文

与逐步判别是判别分析方法吗相关的资料

热点内容
淋浴花洒龙头安装方法 浏览:501
从001到099的简便方法 浏览:809
手机苹果账户在哪里设置方法 浏览:401
热成像检测器使用方法 浏览:608
中职课题研究方法 浏览:583
古代医学有哪些方法 浏览:64
学生减腿快速方法图解 浏览:543
室内除甲醛方法去哪里买得到 浏览:100
可视手机套的安装方法 浏览:821
游戏手机病毒清理方法 浏览:651
祛除肝斑的方法有哪些 浏览:161
锻炼改变的方法 浏览:710
散淤血的快速方法薯仔 浏览:278
援的使用方法 浏览:253
宝山区定制电脑图文设计使用方法 浏览:871
锻练肌肉正确方法 浏览:847
淘金方法简单 浏览:489
沁人缘喷剂使用方法 浏览:343
17岁长高的锻炼方法 浏览:486
水灵珠怎么使用方法 浏览:667