导航:首页 > 研究方法 > 多元分析方法中用于预测分析的是

多元分析方法中用于预测分析的是

发布时间:2022-06-19 01:02:11

A. 多元统计!!!急求!

1. 因子分析模型

因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

因子分析的基本思想:
把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子

因子分析模型描述如下:

(1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。

(2)F = (F1,F2,…,Fm)¢ (m<p)是不可测的向量,其均值向量E(F)=0,协方差矩阵Cov(F) =I,即向量的各分量是相互独立的。

(3)e = (e1,e2,…,ep)¢与F相互独立,且E(e)=0, e的协方差阵∑是对角阵,即各分量e之间是相互独立的,则模型:

x1 = a11F1+ a12F2 +…+a1mFm + e1

x2 = a21F1+a22F2 +…+a2mFm + e2

………

xp = ap1F1+ ap2F2 +…+apmFm + ep

称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。

其矩阵形式为: x =AF + e .

其中:

x=,A=,F=,e=

这里,

(1)m £ p;

(2)Cov(F,e)=0,即F和e是不相关的;

(3)D(F) = Im ,即F1,F2,…,Fm不相关且方差均为1;

D(e)=,即e1,e2,…,ep不相关,且方差不同。

我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e 称为X的特殊因子。

A = (aij),aij为因子载荷。数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。

2. 模型的统计意义

模型中F1,F2,…,Fm叫做主因子或公共因子,它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。公共因子的含义,必须结合具体问题的实际意义而定。e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之间以及特殊因子与所有公共因子之间都是相互独立的。模型中载荷矩阵A中的元素(aij)是为因子载荷。因子载荷aij是xi与Fj的协方差,也是xi与Fj的相关系数,它表示xi依赖Fj的程度。可将aij看作第i个变量在第j公共因子上的权,aij的绝对值越大(|aij|£1),表明xi与Fj的相依程度越大,或称公共因子Fj对于xi的载荷量越大。为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,即变量共同度和公共因子的方差贡献。

因子载荷矩阵A中第i行元素之平方和记为hi2,称为变量xi的共同度。它是全部公共因子对xi的方差所做出的贡献,反映了全部公共因子对变量xi的影响。hi2大表明x的第i个分量xi对于F的每一分量F1,F2,…,Fm的共同依赖程度大。

将因子载荷矩阵A的第j列( j =1,2,…,m)的各元素的平方和记为gj2,称为公共因子Fj对x的方差贡献。gj2就表示第j个公共因子Fj对于x的每一分量xi(i= 1,2,…,p)所提供方差的总和,它是衡量公共因子相对重要性的指标。gj2越大,表明公共因子Fj对x的贡献越大,或者说对x的影响和作用就越大。如果将因子载荷矩阵A的所有gj2 ( j =1,2,…,m)都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。

3. 因子旋转

建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。如果求出主因子解后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。

旋转的方法有很多,正交旋转(orthogonal rotation)和斜交旋转(oblique rotation)是因子旋转的两类方法。最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转;如果因子对应轴相互间不是正交的,则称为斜交旋转。常用的斜交旋转方法有Promax法等。

4.因子得分

因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。例如地区经济发展的因子分析模型建立后,我们希望知道每个地区经济发展的情况,把区域经济划分归类,哪些地区发展较快,哪些中等发达,哪些较慢等。这时需要将公共因子用变量的线性组合来表示,也即由地区经济的各项指标值来估计它的因子得分。

设公共因子F由变量x表示的线性组合为:

Fj = uj1 xj1+ uj2 xj2+…+ujpxjp j=1,2,…,m

该式称为因子得分函数,由它来计算每个样品的公共因子得分。若取m=2,则将每个样品的p个变量代入上式即可算出每个样品的因子得分F1和F2,并将其在平面上做因子得分散点图,进而对样品进行分类或对原始数据进行更深入的研究。

但因子得分函数中方程的个数m小于变量的个数p,所以并不能精确计算出因子得分,只能对因子得分进行估计。估计因子得分的方法较多,常用的有回归估计法,Bartlett估计法,Thomson估计法。

(1)回归估计法

F = X b = X (X ¢X)-1A¢ = XR-1A¢ (这里R为相关阵,且R = X ¢X )。

(2)Bartlett估计法

Bartlett估计因子得分可由最小二乘法或极大似然法导出。

F = [(W-1/2A)¢ W-1/2A]-1(W-1/2A)¢ W-1/2X = (A¢W-1A)-1A¢W-1X

(3)Thomson估计法

在回归估计法中,实际上是忽略特殊因子的作用,取R = X ¢X,若考虑特殊因子的作用,此时R = X ¢X+W,于是有:

F = XR-1A¢ = X (X ¢X+W)-1A¢

这就是Thomson估计的因子得分,使用矩阵求逆算法(参考线性代数文献)可以将其转换为:

F = XR-1A¢ = X (I+A¢W-1A)-1W-1A¢

5. 因子分析的步骤

因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。

(i)因子分析常常有以下四个基本步骤:

(1)确认待分析的原变量是否适合作因子分析。

(2)构造因子变量。

(3)利用旋转方法使因子变量更具有可解释性。

(4)计算因子变量得分。

(ii)因子分析的计算过程:

(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。

(2)求标准化数据的相关矩阵;

(3)求相关矩阵的特征值和特征向量;

(4)计算方差贡献率与累积方差贡献率;

(5)确定因子:

设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;

(6)因子旋转:

若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。

(7)用原指标的线性组合来求各因子得分:

采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。

(8)综合得分

以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。

F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )

此处wi为旋转前或旋转后因子的方差贡献率。

(9)得分排序:利用综合得分可以得到得分名次。

在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:

· 简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,从子集合所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。

· 构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。

· 进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。

如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。
Rotated Component Matrix,就是经转轴后的因子负荷矩阵,
当你设置了因子转轴后,便会产生这结果。
转轴的是要得到清晰的负荷形式,以便研究者进行因子解释及命名。

SPSS的Factor Analysis对话框中,有个Rotation钮,点击便会弹出Rotation对话框,
其中有5种因子旋转方法可选择:

1.最大变异法(Varimax):使负荷量的变异数在因子内最大,亦即,使每个因子上具有最高载荷的变量数最少。

2.四次方最大值法(Quartimax):使负荷量的变异数在变项内最大,亦即,使每个变量中需要解释的因子数最少。

3.相等最大值法(Equamax):综合前两者,使负荷量的变异数在因素内与变项内同时最大。

4.直接斜交转轴法(Direct Oblimin):使因素负荷量的差积(cross-procts)最小化。

5.Promax 转轴法:将直交转轴(varimax)的结果再进行有相关的斜交转轴。因子负荷量取2,4,6次方以产生接近0但不为0的值,借以找出因子间的相关,但仍保有最简化因素的特性。

上述前三者属于“直交(正交)转轴法”(Orthogonal Rotations),在直交转轴法中,因子与因子之间没有相关,因子轴之间的夹角等于90 度。后两者属于“斜交转轴”(oblique rotations),表示因子与因子之间彼此有某种程度的相关,因素轴之间的夹角不是90度。

直交转轴法的优点是因子之间提供的讯息不会重叠,受访者在某一个因子的分數与在其他因子的分數,彼此独立互不相关;缺点是研究迫使因素之间不相关,但这种情况在实际的情境中往往并不常存在。至于使用何种转轴方式,须视乎研究题材、研究目的及相关理论,由研究者自行设定。

在根据结果解释因子时,除了要看因子负荷矩阵中,因子对哪些变量呈高负荷,对哪些变量呈低负荷,还须留意之前所用的转轴法代表的意义。

2,主成分分析(principal component analysis)

将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。但是,在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。
(1)主成分分析的原理及基本思想。
原理:设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。
基本思想:主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
(2)步骤
Fp=a1mZX1+a2mZX2+……+apmZXp
其中a1i, a2i, ……,api(i=1,……,m)为X的协方差阵∑的特征值多对应的特征向量,ZX1, ZX2, ……, ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:本文指的数据标准化是指Z标准化]。
A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0 。
进行主成分分析主要步骤如下:
1. 指标数据标准化(SPSS软件自动执行);
2. 指标之间的相关性判定;
3. 确定主成分个数m;
4. 主成分Fi表达式;
5. 主成分Fi命名;

选用以上两种方法时的注意事项如下:
1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。

4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。

5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。

总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(rece dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。

(1)了解如何通过SPSS因子分析得出主成分分析结果。首先,选择SPSS中Analyze-Data Rection-Factor…,在Extraction…对话框中选择主成分方法提取因子,选择好因子提取个数标准后点确定完成因子分析。打开输出结果窗口后找到Total Variance Explained表和Component Matrix表。将Component Matrix表中第一列数据分别除以Total Variance Explained表中第一特征根值的开方得到第一主成分表达式系数,用类似方法得到其它主成分表达式。打开数据窗口,点击菜单项的Analyze-Descriptive Statistics-Descriptives…,在打开的新窗口下方构选Save standardized values as variables,选定左边要分析的变量。点击Options,只构选Means,点确定后既得待分析变量的标准化新变量。

选择菜单项Transform-Compute…,在Target Variable中输入:Z1(主成分变量名,可以自己定义),在Numeric Expression中输入例如:0.412(刚才主成分表达式中的系数)*Z人口数(标准化过的新变量名)+0.212*Z第一产业产值+…,点确定即得到主成分得分。通过对主成分得分的排序即可进行各个个案的综合评价。很显然,这里的过程分为四个步骤:

Ⅰ.选主成分方法提取因子进行因子分析。

Ⅱ.计算主成分表达式系数。

Ⅲ.标准化数据。

Ⅳ.计算主成分得分。

我们的程序也将依该思路展开开发。

(2)对为何要将Component Matrix表数据除以特征根开方的解释

我们学过主成分分析和因子分析后不难发现,原来因子分析时的因子载荷矩阵就是主成分分析特征向量矩阵乘以对应特征根开方值的对角阵。而Component Matrix表输出的恰是因子载荷矩阵,所以求主成分特征向量自然是上面描述的逆运算。

成功启动程序后选定分析变量和主成分提取方法即可在数据窗口输出得分和在OUTPUT窗口输出主成分表达式。

3,聚类分析(Cluster Analysis)

聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术 。

在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有针对性的对目标消费群体施加影响,合理地开展工作。

4.判别分析(Discriminatory Analysis)

判别分析(Discriminatory Analysis)的任务是根据已掌握的1批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的1个新样品,判断它来自哪个总体。根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法。

费歇(FISHER)判别思想是投影,使多维问题简化为一维问题来处理。选择一个适当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值。对这个投影轴的方向的要求是:使每一类内的投影值所形成的类内离差尽可能小,而不同类间的投影值所形成的类间离差尽可能大。贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;所谓后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果。

距离判别思想是根据各样品与各母体之间的距离远近作出判别。即根据资料建立关于各母体的距离判别函数式,将各样品数据逐一代入计算,得出各样品与各母体之间的距离值,判样品属于距离值最小的那个母体。

5.对应分析(Correspondence Analysis)

对应分析是一种用来研究变量与变量之间联系紧密程度的研究技术。

运用这种研究技术,我们可以获取有关消费者对产品品牌定位方面的图形,从而帮助您及时调整营销策略,以便使产品品牌在消费者中能树立起正确的形象。

这种研究技术还可以用于检验广告或市场推广活动的效果,我们可以通过对比广告播出前或市场推广活动前与广告播出后或市场推广活动后消费者对产品的不同认知图来看出广告或市场推广活动是否成功的向消费者传达了需要传达的信息。

B. 国际油价预测方法是什么

国际上多采用三种油价预测分析方法。
多元回归分析法:是预测分析的一种基本方法,它是因果关系分析的一个分支。因果关系可以用一组变量来描述,即自变量与因变量之间的关系,用y=f (x)表示。y是因变量,是预测目标——国际油价;x是自变量,是影响因素。该方法的优点是考虑因素少,计算公式简单,便于操作。但缺点是:模型建立在统计数据的基础上,以“过去”已知数据推算“未来”未知数据,存在着不确定性;回归系数及常数不能排除偶然因素的影响;对国际原油市场供需量的预测精确度要求高,而这一点往往难以做到。
均衡价格法:是西方经济学均衡理论在油价分析预测中的具体运用。它不仅考虑了供需之间的关系,还从利润角度考虑原油价格的合理值。在竞争条件下,整个国际市场的供求关系决定着原油的价格水平,即原油的均衡价格是市场需求曲线与供给曲线相交点所对应的价格。在经济学中还有一条着名的定律,是最优经济效益在边际收入等于边际成本时达到。它是决定产量规模、价格等的重要依据。所以在制定原油价格和产量规模时,必须遵循这条规定。该方法的缺点是,实用性不强,推导过程中应用了回归分析方法,准确度低,只适用于近期油价的预测。
层次分析法:由美国着名的运筹学家萨得在20世纪70年代中期提出,是系统工程中常用的软科学方法。它特别适合用于处理那些多层次的复杂大系统问题和难以完全用定量方法分析与决策的社会系统工程的复杂问题。它可以将主观判断用数量形式来表达和处理,是一种定量和定性相结合的分析方法。但该方法的缺点是受人为因素影响大,人为主观判断往往事先决定了油价涨跌的趋势。

C. 多元分析的分析方法

包括3类:①多元方差分析、多元回归分析和协方差分析,称为线性模型方法,用以研究确定的自变量与因变量之间的关系;②判别函数分析和聚类分析,用以研究对事物的分类;③主成分分析、典型相关和因素分析,研究如何用较少的综合因素代替为数较多的原始变量。 是把总变异按照其来源(或实验设计)分为多个部分,从而检验各个因素对因变量的影响以及各因素间交互作用的统计方法。例如,在分析2×2析因设计资料时,总变异可分为分属两个因素的两个组间变异、两因素间的交互作用及误差(即组内变异)等四部分,然后对组间变异和交互作用的显着性进行F检验。
优点
是可以在一次研究中同时检验具有多个水平的多个因素各自对因变量的影响以及各因素间的交互作用。其应用的限制条件是,各个因素每一水平的样本必须是独立的随机样本,其重复观测的数据服从正态分布,且各总体方差相等。 用以评估和分析一个因变量与多个自变量之间线性函数关系的统计方法。一个因变量y与自变量x1、x2、…xm有线性回归关系是指:
其中α、β1…βm是待估参数,ε是表示误差的随机变量。通过实验可获得x1、x2…xm的若干组数据以及对应的y值,利用这些数据和最小二乘法就能对方程中的参数作出估计,记为╋、勮…叧,它们称为偏回归系数。
优点
是可以定量地描述某一现象和某些因素间的线性函数关系。将各变量的已知值代入回归方程便可求得因变量的估计值(预测值),从而可以有效地预测某种现象的发生和发展。它既可以用于连续变量,也可用于二分变量(0,1回归)。多元回归的应用有严格的限制。首先要用方差分析法检验因变量y与m个自变量之间的线性回归关系有无显着性,其次,如果y与m个自变量总的来说有线性关系,也并不意味着所有自变量都与因变量有线性关系,还需对每个自变量的偏回归系数进行t检验,以剔除在方程中不起作用的自变量。也可以用逐步回归的方法建立回归方程,逐步选取自变量,从而保证引入方程的自变量都是重要的。 把线性回归与方差分析结合起来检验多个修正均数间有无差别的统计方法。例如,一个实验包含两个多元自变量,一个是离散变量(具有多个水平),一个是连续变量,实验目的是分析离散变量的各个水平的优劣,此变量是方差变量;而连续变量是由于无法加以控制而进入实验的,称为协变量。在运用协方差分析时,可先求出该连续变量与因变量的线性回归函数,然后根据这个函数扣除该变量的影响,即求出该连续变量取等值情况时因变量的修正均数,最后用方差分析检验各修正均数间的差异显着性,即检验离散变量对因变量的影响。
优点
可以在考虑连续变量影响的条件下检验离散变量对因变量的影响,有助于排除非实验因素的干扰作用。其限制条件是,理论上要求各组资料(样本)都来自方差相同的正态总体,各组的总体直线回归系数相等且都不为0。因此应用协方差分析前应先进行方差齐性检验和回归系数的假设检验,若符合或经变换后符合上述条件,方可作协方差分析。 判定个体所属类别的统计方法。其基本原理是:根据两个或多个已知类别的样本观测资料确定一个或几个线性判别函数和判别指标,然后用该判别函数依据判别指标来判定另一个个体属于哪一类。
判别分析不仅用于连续变量,而且借助于数量化理论亦可用于定性资料。它有助于客观地确定归类标准。然而,判别分析仅可用于类别已确定的情况。当类别本身未定时,预用聚类分析先分出类别,然后再进行判别分析。 解决分类问题的一种统计方法。若给定n个观测对象,每个观察对象有p个特征(变量),如何将它们聚成若干可定义的类?若对观测对象进行聚类,称为Q型分析;若对变量进行聚类,称为R型分析。聚类的基本原则是,使同类的内部差别较小,而类别间的差别较大。最常用的聚类方案有两种。一种是系统聚类方法。例如,要将n个对象分为k类,先将n个对象各自分成一类,共n类。然后计算两两之间的某种“距离”,找出距离最近的两个类、合并为一个新类。然后逐步重复这一过程,直到并为k类为止。另一种为逐步聚类或称动态聚类方法。当样本数很大时,先将n个样本大致分为k类,然后按照某种最优原则逐步修改,直到分类比较合理为止。
聚类分析是依据个体或变量的数量关系来分类,客观性较强,但各种聚类方法都只能在某种条件下达到局部最优,聚类的最终结果是否成立,尚需专家的鉴定。必要时可以比较几种不同的方法,选择一种比较符合专业要求的分类结果。 把原来多个指标化为少数几个互不相关的综合指标的一种统计方法。例如,用p个指标观测样本,如何从这p个指标的数据出发分析样本或总体的主要性质呢?如果p个指标互不相关,则可把问题化为p个单指标来处理。但大多时候p个指标之间存在着相关。此时可运用主成分分析寻求这些指标的互不相关的线性函数,使原有的多个指标的变化能由这些线性函数的变化来解释。这些线性函数称为原有指标的主成分,或称主分量。
主成分分析有助于分辨出影响因变量的主要因素,也可应用于其他多元分析方法,例如在分辨出主成分之后再对这些主成分进行回归分析、判别分析和典型相关分析。主成分分析还可以作为因素分析的第一步,向前推进就是因素分析。其缺点是只涉及一组变量之间的相互依赖关系,若要讨论两组变量之间的相互关系则须运用典型相关。 先将较多变量转化为少数几个典型变量,再通过其间的典型相关系数来综合描述两组多元随机变量之间关系的统计方法。设x是p元随机变量,y是q元随机变量,如何描述它们之间的相关程度?当然可逐一计算x的p个分量和y的q个分量之间的相关系数(p×q个), 但这样既繁琐又不能反映事物的本质。如果运用典型相关分析,其基本程序是,从两组变量各自的线性函数中各抽取一个组成一对,它们应是相关系数达到最大值的一对,称为第1对典型变量,类似地还可以求出第2对、第3对、……,这些成对变量之间互不相关,各对典型变量的相关系数称为典型相关系数。所得到的典型相关系数的数目不超过原两组变量中任何一组变量的数目。
典型相关分析有助于综合地描述两组变量之间的典型的相关关系。其条件是,两组变量都是连续变量,其资料都必须服从多元正态分布。
以上几种多元分析方法各有优点和局限性。每一种方法都有它特定的假设、条件和数据要求,例如正态性、线性和同方差等。因此在应用多元分析方法时,应在研究计划阶段确定理论框架,以决定收集何种数据、怎样收集和如何分析数据资料。

D. 简述多元回归法预测人口的原理及优缺点

一、多元线性回归分析的优点:
1、在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。2、在多元线性回归分析是多元回归分析中最基础、最简单的一种。
3、运用回归模型,只要采用的模型和数据相同,通过标准的统计方法可以计算出唯一的结果。、
多元线性回归分析的缺点
有时候在回归分析中,选用何种因子和该因子采用何种表达 式只是一种推测,这影响了用电因子的多样性和某些因子的不可测性,使得回归分析在某些 情况下受到限制。
多元线性回归的基本原理和基本计算过程与一元线性回归相同,但由于自变量个数多,计算相当麻烦,一般在实际中应用时都要借助统计软件。这里只介绍多元线性回归的一些基本问题。

E. 多元线性回归分析预测法的检验

多元线性回归模型与一元线性回归模型一样,在计算出回归模型之后,要对模型进行各种检验。
多元线性回归模型的检验方法有:判定系数检验(R检验),回归系数显着性检验(T检验),回归方程显着性检验(F检验)。 。回归方程的显着性检验是检验所有自变量作为一个整体与因变量之间是否有显着的线性相关关系。显着性检验是通过F检验进行的。F检验值的计算公式是:F(k ,n-k-1)= 多元回归方程的显着性检验与一元回归方程类似,在此也不再赘述。回归方程的显着性检验未通过可能是选择自变量时漏掉了重要的影响因素,或者是自变量与因变量间的关系是非线性的,应重新建立预测模型。
M元线性回归模型:如果随机变量Y与固定变量x1,x2,x3,.....xm之间有显着的线性相关关系,即:Y=b0+b1x1+b2x2+......+bmxm+c 成为m元线性回归

F. 多元线性回归分析模型中估计系数的方法是什么

多元线性回归分析模型中估计系数的方法是:多元线性回归分析预测法

多元线性回归分析预测法:是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。

多元线性回归预测模型一般公式为: 多元线性回归模型中最简单的是只有两个自变量(n=2)的二元线性回归模型,其一般形式为:
下面以二元线性回归分析预测法为例,说明多元线性回归分析预测法的应用。
二元线性回归分析预测法,是根据两个自变量与一个因变量相关关系进行预测的方法。二元线性回归方程的公式为:式中::因变量;
x1,x2:两个不同自变量,即与因变量有紧密联系的影响因素。
a,b1,b2:是线性回归方程的参数。
a,b1,b2是通过解下列的方程组来得到。
二元线性回归预测法基本原理和步骤同一元线性回归预测法没有原则的区别,大体相同。

“多元线性回归分析预测法”网络链接:http://ke..com/view/1338395.htm

G. 回归分析预测技术依据是什么原理

回归分析的基本概念是用一群变量预测另一个变量的方法。通俗点来讲,就是根据几件事情的相关程度来预测另一件事情发生的概率。回归分析的目的是找到一个联系输入变量和输出变量的最优模型。

回归方法有许多种,可通过 3 种方法进行分类:自变量的个数、因变量的类型和回归线的形状。

1)依据相关关系中自变量的个数不同进行分类,回归方法可分为一元回归分析法和多元回归分析法。在一元回归分析法中,自变量只有一个,而在多元回归分析法中,自变量有两个以上。

2)按照因变量的类型,回归方法可分为线性回归分析法和非线性回归分析法。

3)按照回归线的形状分类时,如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,则这种回归分析称为一元线性回归分析;如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是非线性关系,则称为多元非线性回归分析。
1. 线性回归
线性回归是世界上最知名的建模方法之一。在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计的。这些模型被叫作线性模型。在线性模型中,因变量是连续型的,自变量可以是连续型或离散型的,回归线是线性的。

H. 常用的多元分析方法

多元分析方法包括3类:

多元方差分析、多元回归分析和协方差分析,称为线性模型方法,用以研究确定的自变量与因变量之间的关系;判别函数分析和聚类分析,用以研究对事物的分类;主成分分析、典型相关和因素分析,研究如何用较少的综合因素代替为数较多的原始变量。

多元方差是把总变异按照其来源分为多个部分,从而检验各个因素对因变量的影响以及各因素间交互作用的统计方法。

判别函数是判定个体所属类别的统计方法。其基本原理是:根据两个或多个已知类别的样本观测资料确定一个或几个线性判别函数和判别指标,然后用该判别函数依据判别指标来判定另一个个体属于哪一类。

(8)多元分析方法中用于预测分析的是扩展阅读

多元分析方法的历史:

首先涉足多元分析方法是F.高尔顿,他于1889年把双变量的正态分布方法运用于传统的统计学,创立了相关系数和线性回归。

其后的几十年中,斯皮尔曼提出因素分析法,费希尔提出方差分析和判别分析,威尔克斯发展了多元方差分析,霍特林确定了主成分分析和典型相关。到20世纪前半叶,多元分析理论大多已经确立。

60年代以后,随着计算机科学的发展,多元分析方法在心理学以及其他许多学科的研究中得到了越来越广泛的应用。

I. 多元线性回归分析预测法的公式

多元线性回归预测模型一般公式为: 多元线性回归模型中最简单的是只有两个自变量(n=2)的二元线性回归模型,其一般形式为:
下面以二元线性回归分析预测法为例,说明多元线性回归分析预测法的应用。
二元线性回归分析预测法,是根据两个自变量与一个因变量相关关系进行预测的方法。二元线性回归方程的公式为:式中::因变量;
x1,x2:两个不同自变量,即与因变量有紧密联系的影响因素。
a,b1,b2:是线性回归方程的参数。
a,b1,b2是通过解下列的方程组来得到。
二元线性回归预测法基本原理和步骤同一元线性回归预测法没有原则的区别,大体相同。

J. 多元地学图像综合处理方法在矿产资源预测中的应用

史殿林张玉君

(地矿部航空物探遥感中心)

摘要:本文以新疆黄山铜镍矿区作为试验区,通过分析已知矿床上的物化探、遥感等多元地学信息建立综合地学信息找矿模式,根据这一找矿模式。并综合利用图像处理、多元分析等技术手段对这一地区的断裂构造、岩性划分和矿产预测进行了研究,作出了构造解译图、岩性分类图和铜镍矿靶区图,首次明确圈定了黑山基性—超基性杂岩体,研究结果表明,利用航空物探、地面物化探以及遥感等多元地学信息建立统一格式的地学图像综合数据集并据此加以综合分析处理,这一思想为改进矿产勘查解释方法提供了新的潜力。

一、引言

目前,多元地学信息综合图像处理已引起地质信息处理解释人员的极大兴趣。

多元地学信息包括地质图、物化探异常、MSS或TM图像。本文所利用的地学信息计有:1∶5万的航磁、航放(K、Th、U)、航电(520Hz、2020Hz、8020Hz振幅谱)、1∶20万的区域重力和化探(Cu、Ni、Co)、MSS(4、5、7波段)。

为了综合分析上述地学信息,首先必须实现图像之间的相互配准,从而建立统一坐标的综合数据集,对该综合地学数据集进行图像处理和多元分析,结合已知地质资料,最终得到构造解释图、岩性分类图和矿产预测图。

二、多元地学图像的综合处理方法

本文根据测区内几个已知铜镍矿床利用多元地学图像来预测未知地区。整个工作都是在根据已知矿床建立的找矿模式的指导下进行的。因此我们首先研究多元地学信息找矿模式的问题。

1.多元地学信息找矿模式

分析测区内几个已知矿床,结合多元地学图像处理,可以得到本区多元地学信息找矿模式,见表1。

2.多元地学图像综合处理方法

地学领域中各种信息通常表现为二维图件的形式,这种相同的表示方式非常便于对这些信息进行综合处理。本文围绕着构造解释、岩性划分、矿产预测三大地质问题综合运用图像显示、增强、逻辑运算和多元分析技术,给出了多元地学图像综合处理流程。

表1

3.多元地学图像的主分量分析

主分量分析通常也称为KL变换,它是以图像的统计性质为基础的,其主要用途是用于数据压缩和旋转。本文采用主分量分析技术的目的在于减少综合数据,集中数据的相关性,压缩数据的维数,为岩性划分做准备。这里分别对航放三元素KThU图像、化探三元素CuNiCo图像、三频航电EM3图像和MSS图像进行了KL变换处理,取第一主分量。我们还对KThU和CuNiCo合成的6波段图像进行了KL变换,取前三个主分量。结果表明,KL变换基本保持了原来的有用信息,同时大大地减少了数据间的相关性。

4.多元地学模式识别

有关模式识别的任务有“模式分类”和“模式分析”。文中的模式识别是模式分类意义上的“识别”。采用的方法是聚类分析法。

前已述及,我们现有的地学信息计有:航磁(M)、重力(G)、航放(K)、(Th)、(U)、航电(EM520A)、(EM2020A)、(EM8020A)、化探(Cu)、(Ni)、(Co)、MSS(7)、MSS(5)、MSS(4)共14个参数。它们构成了一个14维模式空间,该空间的一个点就代表一种模式,换句话说,该空间中的模式可以由这样14个参数组成的向量来描述,在此称之为模式向量。可以认为该模式向量在一定程度上刻划了该地区的岩性变化,我们的目的就是将上述模式空间划分为若干个模式类,从而揭示该地区的岩性变化。

一般来说,这样一个模式空间中有许多相关的成分,它们对于分类贡献不大,而且给计算带来很大困难。因此,在进行分类之前,首先对模式空间进行降维处理。采用主分量分析技术,将原来由14维向量描述的模式变为用一个6维向量近似地描述。这6维向量分别为:KThU经KL变换后的第一主分量;CuNiCo经KL变换后的第一主分量;MSS经KL变换后的第一主分量;KM3经KL变换后的第一主分量;航磁灰度图像;重力灰度图像。这种处理办法不仅大大地降低了数据的维数,由前述的主分量分析的讨论可知,它也同时最大限度地保留了有用信息。

5.多元地学图像标志提取及成矿预测

根据所建立的找矿模式,采用图1给出的处理流程,得到铜镍矿产预测图。

图1多元地学信息标志提取及成矿预测流程图

三、结果讨论

1.岩性划分

利用多元地学模式识别技术,我们得到了多元地学图像模式分类图。该模式空间被划分为8个模式类。结合地质资料进行推断,这8个模式类分别对应基性—超基性岩,花岗质岩、下石炭统、中石炭统干洞组、中石炭统梧桐窝子组、第三系、第四系以及第三、四系互层。

2.矿产预测

根据图1的处理流程和已知矿床的资料,得到如下预测方程和判别准则:

Y=0.15X1+0.25X2+0.20X3+0.05X4+0.20X5+0.15X6

表2

预测结果见图2,其中除编号为4,6,7,9的靶区为已知含矿岩体外,其他均为本次工作提出的新的铜镍矿靶区,特别需要指出的是13号靶区,以往被解释为沉积岩,当地地质人员根据我们提供的成果资料经实地踏勘,证实该处为基性一超基性岩体,并命名为黑山岩体,计划今年开展详查工作,此外2号靶区与冶金部704队发现的香山岩体相吻合。

图2矿产预测图

四、结论

上述成果表明,利用航空物探与地面物化探以及遥感信息建立图像格式的综合数据集为改进矿产勘查解释方法提供了新的潜力。图像处理技术已成为多元地学信息综合解释的有力工具。

在建立综合数据集时,图像间的相互配准是关键问题。在选择标志时,应在充分研究已知矿床的基础上,遵循每门学科的基本原理和方法,利用图像处理快速成图的优点反复试验进行。

多元地学信息地质解释工作常常是以类比、统计为基础的。因此应尽可能收集有关资料,为进行类比、统计提供坚实的基础。

参考文献

[1]丁跃民.陆地卫星MSS图像与地学资料的综合处理及计算机成矿预测.环境遥感,1989,Vol.4,No.1.

[2]Cordell, L.Basement geology in the Southcast Missouri lead district interred from image analysis of aeromagnetic and data.Abstract of the Second Symposium on Exploration Geophysics, 1986,Xian,China,30—32。

原载〈计算机在地学中的应用讨论会论文摘要 〉,1991。

阅读全文

与多元分析方法中用于预测分析的是相关的资料

热点内容
食用油脂提炼的方法 浏览:832
指责沟通者训练方法 浏览:105
amdcpu风扇安装方法 浏览:34
太阳灸的使用方法 浏览:118
用什么方法瘦脸快 浏览:37
我的解决方法是有效的用英语翻译 浏览:424
健身吐舌的正确方法 浏览:870
西城区锅炉承包方式方法有哪些 浏览:88
管道内外丝的连接方法 浏览:830
鉴别还原糖与非还原糖的方法 浏览:438
八宝饭功效与作用及食用方法 浏览:736
脑萎缩性脑病的治疗方法有哪些 浏览:741
控糖有哪些方法 浏览:471
头痛最好按摩方法图片 浏览:189
个人手机电子邮箱申请方法 浏览:719
室内外机排水管安装方法 浏览:685
老早抓貂是用什么方法 浏览:226
同底数幂相乘简便方法 浏览:191
格栅棚安装方法 浏览:257
工业用电计算方法为什么乘于90 浏览:860