‘壹’ 数学建模高手戳进来!跪求解答
无量纲化处理的方法很多,有标准化处理法、极值处理法、线性比例法、归一化处理法、向量规范法和功效系数法,由于各种无量纲化方法的性质不同,最常用的就是标准化处理法、极值法和功效系数法。第三列直接加上1不合适,因为这样就完全改变了第三列的数据,建议采用其他方法做无量纲化。其实,我认为标准化后出现0也可以,但是要看标准化后数据对结果的影响程度,毕竟大和小的区别可以不大,但是有和无的区别有时就很明显。
‘贰’ 什么是无量纲处理
无量纲化(nondimensionalize 或者dimensionless)
将一个物理导出量用若干个基本量的乘方之积表示出来的表达式,称为该物理量的量纲式,简称量纲。 它是在选定了单位制之后,由基本物理量单位表达的式子。
目前常见的无量纲化处理方法主要有极值化、标准化、均值化以及标准差化方法,而最常使用的是标准化方法。但标准化方法处理后的各指标均值都为0,标准差都为1,它只反映了各指标之间的相互影响,在无量纲化的同时也抹杀了各指标之间变异程度上的差异,因此,标准化方法并不适用于多指标的综合评价中。而经过均值化方法处理的各指标数据构成的协方差矩阵既可以反映原始数据中各指标变异程度上的差异,也包含各指标相互影响程度差异的信息。
归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。
比如,复数阻抗可以归一化书写:Z = R + jωL = R(1 + jωL/R) ,复数部分变成了纯数量了,没有量纲。
另外,微波之中也就是电路分析、信号系统、电磁波传输等,有很多运算都可以如此处理,既保证了运算的便捷,又能凸现出物理量的本质含义。
在统计学中,归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。
归一化化定义:归一化就是要把需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保证程序运行时收敛加快。归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在某个区间上是统计的坐标分布。归一化有同一、统一和合一的意思。
如果是区间上的值,则可以用区间上的相对位置来归一化,即选中一个相位参考点,用相对位置和整个区间的比值或是整个区间的给定值作比值,得到一个归一化的数据,比如类似于一个概率值0<=p<=1;
如果是物理量,则一般可以统一度量衡之后归一,实在没有统一的方法,则给出一个自定义的概念来描述亦可;
如果是数值,则可以用很多常见的数学函数进行归一化,使它们之间的可比性更显然,更强,比如对数归一,指数归一,三角or反三角函数归一等,归一的目的可能是使得没有可比性的数据变得具有可比性,但又还会保持相比较的两个数据之间的相对关系,如大小关系,大的仍然大,小的仍然小,或是为了作图,原来很难在一张图上作出来,归一化后就可以很方便的给出图上的相对位置等;
从集合的角度来看,可以做维度的维一,即抽象化归一,把不重要的,不具可比性的集合中的元素的属性去掉,保留人们关心的那些属性,这样,本来不具有可比性的对象或是事物,就可以归一,即归为一类,然后就可以比较了,并且,人们往往喜欢用相对量来比较,比如人和牛,身高体重都没有可比性,但身高/体重的值,就可能有了可比性,人吃多少,牛吃多少,可能也没有直接的可比性,但相对于体重,或是相对于一天的各自的能量提供需要的食量,就有了可比性;这些,从数学角度来看,可以认为是把有纲量变成了无纲量了。
数据标准化方法(Data Normalization Method)
数据处理之标准化/归一化,形式上是变化表达,本质上是为了比较认识。数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。由于信用指标体系的各个指标度量单位是不同的,为了能够将指标参与评价计算,需要对指标进行规范化处理,通过函数变换将其数值映射到某个数值区间。
‘叁’ 如何对数据进行标准化处理
建议使用SPSS软件,具体方法如下:
1.打开spss软件,然后将界面切换到变量视图。在编辑列中创建观察指标和类型。图中示例创建两个指标,一个作为自变量,另一个作为因变量,分别是gdd和城市化水平,代表人均gdp和城市化水平。
‘肆’ 问卷中的指标有定性和定量问题,如何使其标准化消除量纲,达到指标的综合评价
量变即产生 性变 定性变
‘伍’ 指标的无量纲化处理
所谓无量纲化,也称为指标的规范化(或标准化),是通过数学变换消除原始指标单位及其数值数量级影响的过程,这是进行指标评估的前提。因此,指标有实际值和评估值两种形式。无量纲化过程就是将指标实际值转化为指标评估值的过程。地质资料社会化服务的评估指标均按照线性无量纲方法进行统一的量纲,而且在系统内一次性完成。为了改进评估方法,本部分先对无量纲化的处理方法做简要介绍。
从理论上讲,指标的无量纲化方法很多,归结起来可分为三大类:线性无量纲方法,非线性无量纲方法和定性指标的无量纲方法。
(一)线性无量纲方法
线性无量纲方法是指将指标实际值转化为不受量纲影响的指标评估值时,假定二者之间呈线性关系,指标实际值的变化引起指标评估值一个相应的比例变化。其常见的形式有阈值法、Z-score法和比值法。
1.阈值法
阈值法也称临界值法,是一种将指标实际值xi与该指标的某个阈值相对比,从而使指标实际值转化为评估值的方法。这里的阈值往往采用指标的极大值、极小值、满意值和不允许值等。其主要公式及特点等可参见表2-1,其中m为指标的观测值个数,yi为转化后的指标值,一般为评估方案的个数。
表2-1 阈值法无量纲变换
续表
2.Z-score法
即按照统计学的原理对实际指标进行标准化。
地质资料社会化服务评估研究
式中:yi为指标评估值; 为指标实际值的算术平均数; 为指标实际值;s为指标实际值的均方差, 。
3.比值法
即用指标的实际值与该指标的计划标准、历史标准或行业标准作比较,以消除指标里量纲的影响。其公式主要有两种形式:
地质资料社会化服务评估研究
(二)非线性无量纲化方法
1.折线形标准化函数
折线形标准化函数适合于事物发展呈现阶段性,指标值在不同发展阶段对事物总体水平的影响是不同的。构造折线形标准化函数与直线形不同之处在于必须找出事物发展的转折点的指标值并确定其评估值。常用的函数有以下两种类型:
(1)两折线形。采用两折线形标准化函数,指标值在不同时期其变化被赋予不同的评估值增量,分为凸折线形和凹折线形两种(图2-1)。
图2-1 两折线形标准化函数示意图
设折点的坐标值为(xm,ym),x轴表示指标的实际值,y轴表示指标的评估值,用阈值法可以构造如下折线形(凸折线形)公式:
地质资料社会化服务评估研究
凸折线形函数的特点是前期增量大而后期增量小(以折点为界);凹折线形函数的特点是后期增量大而前期增量小(以折点为界)。折线形函数适用于极本形和极小形指标。
图2-2 三折线形标准化函数示意图
(2)三折线形(图2-2)。三折线形标准化函数适用于:(1) 某些事物要求指标值在某些区间内变化,若超出这个区间则指标的变化对事物的总体水平几乎没有什么影响。(2) 居中型指标的标准化,即指标值过大或者过小都会对事物产生不利的影响。从理论上讲,折线形标准化方法比直线形标准化方法更符合事物发展的实际情况,但是其应用的前提是评估者必须对被评估事物有较为深刻的理解和认识,能够合理地确定出指标值的转折点及其评估值。
2.曲线形标准化函数
有些事物发展阶段的分界点不是很明显,而前中后各期发展阶段又截然不同,也就是说指标变化对事物总体水平的影响是逐渐变化的,而非突变。这种情况下,就必须采用曲线形标准化函数。常用的曲线形标准化函数及其特点见表2-2,其中,x表示指标的实际值,y表示指标的评估值。
表2-2 曲线形标准化公式
在对指标进行标准化时,要选择一种或者几种适合于评估对象性质的方法,然后分析不同的标准化方法对结论产生的影响,从而选择最合适的一种。除以上所说的常用标准化函数外,针对不同的事物可以构造更多的函数对指标进行标准化处理。
(三)定性指标的无量纲化
评估指标体系中经常包含一些定性的指标,为了和定量指标组成一个有机的评估体系,也必须对其进行标准化处理。较简单的处理方法是,首先借用主观赋权法的方法原理,对指标的不同描述进行评分,然后按指标属性特点选用标准化函数建立与定量指标相适应的指标评估值,也可以在主观评分的基础上直接计算指标评估值。
本评估指标体系中的满意度调查即采取该方法。
‘陆’ 无量纲化是什么意思如何进行无量纲化
将一个物理导出量用若干个基本量的乘方之积表示出来的表达式,称为该物理量的量纲式,简称量纲。 它是在选定了单位制之后,由基本物理量单位表达的式子。 有量纲的物理量都可以进行无量纲化处理 无量纲化出现在流体力学发展的早期,当时的数学方法和数值计算水平都很有限,为了对一些流体现象做出理论分析(如机翼和船体附近边界层的流动现象),需要将粘性流体控制方程加以简化,于是对目标流体赋予一个特征长度和特征速度。利用特征长度和特征速度(通常相对于边界层是一个较大的数)使得某些变量(如X,Y,V变成X/L《1或Y/L《1或V/U《1)这样就可以减少控制方程的变量数目。 对于边界层外的流动则采用不考虑粘性势流模型求解,无须简化。 所以说无量纲化在整个流体力学,尤其是空气动力学的发展历史中占有极为重要的地位。
‘柒’ 评价指标值的无量纲化
河南省土地资源生态安全评价指标标准化值的确定即指标值的无量纲化。由于定量指标的计量单位各不相同,不具有可比性,因此,在确定指标实际值之后,还必须解决指标间的可综合性问题,即进行指标的无量纲化处理,通过一定的数值变换来消除指标间的量纲影响。生态安全评价是多指标综合评价,指标涉及范围广,如果指标间没有统一的度量标准,则难以进行比较。为了使表示不同含义的各种指标能够综合起来表征生态安全,也需将各类指标无量纲化。
无量纲化的方法有三大类,即直线型无量纲化方法、折线型无量纲化方法和曲线型无量纲化方法。本次研究采用直线型无量纲化方法,将表示区域土地资源生态安全的各指标都化成以百分比为单位的指标值。在无量纲化过程中,生态安全指标的安全趋向性有正向和逆向之分,安全正向性即指标值越大越安全,相反,安全逆向性则为越小越安全。
假设Xi(i=1,2,…,n)为第i个指标的实际值,Si(i=1,2,…,n)为评价指标的基准值,P(Xi)为该指标的不安全指数标准化值,P'(Xi)为该指标的安全指数标准化值,具体确定过程如下:
(1)安全正向性指标,以2种情况确定。
1)如果以“安全”为标准值:
如
如
2)如果以“不安全”为标准值:
如
如
(2)安全逆向性指标,亦以2种情况确定。
1)如果以“安全”为标准值:
如
如
2)如果以“不安全”为标准值:
如
如
本次研究进行无量纲化处理,是为了消除不同指标之间由于不同量纲所带来的不可综合性问题,那么对于量化指标体系中,指标本身实际值就是相对数的情况,即指标本身实际值就是没有实际单位的,这种指标也需要进行无量纲化处理。因为,两个不同含义的相对数相加是没有现实意义的。两个指标的变动代表了不同的含义,不存在严格的一致性变化,而且有时两个指标的变化方向也是不同的,即安全指标具有正向和逆向属性。所以,如果把这类指标直接综合起来(相加或者相乘),就破坏了综合指标的同质性原则。基于上述的原因,本次研究在实证中,对所有指标的实际值统一进行了无量纲化处理。
(3)把不安全指数转换为安全指数,其公式如下:
河南省土地资源生态安全理论、方法与实践
‘捌’ 无量纲化处理方法经常用的是标准化方法。请问标准化方法具体是什么啊能否举实例啊
最典型的就是0-1标准化和Z标准化,也是最常用的。
1、0-1标准化(0-1 normalization)
也叫离差标准化,是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下:
其中max为样本数据的最大值,min为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。
2、Z-score 标准化(zero-mean normalization)
也叫标准差标准化,经过处理的数据符合标准正态分布,即均值为0,标准差为1,也是SPSS中最为常用的标准化方法,其转化函数为:
其中μ为所有样本数据的均值,σ为所有样本数据的标准差。
‘玖’ 指标无量纲化的方法
在经济管理学中,无量纲化方法是综合评价步骤中的一个环节。
根据指标实际值和无量纲化结果数值的关系特征可以分为三大类:
一、直线型无量纲化方法:又包括阀值法、指数法、标准化方法、比重法
二、折线型无量纲化方法:凸折线型法、凹折线型法、三折线型法
三、曲线型无量纲化方法
目前常见的无量纲化处理方法主要有极值化、标准化、均值化以及标准差化方法,而最常使用的是标准化方法。但标准化方法处理后的各指标均值都为0,标准差都为1,它只反映了各指标之间的相互影响,在无量纲化的同时也抹杀了各指标之间变异程度上的差异,因此,标准化方法并不适用于多指标的综合评价中。而经过均值化方法处理的各指标数据构成的协方差矩阵既可以反映原始数据中各指标变异程度上的差异,也包含各指标相互影响程度差异的信息
‘拾’ 无量纲指标评价方法有
目前人们已提出的无量纲化方法名称很多,如综合指数法、极差变换法、高中差变换法、低中差变换法、均值化法、标准化法、比重法、功效系数法、指数型功效系数法、对数型功效系数法、正态化变换法等等。苏为华教授将它们归为四类:广义指数法、广义线性功效系数法、非线性函数法、分段函数法[1]。则广义指数法和广义线性功效系数法包含了前8种,都是线性无量纲化方法;后三种属于非线性函数法,也即曲线型无量纲化方法。由于指数或对数变换时,曲线的增减速度、凹凸程度很难把握,所以实践中非线性函数法较少被采用。
实践中应用较多的是属于直线型无量纲化方法的极差变换法、标准化法和均值化法。下面对这三种方法进行比较分析。
设综合评价中共有n个单位,m个指标,各指标分别为x1,x2,…,xm,用xij(i=1,2,…,n;j=1,2,…,m)表示第i个单位的第j个原始指标值,yij表示经过无量纲化处理的第i个单位的第j个指标值。极差变换法即令
(3)
式(3)中的分母仅与原始指标的最大值和最小值有关,而与指标的其它值无关。当xj的最大值与最小值之差很大时,yj值就会过小,相当于降低了第j个指标的权重;相反,当xj的最大值与最小值之差很小时,yj值就会过大,相当于提高了第j个指标的权重。即指标的两个值就对指标的权重产生了很大影响。所以在多指标综合评价中,用极差变换法作为无量纲化的方法是不可取的。
目前最普遍使用的无量纲化方法是标准化法,标准化法即令
(4)
其中和σj分别是指标xj的均值和标准差。经标准化后,指标yj的均值为0,方差为1,消除了量纲和数量级的影响。同时标准化法也消除了各指标变异程度上的差异,因此经标准化后的数据不能准确反映原始数据所包含的信息,导致综合评价的结果不准确。从下例可以看出:
例1、对十个省市的全部国有及规模以上非国有工业企业的经济效益进行综合评价。为直观起见,只选用全员劳动生产率和产品销售率两个指标,指标值见表2。根据国家经贸委等部门颁布的《工业经济效益评价体系》两个指标的权数分别为10和13。
表2 十省市劳动生产率和产品销售率
地区
北京
天津
河北
山西
内蒙古
辽宁
吉林
黑龙江
上海
江苏
劳动生产率(元)
69539
58984
45576
27988
37770
48170
47306
68104
95393
57177
产品销售率(%)
98.17
98.02
98.05
97.06
97.93
97.33
96.94
97.61
98.83
97.06
由表2易见,各地区的产品销售率非常接近,而全员劳动生产率相差较大。它们的变异系数分别为0.0062和0.3419也说明了这一点。所以若用这两个指标来评价经济效益,则很显然主要的影响因素应是全员劳动生产率。
但是,若用标准化法对两个指标进行无量纲化,将使两个指标的变异程度相同,因为产品销售率的权数大,因而产品销售率对经济效益的影响会比全员劳动生产率大。评价结果见表3
表3 十省市标准化法评价结果对照
地区
北京
天津
河北
山西
内蒙古
辽宁
吉林
黑龙江
上海
江苏
评价得分
0.76
0.38
0.10
-1.23
-0.19
-0.51
-0.90
0.20
1.96
-0.56
评价名次
2
3
5
10
6
7
9
4
1
8
销售率名次
2
4
3
8
5
7
10
6
1
8
从表3可见评价名次与产品销售率名次相差不大,这显然是不合理的。
所以必须改进原始数据的无量纲化方法,均值化方法就是一种较好的方法。均值化方法即令
(5)
均值化后各指标的均值都为1,其方差为
(6)
即均值化后各指标的方差是各指标变异系数的平方,它保留了各指标变异程度的信息。
对于例1,若用均值化方法对两个指标进行无量纲化,则因全员劳动生产率的变异系数比产品销售率的变异程度大得多,因而全员劳动生产率是经济效益综合评价的主要影响因素。评价结果见表4
表4 十省市均值化法评价结果对照
地区
北京
天津
河北
山西
内蒙古
辽宁
吉林
黑龙江
上海
江苏
评价得分
1.11
1.03
0.92
0.78
0.86
0.94
0.93
1.10
1.32
1.01
评价名次
2
4
8
10
9
6
7
3
1
5
劳动生产率名次
2
4
8
10
9
6
7
3
1
5
由表4可知,评价名次与全员劳动生产率的名次完全一致,这与实际情况是相符的。即用均值化法比用标准化法合理。
那么,是否我们就应该用均值化方法作为指标的无量纲化方法呢?这也要具体问题具体分析。在实际问题中,情况是复杂的,有时需要保留指标的变异信息,有时需要消除指标的变异信息。用下面的例子即可说明。