2023年12月27日发(作者:阳光同学5下数学试卷答案)

重庆工商大学数学与统计学院

《统计专业实验》课程

实验报告

实验课程: 统计专业实验

指导教师: ____叶勇

专业班级: 09级统计二班

学生姓名: ___陈文慧

学生学号: __2009101218

实 验 报 告

实验项目

实验日期

实验目的

实验内容

实验七 因子分析和综合评价

2012.04.24

实验地点

80608

了解因子分析的原理,并掌握因子分析和综合评价过程。

对2008年重庆市40个区县经济发展基本情况进行分析,选择合适的分析变量,找出影响地区社会经济发展水平的主要因子,并对各地区发展水平进行综合评价或者对各地区经济发展状况进行分类。

实验思考题解答:

1.分析因子分析和主成分分析的异同,并写出各自的数学表达式。

答:因子分析和主成分分析有许多相似之处,但这两种模型又存在明显的不同。

两者均是降维、简化数据的分析方法。

主成分分析:它的数学模型本质上是一种线性变换,是将原始坐标变换到变异程度大的方向上去,相当于从空间上转换观看数据的角度,突出数据的变异方向,归纳重要信息。

数学表达式:YTX

因子分析:从本质上看是从显在变量去“提炼”潜在因子的过程。通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。

数学表达式:XAF

2.变量共同度和公因子的方差贡献率的数学形式?

2haij2ij1m\'变量共同度:,即第i行因子载荷的平方和,它描述的是全部公共因子对变量Xi的总方差所做的贡献,反映了公共因子对变量公因子的方差贡献率:g2jXi的影响程度。

ai1p2ij,即第j列的因子载荷的平方和,表示同一公共因子Fj对各个变量所提供的方差贡献之和,它是衡量每一个公共因子相对重要性的一个尺度。

实验运行程序、基本步骤及运行结果:

1. 选择合适的分析变量

本实验是对2008年重庆市40个区县经济发展基本情况进行分析,分别从经济实力、工业化水平、经济潜在活力和效益三个层面对经济发展水平进行分析。选取了10个指标:

X1

地区生产总值(万元)

X2

一 般预算收入(万元)

X3

农林牧渔业总 产 值(万元)

X4

工业总产值(万元)

X5

建筑业总产值(万元)

X6

全社会固定资产投X7

社会消费品零售总X8

城乡居民X9

公路货运量(万吨)

人资(万元) 额(万元) 储蓄

2.进行因子分析

(1)选择Analyze→Data Reduction→Factor,打开Factor Analysis主界面,并将变量X1~X8,移入Variables框中;

(2)点击Descriptives按钮,选Coefficients复选框,输出相关系数;选中KMO and Bartlett’s

test of sphericity复选框,检验因子分析的适用条件;按Continue按钮返回主界面。

(3)点Extraction按钮,设置因子提取的选项。选Scree Plot复选框,输出碎石图,按Continue按钮返回主界面。

(4)点Rotation按钮,设置因子旋转方法。选Varimax复选框,选择方差最大化旋转方法,按Continue按钮返回主界面。

(5)单击Scores按钮,设置因子得分的选项。选Display factor score coefficient matrix

显示因子得分函数系数矩阵,选Save as variable,保存因子得分,按Continue按钮返回主界面。

(6)点OK按钮开始因子分析过程。得到的数据结果如下:

相关系数矩阵:由相关系数矩阵看出各个变量之间存在较强的相关性,所以可以采用因子分析方法进行降维。

Correlation Matrix

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10

Correlation X1 1.000 .815 .090 .805 .929 .809 .896 .940 .535 .932

X2

X3

X4

X5

X6

X7

X8

X9

.815 1.000 -.128 .715 .779 .836 .862 .840 .508 .804

.090 -.128 1.000 -.097 .047 .085 -.149 -.016 .049 -.030

.805 .715 -.097 1.000 .804 .831 .612 .659 .531 .721

.929 .779 .047 .804 1.000 .835 .838 .874 .461 .911

.809 .836 .085 .831 .835 1.000 .699 .744 .605 .764

.896 .862 -.149 .612 .838 .699 1.000 .970 .416 .913

.940 .840 -.016 .659 .874 .744 .970 1.000 .448 .939

.535 .508 .049 .531 .461 .605 .416 .448 1.000 .484

X10 .932 .804 -.030 .721 .911 .764 .913 .939 .484 1.000

KMO and Bartlett\'s Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy.

Bartlett\'s Test of Sphericity Approx. Chi-Square

df

Sig.

.821

568.556

45

.000

变量共同度:可以看到变量共同度都很高,表面因子对变量的影响程度高。

Communalities

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

Initial

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

Extraction

.945

.832

.937

.699

.889

.819

.879

.889

.410

.897

特征根与方差贡献率:有两个因子的特征值超过1,且前两个的累积方差贡献率已经超过了百分之八十,因此应该提取两个因子。

Total Variance Explained

Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared LoaComponent Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulat1

2

3

4

5

6

7

8

9

10

7.107

1.088

.792

.466

.279

.116

.060

.060

.017

.015

71.074

10.885

7.920

4.657

2.792

1.158

.602

.598

.168

.146

71.074 7.107

81.959 1.088

89.879

94.536

97.328

98.486

99.088

99.686

99.854

100.000

71.074

10.885

71.074 7.107

81.959 1.089

71.071

10.888

78

因子载荷矩阵本实验中旋转前后得到的因子载荷阵中个系数都有明显的两极分化。第一个公共因子在指标X1、X2、X4、X5、X6、X7、X8、X9、X10上有较大载荷,说明这个9个指标有较强的相关性,可归为一类,他们都属于衡量经济发展水平的正向指标。第二个公共因子在X3上有较大载荷,单独一类。农业产值随经济发展水平的提高,会减少,它属于逆向指标。

Component Matrix

a

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

1

Component

2

.968

.902

-.023

.836

.941

.891

.916

.941

.598

.946

.092

-.133

.968

-.010

.060

.159

-.199

-.056

.229

-.041

Rotated Component Matrix

a

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

1

Component

2

.968

.901

-.016

.836

.941

.892

.915

.941

.599

.946

.086

-.139

.968

-.015

.053

.153

-.205

-.063

.225

-.048

因子转换矩阵:若用A表示旋转前的因子载荷阵,用B表示因子转换矩阵,用C表示旋转后的因子载荷阵,则有:CAB

Component Transformation Matrix

Component

1

2

1

1.000

.007

2

-.007

1.000

因子得分系数矩阵:根据每个观测值的各因子的的分数,可以将旋转后的因子得分表达式写成:

F10.137X10.126X20.003X30.118X40.133X50.126X60.128X70.132X80.086X90.133X10F20.084X10.123X20.889X30.010X40.054X50.146X60.183X70.053X80.210X90.039X10

Component Score Coefficient Matrix

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

1

Component

2

.137

.126

.003

.118

.133

.126

.128

.132

.086

.133

.084

-.123

.889

-.010

.054

.146

-.183

-.053

.210

-.039

(7)分析各公因子的含义,并进行命名。

F1:非农业因子(反映的是除农业以外的正向经济指标)

F2:农业因子(反映的是农业总产值经指标)

(8)使用Compute命令计算综合因子得分,以特征值为各公因子的权数。

F=iFii1m7.1071.089F1F20.867F10.133F2

7.107+1.0897.107+1.089刚刚已经将因子得分作为新变量保存在数据文件中,变量名分别为fact_1、fact_2,现在可以直接使用。Transform->Compute Variables,调出计算界面,目标变量命名为“综合因子得分”,将上面的公式带入,计算得到各个区县的综合得分。

对分数进行排序,得到最终结果如下:

因子1得分

2.294

因子2得分

0.619

综合得分

2.071

1.980

1.410

1.375

1.206

1.190

1.083

0.899

0.824

0.821

0.817

0.547

0.249

0.212

0.038

-0.044

-0.131

-0.281

-0.287

-0.306

因子1得分

-0.446

-0.509

-0.541

-0.560

-0.579

-0.627

-0.647

-0.658

因子2得分

0.577

0.608

0.306

0.357

0.163

0.264

0.272

0.345

综合得分

-0.310

-0.360

-0.428

-0.438

-0.481

-0.508

-0.524

-0.525

-0.684

-0.703

-0.713

-0.737

-0.780

-0.792

-0.835

-0.841

-0.845

-0.977

-1.086

-1.105

区县

渝北区

九龙坡区

渝中区

沙坪坝区

万州区

江北区

南岸区

巴南区

永川区

江津区

涪陵区

合川区

北碚区

长寿区

綦江县

大渡口区

开 县

铜梁县

荣昌县

璧山县

排序

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

区县

大足县

潼南县

南川区

垫江县

梁平县

忠 县

奉节县

云阳县

丰都县

万盛区

黔江区

彭水县

石柱县

武隆县

巫山县

酉阳县

秀山县

巫溪县

双桥区

城口县

排序

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

2.428 -0.942

1.986 -2.345

1.808 -1.450

1.139 1.639

1.580 -1.354

1.366 -0.759

0.882

0.720

0.589

0.783

0.356

0.147

1.010

1.499

2.340

1.036

1.797

0.636

-0.767 -0.144

-0.714 -0.633

-0.722 -0.655

-0.799 -0.335

-0.843 -0.370

-0.824 -0.583

-0.885 -0.511

-0.920 -0.325

-0.877 -0.639

-1.008 -0.772

-1.022 -1.498

-1.092 -1.196

0.371 -0.545

-0.138 1.188

0.075 -0.818

-0.313 1.055

-0.345 0.143

-0.399 0.445

-0.287 -0.425

(9)比较各地区综合因子得分,结合实际情况进行分析。

从表上可以看出,综合得分最高的是渝北区、九龙坡区、渝中区,排名靠前的主要是主城各区,排名靠后的则是以城口、双桥、巫溪、秀山、石柱为代表的区县,基本上代表了重庆市的社会经济现状。

由结果得知,一小时经济圈内的综合得分排位都比较靠前,这与中心区域经济效益相符合。其中渝北区、九龙坡区、沙坪坝区、南岸区和江北区拥有较好的工业园区,在工业、建筑业等基础性产业上其产值有明显的优势,而这些优势又会带动其整体经济发展,所以排在前面。渝中区的解放碑区域是重庆的金融中心,也是消费中心,所以也排在前面。

万州区、巴南区、永川区、江津区、江津区、涪陵区、合川区整体水平较好,农业发展较好。

综上,三峡库区边远区市县表现较为一致,作为第一类,其主要特征是综合实力、非农业实力因子和农业实力因子的得分均较低,整体经济基础薄弱,社会生产力水平低下;而以荣昌、大足、璧山、綦江为代表的成渝和渝黔线区市县为第二类,其特征是非农业实力因子得分低,农业实力因子得分较高,综合实力得分得分较低;其他以渝北区、沙坪坝区、渝中区为代表的主城各区及少数经济发展较好的区市县为第三类,其主要特征是综合实力得分和非农业实力因子均较高。

由各区市县的综合得分比较结果可以很好地解释重庆市政府制定的整体经济发展战略,将整个重庆划分为都市经济发达圈、渝西经济走廊和三峡库区生态经济带的发展思路,三个经济区域针对各自特点确定经济发展方向和重点。


更多推荐

因子,经济,得分,发展,变量,综合,水平,进行