2024年1月25日发(作者:上海专升本数学试卷)
随机数学建模方法及其应用
It was last revised on January 2, 2021
随机数学建模方法及其应用
学院:数学与计算机科学学院
回归分析法概述
回归分析法是通过研究两个或两个以上变量之间的相关关系,运用数理统计方法从事物的抑制状况预测未来的一种信息研究定量方法。
优点:首先它利用降维技术用少数几个综合变量来代替原始多个变量,综合变量集中了原始变量的大部分信息。其次它通过计算综合主成分函数得分,对客观经济现象进行科学评价。再次它在应用上侧重于信息贡献影响力综合评价。
缺点:是当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确。命名清晰性低。
案例分析
以某医院的病例调查为例,对多元线性回归的显着性判断进行说明。
某医院为了解病人对医院工作的满意程度、病人的年龄、病情的严重程度、病人的忧虑程度之间的关系随机调查该医院的10位病人,可得到如下表格。
年龄
50
36
40
41
28
49
42
45
52
29
步骤:
1、将数据导入spss
2、打开分析--回归--- 线性
3、依次打开界面的每个选项进行对应选择。可得到以下结果。
模型汇总b
病情程度
51
46
48
44
43
54
50
48
62
50
忧虑程度
满意度
48
57
66
70
89
36
46
54
26
77
模型
1
R
.960a
R 方
.922
调整 R 方
.883
标准 估计的误差
a. 预测变量: (常量), 忧虑程度, 年龄, 病情程度。
b. 因变量: 满意度
Anovab
模型
1
回归
残差
总计
平方和
df
3
6
9
均方
F
Sig.
.001a
a. 预测变量: (常量), 忧虑程度, 年龄, 病情程度。
b. 因变量: 满意度
系数a
非标准化系数
模型
1
(常量)
年龄
病情程度
忧虑程度
a. 因变量: 满意度
B
标准 误差
.389
.799
标准系数
试用版
t
Sig.
.000
.024
.545
.163
由上表出:
预测值
残差
标准 预测值
标准 残差
a. 因变量: 满意度
极小值
残差统计量a
极大值
.782
均值
.000
.000
.000
标准 偏差
.816
N
10
10
10
10
可以得y175.52491.1713x10.5117x219.645x3
聚类分析法概述
聚类分析法是将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元素的相似性更强。目的在于使类
间元素的同质性最大化和类与类间元素的异质性最大化。其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似
优点:聚类分析模型的优点就是直观,结论形式简明。
缺点:在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试间内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。
案例分析
某教育研究所根据相关数据欲对北京18个区县中职教育发展进行聚类研究。包括每万人的中职在校生数、每万人的中职招生数、每万人的中职毕业生数、每万人的中职专任教师数、专任教师中本科以上学历者占的比例等。数据表格如下
东城 156
西城 119
崇文 202
宜武 176
朝阳 221
海淀 169
丰台 166
石景192
山
门头127
湾
房山 115
昌平 232
顺义 67
通县 98
大兴 205
平谷 81
怀柔 121
密云 84
延庆 78
步骤为:
1、将数据导入spss
2、打开分析----分类---系统聚类
53
42
72
57
77
64
66
61
53
38
80
35
40
76
39
52
41
31
45
31
57
31
45
42
48
52
33
25
66
17
25
67
21
27
22
23
15
13
16
17
17
13
15
19
30
10
19
5
7
16
7
12
6
5
701
552
633
584
553
573
465
535
376
618
491
403
474
616
533
637
618
424
5356
6449
5357
6432
6625
5840
5532
5695
3904
7020
5089
3056
5559
4990
2518
4149
4376
4677
3、在聚类界面依次进行相应项目,进行勾选。可得如下结果。
聚类表
群集组合
阶
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
群集 1
2
10
5
2
8
3
6
4
1
4
1
2
1
2
1
1
1
群集 2
13
18
7
10
9
14
8
6
12
5
17
4
16
11
3
2
15
系数
.000
.000
.000
.000
.000
.000
.000
.000
.001
.001
.001
.002
.003
.004
.006
.017
.095
首次出现阶群集
群集 1
0
0
0
1
0
0
0
0
0
8
9
4
11
12
13
15
16
群集 2
0
0
0
2
0
0
5
7
0
3
0
10
0
0
6
14
0
下一阶
4
4
10
12
7
15
8
10
11
12
13
14
15
16
16
17
0
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
西城 2 -+
通县 13 -+
房山 10 -+
延庆 18 -+
朝阳 5 -+
丰台 7 -+
石景山 8 -+-------+
门头湾 9 -+ |
海淀 6 -+ |
宜武 4 -+ +---------------------------------------+
昌平 11 -+ | |
崇文 3 -+-+ | |
大兴 14 -+ | | |
东城 1 -+ +-----+ |
顺义 12 -+ | |
密云 17 -+-+ |
怀柔 16 -+ |
平谷 15 -------------------------------------------------+
判别分析法概述
判别分析又称\"分辨法\",是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。
优点:用这种方法得出的数据比较接近实际;另外,采用这种方法,便于确定分配给各销售人员的销售任务,发挥其积极性,他们努力完成各自的销售任务。
缺点:由于受各种因素的影响,就比如销售人员的预测也会出现偏差,对销售人员的预测往往需要进行修正。
案例分析
为研究1991年中国城镇居民月平均收入状况,现将30个省、市、自治区为为三类。试根据已有数据,研究广东、广西分别属于哪个收入类别?数据如下。
1 北京
2 天津
3 河北 11 12
4 上海 31
5 山东
6 湖北
7 广西
8 海南
9 四川
10 云南
11 新疆
1 山西
内蒙2
古
3 吉林
黑龙4
江
5 江西
6 河南
7 贵州
8 陕西
9 甘肃
10 青海
11 宁夏
1 辽宁
2 江苏
3 浙江 13
4 安徽
5 福建
6 湖南 124
1 广东 114
2 西藏 0
分别为:人均生活费收入、人均各种奖金、超额工资、人均国有经济单位职工工资、人均各种津贴、人均来源国有经济单位标准工资、人均工作单位得到的其他收入、人均集体所有制工资收入、个体劳动者收入、人均集体所有制职工标准工资。
步骤为:
1、将数据导入到spss中
2、打开分析---分类---判别
3、在判别界面上进行相应操作,并选定。可得如下结果。
组统计量
组均值的均等性的检验
V3
V4
V5
V6
V7
V8
V9
V10
V11
Wilks 的 Lambda
.916
.915
.976
.920
.973
.889
.866
.983
.864
F
.368
.374
.099
.349
.109
.501
.619
.068
.631
df1
2
2
2
2
2
2
2
2
2
df2
8
8
8
8
8
8
8
8
8
Sig.
.703
.699
.907
.715
.898
.624
.562
.935
.556
主成分分析概述
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
优点:1、可消除评估指标之间的相关影响。因为主成分分析法在对原始数据指标变量进行变换后形成了彼此相互独立的主成分,而且实践证明指标间相关程度越高,主成分分析效果越好。
2、可减少指标选择的工作量,对于其他评估方法,由于难以消除评估指标间的相关影响,所以选择指标时要花费不少精力,而主成分分析法由于可以消除这种相关影响,所以在指标选择上相对容易些。
3、主成分分析中各主成分是按方差大小依次排列顺序的,在分析问题时,可以舍
弃一部分主成分,只取前面方差较大的几个主成分来代表原变量,从而减少了计算工作量。用主成分分析法作综合评估时,由于选择的原则是累计贡献率≥85%,不至于因为节省了工作量却把关键指标漏掉而影响评估结果。
缺点:1、在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。
2、主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。
3、当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确。
案例分析
第三产社会消地人均农 业 工 业 固定资基本建海关出地方财GDP 业增加费品零区 GDP 增加值 增加值 产投资 设投资 口总额 政收入
值 售总额
辽 13000
宁
山10550 11643
东
河 9047
北
天 22068
津
江10636 14397
苏
上 40627
海
浙7670 16570
江
福4682 13510
建
广11770 15030
东
广 5062 367
西
步骤:
1、将数据导入spss
2、打开分析---降维---因子分析
3、对应界面完成相应操作,并勾选。可得结果如下
描述统计量
GDP
人均GDP
农 业 增加值
工 业 增加值
第三产业增加值
固定资产投资
基本建设投资
社会消费品零售总额
海关出口总额
地方财政收入
均值
标准差
分析 N
10
10
10
10
10
10
10
10
10
10
相关矩阵a
相关
GDP
人均GDP
农 业 增加值
工 业 增加值
第三产业增加值
固定资产投资
基本建设投资
社会消费品零售总额
海关出口总额
地方财政收入
GDP
.967
.979
.923
.922
.941
.637
.826
人均GDP
.113
.074
.214
.093
.081
.273
农 业 增加值
.013
工 业 增加值
.967
.113
.985
.963
.939
.935
.705
.898
第三产业增加值
.979
.074
.985
.973
.940
.962
.714
.913
a. 此矩阵不是正定矩阵。
相关矩阵a
相关
固定资产投资
GDP
人均GDP
农 业 增加值
工 业 增加值
.923
.214
.963
基本建设投资
.922
.093
.939
社会消费品零售总额
.941
.013
.935
第三产业增加值
固定资产投资
基本建设投资
社会消费品零售总额
海关出口总额
地方财政收入
a. 此矩阵不是正定矩阵。
.973
.971
.937
.717
.934
.940
.971
.897
.624
.848
.962
.937
.897
.836
.929
相关矩阵a
相关
GDP
人均GDP
农 业 增加值
工 业 增加值
第三产业增加值
固定资产投资
基本建设投资
社会消费品零售总额
海关出口总额
地方财政收入
海关出口总额
.637
.081
.705
.714
.717
.624
.836
.882
地方财政收入
.826
.273
.898
.913
.934
.848
.929
.882
a. 此矩阵不是正定矩阵。
公因子方差
GDP
人均GDP
农 业 增加值
工 业 增加值
第三产业增加值
固定资产投资
基本建设投资
社会消费品零售总额
海关出口总额
地方财政收入
提取方法:主成份分析。
初始
提取
.938
.691
.470
.957
.978
.970
.897
.985
.642
.927
解释的总方差
初始特征值
成份
1
2
3
4
5
6
7
8
9
10
合计
.877
.547
.085
.021
.012
.002
.001
方差的 %
.854
.211
.119
.018
.012
累积 %
合计
提取平方和载入
方差的 %
累积 %
提取方法:主成份分析。
成份矩阵a
GDP
人均GDP
农 业 增加值
工 业 增加值
第三产业增加值
固定资产投资
基本建设投资
社会消费品零售总额
海关出口总额
地方财政收入
提取方法 :主成分分析法。
a. 已提取了 2 个成份。
1
成份
2
.949
.112
.978
.986
.983
.947
.977
.800
.954
.195
.677
.070
.176
因子分析法概述
因子分析法是指从研究指标相关矩阵内部的依赖关系出发,把一些信息重叠、具有错综复杂关系的变量归结为少数几个不相关的综合因子的一种多元统计分析方法。
应用范围为:解决共线型问题、评价问卷的结构效度、寻找变量间潜在的结构、内在结构证实
案例分析
下表资料为25位健康人的7项生化检验结果,7项生化检验指标依次命名为X1到X7,数据如下。
X1
步骤为:
1、把数据导入spss
2、打开分析---降维---因子分析
3、在所打开的界面进行相应操作,并勾选。结果如下
描述统计量
X2
7
X3
1
X4
12
X5
X6
X7
X1
X2
X3
均值
标准差
分析 N
25
25
25
X4
X5
X6
X7
相关矩阵
25
25
25
25
X1
.580
.201
.909
.283
.287
X2
.580
.364
.837
.166
.261
X3
.201
.364
.436
X4
.909
.837
.436
.163
.203
X5
.283
.166
.163
.990
.427
X6
.287
.261
.203
.990
.357
X7
.427
.357
相关
X1
X2
X3
X4
X5
X6
X7
成份矩阵a
X1
X2
X3
X4
X5
X6
X7
成份
1
.746
.796
.709
.910
2
.489
.372
.389
.963
.972
.219
提取方法 :主成分分析法。
a. 已提取了 2 个成份。
公因子方差
X1
X2
X3
X4
X5
X6
X7
提取
.797
.773
.859
.980
.983
.976
.834
描述统计量
X1
X2
X3
X4
X5
X6
均值
标准差
分析 N
25
25
25
25
25
25
提取方法:主成份分析。
解释的总方差
提取平方和载入
成份
1
2
合计
方差的 % 累积 %
旋转平方和载入
合计
方差的 % 累积 %
提取方法:主成份分析。
旋转成份矩阵a
X1
X2
X3
X4
X5
X6
X7
提取方法 :主成分分析法。
1
成份
2
.878
.878
.421
.990
.159
.214
.161
.033
.004
.979
.964
.547
旋转法 :具有 Kaiser 标准化的正交旋转法。
a. 旋转在 3 次迭代后收敛。
成份转换矩阵
成份
1
1
.921
2
2 .389 .921
提取方法 :主成分分析法。
旋转法 :具有 Kaiser 标准化的正交旋转法。
成份得分系数矩阵
成份
X1
X2
X3
X4
X5
X6
X7
1
.270
.268
.110
.301
.070
.087
2
.075
.031
.023
.343
.339
.173
提取方法 :主成分分析法。
旋转法 :具有 Kaiser 标准化的正交旋转法。
构成得分。
成份得分协方差矩阵
成份
1
2
1
.000
2
.000
提取方法 :主成分分析法。
旋转法 :具有 Kaiser 标准化的正交旋转法。
构成得分。
分析结果可得:最后得到的第一个因子和第二个因子又可以代入到原始数据中,进而在此进行进一步分析。成份矩阵a
更多推荐
成分,变量,方法
发布评论