2024年1月8日发(作者:部队四年级数学试卷)
WORD格式..可编辑
《统计分析与SPSS的应用(第五版)》(薛薇)
课后练习答案
第9章SPSS的线性回归分析
1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。
选择fore和phy两门成绩体系散点图
步骤:图形旧对话框散点图简单散点图定义将fore导入Y轴,将phy导入X轴,将sex导入设置标记确定。
接下来在SPSS输出查看器中,双击上图,打开图表编辑
专业知识整理分享
WORD格式..可编辑
在图表编辑器中,选择“元素”菜单选择总计拟合线选择线性应用再选择元素菜单点击子组拟合线选择线性应用。
专业知识整理分享
WORD格式..可编辑
分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。但回归直线的拟合效果都不是很好。
2、请说明线性回归分析与相关分析的关系是怎样的?
相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。
线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。
3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?
检验其可信程度并找出哪些变量的影响显著、哪些不显著。
主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、残差分析等。
专业知识整理分享
WORD格式..可编辑
线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释变量和解释变量之间确实存在显著的线性关系。
回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当。一般包括回归系数的检验,残差分析等。
4、请说明SPSS多元线性回归分析中提供了哪几种解释变量筛选策略?
向前、向后、逐步。
5、先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量的主要因素。数据文件名为“粮食总产量.sav”。
方法:采用“前进“回归策略。
步骤:分析回归线性将粮食总产量导入因变量、其余变量导入自变量方法项选“前进”确定。 如下图:(也可向后、或逐步)
已输入/除去变量
模型
1
已输入变量
施用化肥量(kg/公顷)
已除去变量 方法
向前(准则:. F-to-enter 的概率 <= .050)
a 专业知识整理分享
WORD格式..可编辑
2
风灾面积比例(%)
向前(准则:. F-to-enter 的概率 <= .050)
向前(准则:3
年份 . F-to-enter 的概率 <= .050)
4
总播种面积(万公顷)
向前(准则:. F-to-enter 的概率 <= .050)
a. 因变量:粮食总产量(y万吨)
模型摘要
调整后的 R 平模型
1
2
3
4
R
.960
.975
.984
.994
dcbaR 平方
.922
.950
.969
.989
方
.919
.947
.966
.987
标准估算的错误
2203.30154
1785.90195
1428.73617
885.05221
a. 预测变量:(常量),施用化肥量(kg/公顷)
b. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%)
c. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份
d. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷)
ANOVA
模型
1 回归
残差
总计
2 回归
残差
总计
3 回归
残差
总计
4 回归
残差
总计
平方和
1887863315.616
160199743.070
2048063058.686
1946000793.422
102062265.263
2048063058.686
1984783160.329
63279898.356
2048063058.686
2024563536.011
23499522.675
2048063058.686
自由度 均方 F
388.886
显著性
.000
ba1 1887863315.616
33
34
2
32
34
3
31
34
4
30
34
4854537.669
973000396.711
3189445.789
305.069 .000
c
661594386.776
2041287.044
324.106 .000
d
506140884.003
783317.423
646.150 .000
e
a. 因变量:粮食总产量(y万吨)
b. 预测变量:(常量),施用化肥量(kg/公顷)
专业知识整理分享
WORD格式..可编辑
c. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%)
d. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份
e. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷)
系数
非标准化系数
模型
1 (常量)
施用化肥量(kg/公顷)
2 (常量)
施用化肥量(kg/公顷)
风灾面积比例(%)
3 (常量)
施用化肥量(kg/公顷)
风灾面积比例(%)
年份
4 (常量)
施用化肥量(kg/公顷)
风灾面积比例(%)
年份
总播种面积(万公顷)
a. 因变量:粮食总产量(y万吨)
B
17930.148
179.287
20462.336
193.701
-327.222
-460006.046
137.667
-293.439
244.920
-512023.307
139.944
-302.324
253.115
2.451
标准错误
504.308
9.092
720.317
8.106
76.643
110231.478
14.399
61.803
56.190
68673.579
8.925
38.305
34.827
.344
.749
-.171
.334
.141
.737
-.166
.323
1.037
-.185
.960
标准系数
贝塔 t
35.554
19.720
28.407
23.897
-4.269
-4.173
9.561
-4.748
4.359
-7.456
15.680
-7.893
7.268
7.126
显著性
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
a
结论:如上4个表所示,影响程度中大到小依次是:施用化肥量(kg/公顷), 风灾面积比例(%),
年份, 总播种面积(万公顷)。(排除农业劳动者人数(百万人)和粮食播种面积(万公顷)对粮食总产量的影响)
剔除农业劳动者人数(百万人)和粮食播种面积(万公顷)后:
步骤:分析回归线性将粮食总产量导入因变量、其余4个变量(施用化肥量(kg/公顷),
风灾面积比例(%), 年份, 总播种面积(万公顷))导入自变量方法项选“输入”确定。 如下图:
专业知识整理分享
WORD格式..可编辑
系数
非标准化系数
模型
1 (常量)
年份
总播种面积(万公顷)
施用化肥量(kg/公顷)
风灾面积比例(%)
a. 因变量:粮食总产量(y万吨)
B
-512023.307
253.115
2.451
139.944
-302.324
标准错误
68673.579
34.827
.344
8.925
38.305
.334
.141
.749
-.171
标准系数
贝塔 t
-7.456
7.268
7.126
15.680
-7.893
显著性
.000
.000
.000
.000
.000
a
粮食总产量回归方程:Y=-7.893X1+15.68X2+7.126X3+7.268X4-7.456
6、一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关数据。进行多元线性回归分析所得的部分分析结果如下:
Model
Regression
Residual
Total
专业知识整理分享
Sum of Squares
13458586.7
Df
29
Mean Square
4008924.7
F
Sig.
8.88341E-13
WORD格式..可编辑
Unstandardized Codfficients
(Constant)
X1
X2
X3
B
7589.1025
-117.8861
80.6107
0.5012
2445.0213
31.8974
14.7676
0.1259
t
3.1039
-3.6958
5.4586
3.9814
Sig.
0.00457
0.00103
0.00001
0.00049
1) 将第一张表中的所缺数值补齐。
2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。
3) 检验回归方程的线性关系是否显著?
4) 检验各回归系数是否显著?
5) 计算判定系数,并解释它的实际意义。
6) 计算回归方程的估计标准误差,并解释它的实际意义。
(1)
模型
1
回归
残差
总计
平方和 自由度
3
26
29
均方
4008924.7
F
72.8
显著性
8.88341E-13
b12026774.1
1431812.6
13458586.7
55069.7154
(2)Y=7589.1-117.886 X1+80.6X2+0.5X3
(3)回归方程显著性检验:整体线性关系显著
(4)回归系数显著性检验:各个回归系数检验均显著
(5)略
(6)略
7、对参加 SAT 考试的同学成绩进行随机调查,获得他们阅读考试和数学考试的成绩以及性别数据。通常阅读能力和数学能力具有一定的线性相关性,请在排除性别差异的条件下,分析阅读成绩对数学成绩的线性影响是否显著。
方法:采用进入回归策略。
步骤:分析回归线性将MathSAT导入因变量、其余变量导入自变量确定。
专业知识整理分享
WORD格式..可编辑
结果如下:
已输入/除去变量
模型
1
已输入变量
Gender, Verbal
SAT
a. 因变量:Math SAT
b. 已输入所有请求的变量。
模型摘要
调整后的 R 平模型
1
R
.710
aba已除去变量 方法
. 输入
R 平方
.505
方
.499
标准估算的错误
69.495
a. 预测变量:(常量),Gender, Verbal SAT
ANOVA
模型
1 回归
残差
总计
平方和
782588.468
767897.951
1550486.420
自由度
2
159
161
均方
391294.234
4829.547
F
81.021
显著性
.000
ba
a. 因变量:Math SAT
b. 预测变量:(常量),Gender, Verbal SAT
系数
a 专业知识整理分享
WORD格式..可编辑
非标准化系数
模型
1 (常量)
Verbal SAT
Gender
a. 因变量:Math SAT
B
184.582
.686
37.219
标准错误
34.068
.055
10.940
标准系数
贝塔 t
5.418
.696
.190
12.446
3.402
显著性
.000
.000
.001
因概率P值小于显著性水平(0.05),所以表明在控制了性别之后,阅读成绩对数学成绩有显著的线性影响。
8、试根据“粮食总产量.sav”数据,利用SPSS曲线估计方法选择恰当模型,对样本期外的粮食总产量进行外推预测,并对平均预测误差进行估计。
采用二次曲线
步骤:图形旧对话框拆线图简单个案值定义将粮食总产量导入线的表征确定
结果如下:
再双击上图“元素”菜单添加标记应用
专业知识整理分享
WORD格式..可编辑
接下来:分析回归曲线估计粮食总产量导入因变量、年份导入变量,点击年份在模型中选择二次项、立方、幂点击“保存”按钮选择保存”预测值”继续确定。
曲线拟合
附注
已创建输出
注释
输入 数据
03-MAY-2018 09:28:44
F:SPSS薛薇《统计分析与spss的应用(第五版)》PPT--jwd第9章 SPSS回归分析习题粮食总产量.sav
活动数据集
过滤器
宽度(W)
拆分文件
工作数据文件中的行数
数据集1
<无>
<无>
<无>
35
用户定义的缺失值被视作缺失。
任何变量中带有缺失值的个案不用于分析。
缺失值处理 对缺失的定义
已使用的个案
语法 CURVEFIT
/VARIABLES=lscl WITH nf
/CONSTANT
/MODEL=LINEAR QUADRATIC CUBIC
POWER
/PRINT ANOVA
/PLOT FIT
/SAVE=PRED .
资源 处理器时间
用时
00:00:00.19
00:00:00.25
专业知识整理分享
WORD格式..可编辑
使用 从
到
第一个观测值
最后一个观测值
使用周期后的第一观察
最后一个观测值
CURVEFIT 和 MOD_1 LINEAR 中具有 nf
的 lscl 的拟合
预测 从
到
变量已创建或已修改 FIT_1
FIT_2 CURVEFIT 和 MOD_1 QUADRATIC 中具有
nf 的 lscl 的拟合
FIT_3 CURVEFIT 和 MOD_1 CUBIC 中具有 nf
的 lscl 的拟合
FIT_4 CURVEFIT 和 MOD_1 POWER 中具有 nf
的 lscl 的拟合
时间序列设置 (TSET) 输出量
保存新变量
自相关或偏自相关图中的最大滞后数
PRINT = DEFAULT
NEWVAR = CURRENT
MXAUTO = 16
每个交叉相关图的最大延迟数 MXCROSS = 7
每个过程生成的最大新变量数 MXNEWVAR = 4
每个过程的最大新个案数
用户缺失值处理
置信区间百分比值
MXPREDICT = 1000
MISSING = EXCLUDE
CIN = 95
在回归方程中输入变量的容差 TOLER = .0001
最大迭代参数变化 CNVERGE = .001
计算标准的方法自相关的错误 ACFSE = IND
季节周期长度 未指定
值在绘图中标记观测值的变量 未指定
包括方程
警告
由于模型项之间存在接近共线性,该二次模型无法拟合。
由于模型项之间存在接近共线性,该立方模型无法拟合。
模型描述
模型名称
因变量
方程式
1
1
2
3
4
自变量
常量
值在绘图中标记观测值的变量
对在方程式中输入项的容许
专业知识整理分享
MOD_1
粮食总产量(y万吨)
线性(L)
二次项(Q)
立方(U)
幂
年份
已包括
未指定
.0001
aCONSTANT
WORD格式..可编辑
a. 此模型需要所有非缺失值为正。
个案处理摘要
个案总计
排除的个案
预测的个案
新创建的个案
a数字
35
0
0
0
a. 任何变量中带有缺失值的个案无需分析。
变量处理摘要
变量
从属
粮食总产量(y万自变量
正值的数目
零的数目
负值的数目
缺失值的数目 用户缺失
系统缺失
吨)
35
0
0
0
0
年份
35
0
0
0
0
粮食总产量(y万吨)
线性(L)
模型摘要
R
.935
自变量为 年份。
R 平方
.874
调整后的 R 平方 标准估算的错误
.870 2795.862
ANOVA
回归(R)
残差
总计
平方和
1790107249.412
257955809.274
2048063058.686
自由度 均方
7816842.705
F
229.006
显著性
.000 1 1790107249.412
33
34
自变量为 年份。
系数
非标准化系数 标准系数
贝塔
.935
t
15.133
显著性
.000
年份
B
708.118
标准错误
46.793
专业知识整理分享
WORD格式..可编辑
92136.775
(常量) -1369647.904 -14.865 .000
二次项(Q)
模型摘要
R
.936
自变量为 年份。
R 平方
.875
调整后的 R 平方 标准估算的错误
.872 2782.149
ANOVA
回归(R)
残差
总计
平方和
1792631355.014
255431703.672
2048063058.686
自由度 均方
7740354.657
F
231.596
显著性
.000 1 1792631355.014
33
34
自变量为 年份。
系数
非标准化系数 标准系数
贝塔
.936
t
15.218
-14.680
显著性
.000
.000
年份 ** 2
(常量)
B
.180
-673013.926
标准错误
.012
45845.338
已排除的项
年份
a输入贝塔
-125.061
t
-7.851
显著性
.000
偏相关
-.811
最小容差
.000
a. 已达到输入变量的容许界限。
立方(U)
模型摘要
R
.936
自变量为 年份。
ANOVA
R 平方
.877
调整后的 R 平方 标准估算的错误
.873 2768.471
回归(R)
残差
总计
平方和
1795136897.274
252926161.411
2048063058.686
自由度 均方
7664429.134
F
234.217
显著性
.000 1 1795136897.274
33
34
自变量为 年份。
系数
非标准化系数 标准系数
贝塔 t 显著性
B 标准错误
专业知识整理分享
WORD格式..可编辑
年份 ** 3
(常量)
6.097E-5
-440802.441
.000
30416.171
已排除的项
.936 15.304
-14.492
.000
.000
年份
年份 ** 2
a输入贝塔
-62.046
-124.059
t
-7.785
-7.779
显著性
.000
.000
偏相关
-.809
-.809
最小容差
.000
.000
a. 已达到输入变量的容许界限。
幂
模型摘要
R
.938
自变量为 年份。
ANOVA
R 平方
.880
调整后的 R 平方 标准估算的错误
.877 .108
回归(R)
残差
总计
平方和
2.825
.384
3.209
自由度
1
33
34
均方
2.825
.012
F
242.844
显著性
.000
自变量为 年份。
系数
非标准化系数 标准系数
贝塔
.938
t
15.583
.
显著性
.000
.
ln(年份)
(常量)
B
55.391
7.936E-179
标准错误
3.554
.000
因变量为 ln(粮食总产量(y万吨))。
专业知识整理分享
WORD格式..可编辑
分析:如上表所示,粮食总产量总体呈现上升趋势,在对回归进行检验时,sig值为0<0.05,故拒绝原假设,即认为回归方程中解释变量与被解释变量间显著。
预测值:
专业知识整理分享
更多推荐
变量,分析,回归,相关,线性,总产量
发布评论