2024年1月8日发(作者:部队四年级数学试卷)

WORD格式..可编辑

《统计分析与SPSS的应用(第五版)》(薛薇)

课后练习答案

第9章SPSS的线性回归分析

1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。

选择fore和phy两门成绩体系散点图

步骤:图形旧对话框散点图简单散点图定义将fore导入Y轴,将phy导入X轴,将sex导入设置标记确定。

接下来在SPSS输出查看器中,双击上图,打开图表编辑

专业知识整理分享

WORD格式..可编辑

在图表编辑器中,选择“元素”菜单选择总计拟合线选择线性应用再选择元素菜单点击子组拟合线选择线性应用。

专业知识整理分享

WORD格式..可编辑

分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。但回归直线的拟合效果都不是很好。

2、请说明线性回归分析与相关分析的关系是怎样的?

相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。

线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。

3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?

检验其可信程度并找出哪些变量的影响显著、哪些不显著。

主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、残差分析等。

专业知识整理分享

WORD格式..可编辑

线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释变量和解释变量之间确实存在显著的线性关系。

回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当。一般包括回归系数的检验,残差分析等。

4、请说明SPSS多元线性回归分析中提供了哪几种解释变量筛选策略?

向前、向后、逐步。

5、先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量的主要因素。数据文件名为“粮食总产量.sav”。

方法:采用“前进“回归策略。

步骤:分析回归线性将粮食总产量导入因变量、其余变量导入自变量方法项选“前进”确定。 如下图:(也可向后、或逐步)

已输入/除去变量

模型

1

已输入变量

施用化肥量(kg/公顷)

已除去变量 方法

向前(准则:. F-to-enter 的概率 <= .050)

a 专业知识整理分享

WORD格式..可编辑

2

风灾面积比例(%)

向前(准则:. F-to-enter 的概率 <= .050)

向前(准则:3

年份 . F-to-enter 的概率 <= .050)

4

总播种面积(万公顷)

向前(准则:. F-to-enter 的概率 <= .050)

a. 因变量:粮食总产量(y万吨)

模型摘要

调整后的 R 平模型

1

2

3

4

R

.960

.975

.984

.994

dcbaR 平方

.922

.950

.969

.989

.919

.947

.966

.987

标准估算的错误

2203.30154

1785.90195

1428.73617

885.05221

a. 预测变量:(常量),施用化肥量(kg/公顷)

b. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%)

c. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份

d. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷)

ANOVA

模型

1 回归

残差

总计

2 回归

残差

总计

3 回归

残差

总计

4 回归

残差

总计

平方和

1887863315.616

160199743.070

2048063058.686

1946000793.422

102062265.263

2048063058.686

1984783160.329

63279898.356

2048063058.686

2024563536.011

23499522.675

2048063058.686

自由度 均方 F

388.886

显著性

.000

ba1 1887863315.616

33

34

2

32

34

3

31

34

4

30

34

4854537.669

973000396.711

3189445.789

305.069 .000

c

661594386.776

2041287.044

324.106 .000

d

506140884.003

783317.423

646.150 .000

e

a. 因变量:粮食总产量(y万吨)

b. 预测变量:(常量),施用化肥量(kg/公顷)

专业知识整理分享

WORD格式..可编辑

c. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%)

d. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份

e. 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷)

系数

非标准化系数

模型

1 (常量)

施用化肥量(kg/公顷)

2 (常量)

施用化肥量(kg/公顷)

风灾面积比例(%)

3 (常量)

施用化肥量(kg/公顷)

风灾面积比例(%)

年份

4 (常量)

施用化肥量(kg/公顷)

风灾面积比例(%)

年份

总播种面积(万公顷)

a. 因变量:粮食总产量(y万吨)

B

17930.148

179.287

20462.336

193.701

-327.222

-460006.046

137.667

-293.439

244.920

-512023.307

139.944

-302.324

253.115

2.451

标准错误

504.308

9.092

720.317

8.106

76.643

110231.478

14.399

61.803

56.190

68673.579

8.925

38.305

34.827

.344

.749

-.171

.334

.141

.737

-.166

.323

1.037

-.185

.960

标准系数

贝塔 t

35.554

19.720

28.407

23.897

-4.269

-4.173

9.561

-4.748

4.359

-7.456

15.680

-7.893

7.268

7.126

显著性

.000

.000

.000

.000

.000

.000

.000

.000

.000

.000

.000

.000

.000

.000

a

结论:如上4个表所示,影响程度中大到小依次是:施用化肥量(kg/公顷), 风灾面积比例(%),

年份, 总播种面积(万公顷)。(排除农业劳动者人数(百万人)和粮食播种面积(万公顷)对粮食总产量的影响)

剔除农业劳动者人数(百万人)和粮食播种面积(万公顷)后:

步骤:分析回归线性将粮食总产量导入因变量、其余4个变量(施用化肥量(kg/公顷),

风灾面积比例(%), 年份, 总播种面积(万公顷))导入自变量方法项选“输入”确定。 如下图:

专业知识整理分享

WORD格式..可编辑

系数

非标准化系数

模型

1 (常量)

年份

总播种面积(万公顷)

施用化肥量(kg/公顷)

风灾面积比例(%)

a. 因变量:粮食总产量(y万吨)

B

-512023.307

253.115

2.451

139.944

-302.324

标准错误

68673.579

34.827

.344

8.925

38.305

.334

.141

.749

-.171

标准系数

贝塔 t

-7.456

7.268

7.126

15.680

-7.893

显著性

.000

.000

.000

.000

.000

a

粮食总产量回归方程:Y=-7.893X1+15.68X2+7.126X3+7.268X4-7.456

6、一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关数据。进行多元线性回归分析所得的部分分析结果如下:

Model

Regression

Residual

Total

专业知识整理分享

Sum of Squares

13458586.7

Df

29

Mean Square

4008924.7

F

Sig.

8.88341E-13

WORD格式..可编辑

Unstandardized Codfficients

(Constant)

X1

X2

X3

B

7589.1025

-117.8861

80.6107

0.5012

2445.0213

31.8974

14.7676

0.1259

t

3.1039

-3.6958

5.4586

3.9814

Sig.

0.00457

0.00103

0.00001

0.00049

1) 将第一张表中的所缺数值补齐。

2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。

3) 检验回归方程的线性关系是否显著?

4) 检验各回归系数是否显著?

5) 计算判定系数,并解释它的实际意义。

6) 计算回归方程的估计标准误差,并解释它的实际意义。

(1)

模型

1

回归

残差

总计

平方和 自由度

3

26

29

均方

4008924.7

F

72.8

显著性

8.88341E-13

b12026774.1

1431812.6

13458586.7

55069.7154

(2)Y=7589.1-117.886 X1+80.6X2+0.5X3

(3)回归方程显著性检验:整体线性关系显著

(4)回归系数显著性检验:各个回归系数检验均显著

(5)略

(6)略

7、对参加 SAT 考试的同学成绩进行随机调查,获得他们阅读考试和数学考试的成绩以及性别数据。通常阅读能力和数学能力具有一定的线性相关性,请在排除性别差异的条件下,分析阅读成绩对数学成绩的线性影响是否显著。

方法:采用进入回归策略。

步骤:分析回归线性将MathSAT导入因变量、其余变量导入自变量确定。

专业知识整理分享

WORD格式..可编辑

结果如下:

已输入/除去变量

模型

1

已输入变量

Gender, Verbal

SAT

a. 因变量:Math SAT

b. 已输入所有请求的变量。

模型摘要

调整后的 R 平模型

1

R

.710

aba已除去变量 方法

. 输入

R 平方

.505

.499

标准估算的错误

69.495

a. 预测变量:(常量),Gender, Verbal SAT

ANOVA

模型

1 回归

残差

总计

平方和

782588.468

767897.951

1550486.420

自由度

2

159

161

均方

391294.234

4829.547

F

81.021

显著性

.000

ba

a. 因变量:Math SAT

b. 预测变量:(常量),Gender, Verbal SAT

系数

a 专业知识整理分享

WORD格式..可编辑

非标准化系数

模型

1 (常量)

Verbal SAT

Gender

a. 因变量:Math SAT

B

184.582

.686

37.219

标准错误

34.068

.055

10.940

标准系数

贝塔 t

5.418

.696

.190

12.446

3.402

显著性

.000

.000

.001

因概率P值小于显著性水平(0.05),所以表明在控制了性别之后,阅读成绩对数学成绩有显著的线性影响。

8、试根据“粮食总产量.sav”数据,利用SPSS曲线估计方法选择恰当模型,对样本期外的粮食总产量进行外推预测,并对平均预测误差进行估计。

采用二次曲线

步骤:图形旧对话框拆线图简单个案值定义将粮食总产量导入线的表征确定

结果如下:

再双击上图“元素”菜单添加标记应用

专业知识整理分享

WORD格式..可编辑

接下来:分析回归曲线估计粮食总产量导入因变量、年份导入变量,点击年份在模型中选择二次项、立方、幂点击“保存”按钮选择保存”预测值”继续确定。

曲线拟合

附注

已创建输出

注释

输入 数据

03-MAY-2018 09:28:44

F:SPSS薛薇《统计分析与spss的应用(第五版)》PPT--jwd第9章 SPSS回归分析习题粮食总产量.sav

活动数据集

过滤器

宽度(W)

拆分文件

工作数据文件中的行数

数据集1

<无>

<无>

<无>

35

用户定义的缺失值被视作缺失。

任何变量中带有缺失值的个案不用于分析。

缺失值处理 对缺失的定义

已使用的个案

语法 CURVEFIT

/VARIABLES=lscl WITH nf

/CONSTANT

/MODEL=LINEAR QUADRATIC CUBIC

POWER

/PRINT ANOVA

/PLOT FIT

/SAVE=PRED .

资源 处理器时间

用时

00:00:00.19

00:00:00.25

专业知识整理分享

WORD格式..可编辑

使用 从

第一个观测值

最后一个观测值

使用周期后的第一观察

最后一个观测值

CURVEFIT 和 MOD_1 LINEAR 中具有 nf

的 lscl 的拟合

预测 从

变量已创建或已修改 FIT_1

FIT_2 CURVEFIT 和 MOD_1 QUADRATIC 中具有

nf 的 lscl 的拟合

FIT_3 CURVEFIT 和 MOD_1 CUBIC 中具有 nf

的 lscl 的拟合

FIT_4 CURVEFIT 和 MOD_1 POWER 中具有 nf

的 lscl 的拟合

时间序列设置 (TSET) 输出量

保存新变量

自相关或偏自相关图中的最大滞后数

PRINT = DEFAULT

NEWVAR = CURRENT

MXAUTO = 16

每个交叉相关图的最大延迟数 MXCROSS = 7

每个过程生成的最大新变量数 MXNEWVAR = 4

每个过程的最大新个案数

用户缺失值处理

置信区间百分比值

MXPREDICT = 1000

MISSING = EXCLUDE

CIN = 95

在回归方程中输入变量的容差 TOLER = .0001

最大迭代参数变化 CNVERGE = .001

计算标准的方法自相关的错误 ACFSE = IND

季节周期长度 未指定

值在绘图中标记观测值的变量 未指定

包括方程

警告

由于模型项之间存在接近共线性,该二次模型无法拟合。

由于模型项之间存在接近共线性,该立方模型无法拟合。

模型描述

模型名称

因变量

方程式

1

1

2

3

4

自变量

常量

值在绘图中标记观测值的变量

对在方程式中输入项的容许

专业知识整理分享

MOD_1

粮食总产量(y万吨)

线性(L)

二次项(Q)

立方(U)

年份

已包括

未指定

.0001

aCONSTANT

WORD格式..可编辑

a. 此模型需要所有非缺失值为正。

个案处理摘要

个案总计

排除的个案

预测的个案

新创建的个案

a数字

35

0

0

0

a. 任何变量中带有缺失值的个案无需分析。

变量处理摘要

变量

从属

粮食总产量(y万自变量

正值的数目

零的数目

负值的数目

缺失值的数目 用户缺失

系统缺失

吨)

35

0

0

0

0

年份

35

0

0

0

0

粮食总产量(y万吨)

线性(L)

模型摘要

R

.935

自变量为 年份。

R 平方

.874

调整后的 R 平方 标准估算的错误

.870 2795.862

ANOVA

回归(R)

残差

总计

平方和

1790107249.412

257955809.274

2048063058.686

自由度 均方

7816842.705

F

229.006

显著性

.000 1 1790107249.412

33

34

自变量为 年份。

系数

非标准化系数 标准系数

贝塔

.935

t

15.133

显著性

.000

年份

B

708.118

标准错误

46.793

专业知识整理分享

WORD格式..可编辑

92136.775

(常量) -1369647.904 -14.865 .000

二次项(Q)

模型摘要

R

.936

自变量为 年份。

R 平方

.875

调整后的 R 平方 标准估算的错误

.872 2782.149

ANOVA

回归(R)

残差

总计

平方和

1792631355.014

255431703.672

2048063058.686

自由度 均方

7740354.657

F

231.596

显著性

.000 1 1792631355.014

33

34

自变量为 年份。

系数

非标准化系数 标准系数

贝塔

.936

t

15.218

-14.680

显著性

.000

.000

年份 ** 2

(常量)

B

.180

-673013.926

标准错误

.012

45845.338

已排除的项

年份

a输入贝塔

-125.061

t

-7.851

显著性

.000

偏相关

-.811

最小容差

.000

a. 已达到输入变量的容许界限。

立方(U)

模型摘要

R

.936

自变量为 年份。

ANOVA

R 平方

.877

调整后的 R 平方 标准估算的错误

.873 2768.471

回归(R)

残差

总计

平方和

1795136897.274

252926161.411

2048063058.686

自由度 均方

7664429.134

F

234.217

显著性

.000 1 1795136897.274

33

34

自变量为 年份。

系数

非标准化系数 标准系数

贝塔 t 显著性

B 标准错误

专业知识整理分享

WORD格式..可编辑

年份 ** 3

(常量)

6.097E-5

-440802.441

.000

30416.171

已排除的项

.936 15.304

-14.492

.000

.000

年份

年份 ** 2

a输入贝塔

-62.046

-124.059

t

-7.785

-7.779

显著性

.000

.000

偏相关

-.809

-.809

最小容差

.000

.000

a. 已达到输入变量的容许界限。

模型摘要

R

.938

自变量为 年份。

ANOVA

R 平方

.880

调整后的 R 平方 标准估算的错误

.877 .108

回归(R)

残差

总计

平方和

2.825

.384

3.209

自由度

1

33

34

均方

2.825

.012

F

242.844

显著性

.000

自变量为 年份。

系数

非标准化系数 标准系数

贝塔

.938

t

15.583

.

显著性

.000

.

ln(年份)

(常量)

B

55.391

7.936E-179

标准错误

3.554

.000

因变量为 ln(粮食总产量(y万吨))。

专业知识整理分享

WORD格式..可编辑

分析:如上表所示,粮食总产量总体呈现上升趋势,在对回归进行检验时,sig值为0<0.05,故拒绝原假设,即认为回归方程中解释变量与被解释变量间显著。

预测值:

专业知识整理分享


更多推荐

变量,分析,回归,相关,线性,总产量