2024年4月16日发(作者:文山2021高考数学试卷难吗)

数学建模相关性分析模型例题

相关性分析是指分析两个随机变量之间是否存在一定的关系.相关分析可以发现变量间的共

变关系(包括正向的和负向的共变关系),一旦发现了共变关系就意味着变量间可能存在两种关

系中的一种:(1)因果关系(两个变量中一个为因、另一个为果):(2)存在公共因子(两变量均

为果,有潜在的共因),很多时候,我们需要寻找这些因果关系,或者是寻找公共因子.相关性研

究是非常有用的,它是许多深入研究必备的初始阶段工作

衡量随机变量相关性的度量主要有三种:pearson相关系数、spearman相关系数、

kendall相关系数.

7.1 Pearson(皮尔逊)相关系数一线形相关分析

对于二维随机变量(X,Y),根据数学期望性质,若X和Y相互独立,且EX和EY存在,则有

E[(X-EX(Y-EY]=E( =0

所以当E[(X-EX)(Y-EY】≠0时,必有X和Y不相互独立.

定义7-1设(X,Y)为二维随机变量,称E[(X-EX(Y-EY)]为随机变量X,Y的协方差(Covariance),

记为Cov(X,Y),即Cov(X,Y)=E[(X-EX)(Y-EY)]

特别地

Cov(X,X)=E[(X-EX(X-EX)]=DX

Cov(Y,Y)=E[(Y-EY)(Y-EY)]=DY

故方差DX,DY是协方差的特例

从定义中看到,协方差和变量的量纲有关.我们将随机变量标准化,得水=X Ex,yapos;_Y-

EYDXDY(X,Y)的协方差为Cov(X,Y)D(X)D(Y)

定义7-2设(X,Y)为二维随机变量,称Cov(X,Y)为随机变量X,Y的Pearson相关系

D(X)D(Y)数(Pearson correlation coefficient)或标准协方差(Standard covariance),记为

pxy,即Cov(X,Y)P=D(X)D(Y)

定理7-1设D(X)amp;gt;0,D(Y)amp;gt;0,P为(X,Y)的相关系数,则

(1)如果X,Y相互独立,则pxw=0;

(2)p≤1:

(3)Pw=1的充要条件是存在常数a,b使P(Y=aX+b=1(a≠0).

相关系数pxy描述了随机变量X,Y的线性相关程度,Pw愈接近1,则X与Y之间愈接近线

性关系.Pwamp;gt;0为正相关,Pw<0为负相关一般用下列标准对相互关系进行判

定:

(1)Pwamp;gt;0.95,X与Y存在显著性相关:

(2)Pxw≥0.8,X与Y高度相关:

(3)0.5≤Pxwamp;lt;0.8,X与Y中度相关:

(4)0.3≤pxwamp;lt;0.5,X与Y低度相关;

(5)Px≤0.3,X与Y关系极弱,认为不相关:

(6)Pxw=0,X与Y无显性相关.

可以证明:

(1)当两个随机变量不线性相关时,它们并不一定相互独立,它们之间还可能存在其他的函

数关系

(2)若(X,Y)服从二维正态分布,X与Y不相关和X与Y相互独立是等价的,且概率密度中的

参数p就是X和Y的相关系数.即,X和Y相互独立的充要条件是p=0.


更多推荐

关系,相关,变量,存在