则称 为连续型随机向量;并称f(x,y)为 =(X,Y)的分布密度或称为X和Y的联合分布密度。
分布密度f(x,y)具有下面两个性质:
(1) f(x,y)≥0;
(2)
(2)二维随
机变量的本质
(3)联合分设(X,Y)为二维随机变量,对于任意实数x,y,二元函数
布函数
称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。
分布函数是一个以全平面为其定义域,以事件 的概率为函数值的一个实值函数。分布函数F(x,y)具有以下的基本性质:
(1)
(2)F(x,y)分别对x和y是非减的,即
当x2>x1时,有F(x2,y)≥F(x1,y);当y2>y1时,有F(x,y2) ≥F(x,y1);
(3)F(x,y)分别对x和y是右连续的,即
(4)
(5)对于
.
(4)离散型
与连续型的关系
(5)边缘分离散型 X的边缘分布为
.
6
.
布 ;
Y的边缘分布为
。
连续型 X的边缘分布密度为
Y的边缘分布密度为
在已知X=xi的条件下,Y取值的条件分布为
在已知Y=yj的条件下,X取值的条件分布为
在已知Y=y的条件下,X的条件分布密度为
;
在已知X=x的条件下,Y的条件分布密度为
F(X,Y)=FX(x)FY(y)
有零不独立
f(x,y)=fX(x)fY(y)
直接判断,充要条件:
①可分离变量
②正概率密度区间为矩形
=0
若X1,X2,…Xm,Xm+1,…Xn相互独立, h,g为连续函数,则:
h(X1,X2,…Xm)和g(Xm+1,…Xn)相互独立。
特例:若X与Y独立,则:h(X)和g(Y)独立。
例如:若X与Y独立,则:3X+1和5Y-2独立。
(6)条件分离散型
布
连续型
(7)独立性 一般型
离散型
连续型
二维正态分布
随机变量的函数
(8)二维均设随机向量(X,Y)的分布密度函数为
匀分布
其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)~U(D)。
例如图3.1、图3.2和图3.3。
y
1
D1
O 1 x
图3.1
y
D2
.
7
.
1
1
O 2 x
图3.2
y
D3
d
c
O a b x
图3.3
(9)二维正设随机向量(X,Y)的分布密度函数为
态分布
其中 是5个参数,则称(X,Y)服从二维正态分布,
记为(X,Y)~N(
由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,
即X~N(
但是若X~N( ,(X,Y)未必是二维正态分布。
(10)函数Z=X+Y
分布
根据定义计算:
对于连续型,fZ(z)=
两个独立的正态分布的和仍为正态分布( )。
n个相互独立的正态分布的线性组合,仍服从正态分布。
,
Z=max,min(X1,X2,…Xn) 若 相互独立,其分布函数分别为 ,则Z=max,min(X1,X2,…Xn)的分布函数为:
分布 设n个随机变量 相互独立,且服从标准正态分布,可以证明它们的平方和
的分布密度为
我们称随机变量W服从自由度为n的 分布,记为W~ ,其中
所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。
.
8
.
分布满足可加性:设
则
t分布 设X,Y是两个相互独立的随机变量,且
可以证明函数
的概率密度为
我们称随机变量T服从自由度为n的t分布,记为T~t(n)。
设 ,且X与Y独立,可以证明 的概率密度函数为
我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为F~f(n1, n2).
离散型 连续型
F分布
第四章 随机变量的数字特征
(1)一
维随机期望
变量的期望就是平均值
数字特征
函数的期望
设X是离散型随机变量,其分布设X是连续型随机变量,其概率密律为P( )=pk,k=1,2,…,n, 度为f(x),
(要求绝对收敛) (要求绝对收敛)
Y=g(X)
Y=g(X)
方差
D(X)=E[X-E(X)]2,
标准差
,
矩 ①对于正整数k,称随机变量X的①对于正整数k,称随机变量X的kk次幂的数学期望为X的k阶原点次幂的数学期望为X的k阶原点矩,矩,记为vk,即 记为vk,即
νk=E(Xk)= , k=1,2, …. νk=E(Xk)=
②对于正整数k,称随机变量X与 k=1,2, ….
E(X)差的k次幂的数学期望为②对于正整数k,称随机变量X与EX的k阶中心矩,记为 ,即
(X)差的k次幂的数学期望为X的
k阶中心矩,记为 ,即
= , k=1,2, ….
=
k=1,2, ….
设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于任意正数ε,有下列切比雪夫不等式
.
9
切比雪夫不等式
.
切比雪夫不等式给出了在未知X的分布的情况下,对概率
的一种估计,它在理论上有重要意义。
(2)期(1) E(C)=C
望的性(2) E(CX)=CE(X)
质 (3) E(X+Y)=E(X)+E(Y),
(4) E(XY)=E(X) E(Y),充分条件:X和Y独立;
充要条件:X和Y不相关。
(3)方(1) D(C)=0;E(C)=C
差的性(2) D(aX)=a2D(X); E(aX)=aE(X)
质 (3) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b
(4) D(X)=E(X2)-E2(X)
(5) D(X±Y)=D(X)+D(Y),充分条件:X和Y独立;
充要条件:X和Y不相关。
D(X±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))],无条件成立。
而E(X+Y)=E(X)+E(Y),无条件成立。
(4)常
见分布0-1分布
的期望二项分布
和方差
泊松分布
几何分布
超几何分布
均匀分布
指数分布
正态分布
t分布
(5)二期望
维随机变量的函数的期望
数字特征
方差
期望
p
np
n
0
=
方差
2n
(n>2)
=
协方差 对于随机变量X与Y,称它们的二阶混合中心矩 为X与Y的协方差或相关矩,记为 ,即
与记号 相对应,X与Y的方差D(X)与D(Y)也可分别记为 与 。
对于随机变量X与Y,如果D(X)>0, D(Y)>0,则称
为X与Y的相关系数,记作 (有时可简记为 )。
| |≤1,当| |=1时,称X与Y完全相关:
相关系数
.0
1
.
完全相关
而当 时,称X与Y不相关。
以下五个命题是等价的:
① ;
②cov(X,Y)=0;
③E(XY)=E(X)E(Y);
④D(X+Y)=D(X)+D(Y);
⑤D(X-Y)=D(X)+D(Y).
协方差矩阵
混合矩
对于随机变量X与Y,如果有 存在,则称之为X与Y的k+l阶混合原点矩,记为 ;k+l阶混合中心矩记为:
(6)协(i) cov (X, Y)=cov (Y, X);
方差的(ii) cov(aX,bY)=ab cov(X,Y);
性质
(iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);
(iv) cov(X,Y)=E(XY)-E(X)E(Y).
(7)独(i) 若随机变量X与Y相互独立,则 ;反之不真。
立和不(ii) 若(X,Y)~N( ),
相关 则X与Y相互独立的充要条件是X和Y不相关。
第五章 大数定律和中心极限定理
(1)大数定律
切比雪设随机变量X1,X2,…相互独立,均具有有限方差,且被同夫大数一常数C所界:D(Xi)定律
特殊情形:若X1,X2,…具有相同的数学期望E(XI)=μ,则上式成为
伯努利设μ是n次独立试验中事件A发生的次数,p是事件A在每次大数定试验中发生的概率,则对于任意的正数ε,有
律
伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即
这就以严格的数学形式描述了频率的稳定性。
辛钦大设X1,X2,…,Xn,…是相互独立同分布的随机变量序列,数定律 且E(Xn)=μ,则对于任意的正数ε有
(2)中心极限定理 列维-设随机变量X1,X2,…相互独立,服从同一分布,且具有相 林德伯同的数学期望和方差: ,则随机变量
格定理
的分布函数Fn(x)对任意的实数x,有
此定理也称为独立同分布的中心极限定理。
棣莫弗设随机变量 为具有参数n, p(0
.1
1
.
拉斯定
理
(3)二项定理 若当 ,则
超几何分布的极限分布为二项分布。
若当 ,则
其中k=0,1,2,…,n,…。
二项分布的极限分布为泊松分布。
在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。
总体中的每一个单元称为样品(或个体)。
我们把从总体中抽取的部分样品 称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时, 表示n个随机变量(样本);在具体的一次抽取之后, 表示n个具体的数值(样本值)。我们称之为样本的两重性。
(4)泊松定理
第六章 样本及抽样分布
(1)数理统总体
计的基本概念
个体
样本
样本函数和统设 为总体的一个样本,称
计量 ( )
为样本函数,其中 为一个连续函数。如果 中不包含任何未知参数,则称 ( )为一个统计量。
常见统计量及样本均值
其性质 样本方差
样本标准差
样本k阶原点矩
样本k阶中心矩
, ,
, ,
其中 ,为二阶中心矩。
(2)正态总正态分布
体下的四大分布
t分布
设 为来自正态总体 的一个样本,则样本函数
设 为来自正态总体 的一个样本,则样本函数
其中t(n-1)表示自由度为n-1的t分布。
设 为来自正态总体 的一个样本,则样本函数
其中 表示自由度为n-1的 分布。
设 为来自正态总体 的一个样本,而 为来自正态总体 的一个样本,则样本函数
.2
1
F分布
.
其中
表示第一自由度为 ,第二自由度为 的F分布。
(3)正态总与 独立。
体下分布的性质
第七章 参数估计
(1)点估矩估计
计
设总体X的分布中包含有未知数 ,则其分布函数可以表成 它的k阶原点矩 中也包含了未知参数 ,即 。又设 为总体X的n个样本值,其样本的k阶原点矩为
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有
由上面的m个方程中,解出的m个未知参数 即为参数( )的矩估计量。
若 为 的矩估计, 为连续函数,则 为 的矩估计。
极大似然当总体X为连续型随机变量时,设其分布密度为 ,其中 为未知参数。估计 又设 为总体的一个样本,称
为样本的似然函数,简记为Ln.
当总体X为离型随机变量时,设其分布律为 ,则称
为样本的似然函数。
若似然函数 在 处取到最大值,则称 分别为 的最大似然估计值,相应的统计量称为最大似然估计量。
若 为 的极大似然估计, 为单调函数,则 为 的极大似然估计。
(2)估计无偏性
量的评选标准
有效性
一致性
设 为未知参数 的估计量。若E ( )= ,则称 为 的无偏估计量。
E( )=E(X), E(S2)=D(X)
设 和 是未知参数 的两个无偏估计量。若 ,则称 有效。
设 是 的一串估计量,如果对于任意的正数 ,都有
则称 为 的一致估计量(或相合估计量)。
若 为 的无偏估计,且 则 为 的一致估计。
只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。
(3)区间置信区间设总体X含有一个待估的未知参数 。如果我们从样本 出发,找出两个估计 和置信度 统计量 与 ,使得区间 以 的概率包含这个待估参数 ,即
.3
1
.
那么称区间 为 的置信区间, 为该区间的置信度(或置信水平)。
单正态总设 为总体 的一个样本,在置信度为 下,我们来确定 的置信区间 。体的期望具体步骤如下:
和方差的(i)选择样本函数;
区间估计 (ii)由置信度 ,查表找分位数;
(iii)导出置信区间 。
已知方差,估计均值 (i)选择样本函数
(ii) 查表找分位数
(iii)导出置信区间
(i)选择样本函数
(ii)查表找分位数
(iii)导出置信区间
(i)选择样本函数
(ii)查表找分位数
(iii)导出 的置信区间
未知方差,估计均值
方差的区间估计
第八章 假设检验
基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。
为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。与H0相对的假设称为备择假设,用H1表示。
这里所说的小概率事件就是事件 ,其概率就是检验水平α,通常我们取α=0.05,有时也取0.01或0.10。
假设检验的基本步骤如下:
(i) 提出零假设H0;
(ii) 选择统计量K;
(iii) 对于检验水平α查表找分位数λ;
(iv) 由样本值 计算统计量之值K;
将 进行比较,作出判断:当 时否定H0,否则认为H0相容。
第一类错误 当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记 为犯此类错误的概率,即
P{否定H0|H0为真}= ;
.4
1基本步骤
两类错误
.
此处的α恰好为检验水平。
第二类错误 当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记 为犯此类错误的概率,即
P{接受H0|H1为真}= 。
人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时, 变小,则 变大;相反地, 变小,则 变大。取定 要想使 变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如0.01,甚至0.001。反之,则应把α取得大些。
两类错误的关系
单正态总体均值和方差的假设检验
条件 零假设
已知
未知
未知
公式整理
1.随机事件及其概率
N(0,1)
统计量
对应样本
函数分布
否定域
A吸收律:AAAA
A
A(AB)AABABA(AB)
A(AB)A反演律:ABAB
ABAB
AA
AA
iiiii1i1i1i1nnnn2.概率的定义及其计算
.5
1
.
P(A)1P(A)
若AB
P(BA)P(B)P(A)
对任意两个事件A, B, 有
P(BA)P(B)P(AB)
加法公式:对任意两个事件A, B, 有
P(AB)P(A)P(B)P(AB)
P(AB)P(A)P(B)
P(Ai)P(Ai)i1i1nn1ijnP(AA)ij1ijknP(AAA)(1)ijknn1P(A1A2An)3.条件概率
PBA
乘法公式
P(AB)
P(A)P(AB)P(A)PBA(P(A)0)
P(A1A2An)P(A1)PA2A1PAnA1A2An1(P(A1A2An1)0)P(A)P(ABi)
P(Bi)P(ABi)
i1n全概率公式
ni1Bayes公式
P(BkA)P(Bk)P(ABk)P(ABk)
n
P(A)P(Bi)P(ABi)i14.随机变量及其分布
分布函数计算
P(aXb)P(Xb)P(Xa)
F(b)F(a)5.离散型随机变量
(1) 0 – 1 分布
P(Xk)pk(1p)1k,k0,1
(2) 二项分布
B(n,p)
若P ( A ) = p
kkP(Xk)Cnp(1p)nk,k0,1,,n
.6
1
* Possion定理
limnnpn0
kknk有
limnCnpn(1pn)ekk!
k0,1,2,(3) Poisson 分布
P()
P(Xk)ekk!,k0,1,2,
6.连续型随机变量
(1) 均匀分布
U(a,b)
1f(x)ba,axb
0,其他0,F(x)xaa,
b1(2) 指数分布
E()
f(x)ex,x00,其他
F(x)0,x01ex,x0
(3) 正态分布 N ( ,
2 )
(x)2f(x)1222ext)2F(x)1222xe(dt
* N (0,1) — 标准正态分布
x2
(x)122ex
.
1.7
.
1(x)2xet22dtx
7.多维随机变量及其分布
二维随机变量( X ,Y )的分布函数
F(x,y)FX(x)xxyf(u,v)dvdu
边缘分布函数与边缘密度函数
f(u,v)dvdu
fX(x)f(x,v)dv
yFY(y)fY(y)f(u,v)dudv
f(u,y)du
8. 连续型二维随机变量
(1) 区域G 上的均匀分布,U ( G )
1,(x,y)Gf(x,y)A
其他0,(2) 二维正态分布
(x1)2(x1)(y2)22112122(12)(y2)229.
f(x,y)121212e二维随机变量的 条件分布
x,yf(x,y)fX(x)fYX(yx)
fY(y)fXY(xy)fX(x)0
fY(y)0
fX(x)f(x,y)dyfXY(xy)fY(y)dy
fY(y)f(x,y)dxfYX(yx)fX(x)dx
fYX(yx)fX(x)f(x,y)
fXY(xy)
fY(y)fY(y)fXY(xy)fY(y)f(x,y)
fYX(yx)
fX(x)fX(x)10. 随机变量的数字特征
.8
1
.
数学期望
E(X)xkpk
k1E(X)xf(x)dx
随机变量函数的数学期望
X 的 k 阶原点矩E(X)
X 的 k 阶绝对原点矩E(|X|)
X 的 k 阶中心矩E((XE(X)))
X 的 方差E((XE(X)))D(X)
X ,Y 的 k + l 阶混合原点矩E(XY)
X ,Y 的 k + l 阶混合中心矩
kl2kkkE(XE(X))k(YE(Y))l
X ,Y 的 二阶混合原点矩E(XY)
X ,Y 的二阶混合中心矩 X ,Y 的协方差
E(XE(X))(YE(Y))
X ,Y 的相关系数
(XE(X))(YE(Y))XY
ED(X)D(Y)X 的方差
D (X ) = E ((X - E(X))2)
D(X)E(X2)E2(X)
协方差
cov(X,Y)E(XE(X))(YE(Y))
E(XY)E(X)E(Y)
1D(XY)D(X)D(Y)
2相关系数XY
cov(X,Y)
D(X)D(Y).9
1
.
(t)222F(x)12xedt
* N (0,1) — 标准正态分布
1(x)e2x22x
t22
(x)12xedtx
7.多维随机变量及其分布
二维随机变量( X ,Y )的分布函数
F(x,y)FX(x)xxyf(u,v)dvdu
边缘分布函数与边缘密度函数
f(u,v)dvdu
fX(x)f(x,v)dv
yFY(y)fY(y)f(u,v)dudv
f(u,y)du
8. 连续型二维随机变量
(1) 区域G 上的均匀分布,U ( G )
1,(x,y)Gf(x,y)A
其他0,(2) 二维正态分布
(x1)2(x1)(y2)2211212(y)22(1)2229.
f(x,y)121212e二维随机变量的 条件分布
x,yf(x,y)fX(x)fYX(yx)
fY(y)fXY(xy)fX(x)0
fY(y)0
fX(x)f(x,y)dyfXY(xy)fY(y)dy
.0
2
.
fY(y)f(x,y)dxfYX(yx)fX(x)dx
fYX(yx)fX(x)f(x,y)
fXY(xy)
fY(y)fY(y)fXY(xy)fY(y)f(x,y)
fYX(yx)
fX(x)fX(x)10. 随机变量的数字特征
数学期望
E(X)xkpk
k1E(X)xf(x)dx
随机变量函数的数学期望
X 的 k 阶原点矩E(Xk)
X 的 k 阶绝对原点矩E(|X|k)
X 的 k 阶中心矩E((XE(X))k)
X 的 方差E((XE(X))2)D(X)
X ,Y 的 k + l 阶混合原点矩E(XkYl)
X ,Y 的 k + l 阶混合中心矩
E(XE(X))k(YE(Y))l
X ,Y 的 二阶混合原点矩E(XY)
X ,Y 的二阶混合中心矩 X ,Y 的协方差
E(XE(X))(YE(Y))
X ,Y 的相关系数
E(XE(X))(YE(Y))D(X)D(Y)XY
X 的方差
D (X ) = E ((X - E(X))2)
D(X)E(X2)E2(X)
协方差
cov(X,Y)E(XE(X))(YE(Y))
2.1
.
E(XY)E(X)E(Y)
1D(XY)D(X)D(Y)
2相关系数XY
cov(X,Y)
D(X)D(Y).2
2
发布评论