2023年12月25日发(作者:小学数学试卷例题及解析)

第33卷第4期

Vol. 33 No. 4统计与信息论坛

Statistics & Information Forum2018年4月

八pr.,2018【统计理论与方法】带测量误差的分位数回归模型的参数估计研究关静,杨香云(天津大学数学学院,天津300354)摘要:近年来,研究预测变量带测量误差的分位数回归模型的参数估计问题已逐渐成为统计学中的一大

热点问题,但由于带测量误差的分位数回归模型的参数估计十分复杂,所以相关研究很少,而目前的研究主

要集中于误差分布为球形对称分布的正交回归法和误差分布自由的校正损失函数法等。在回归误差分布为

正态分布的假设下,提出修正因子得分法(CFS),即在因子得分法的基础上进行参数估计,并对估计偏差进行

修正得到最终估计;通过模拟研究,比较修正因子得分法相对正交回归估计(H-L估计)的优劣,并对修正因

子得分法进行综合评价。关键词:分位数回归;测量误差;因子得分;修正因子得分(CFS)中图分类号:〇212. 1 : F224. 7

文献标志码:A

文章编号:1007 — 3116(2018)04—0013 — 07一、引言在经济、医学、金融等研究领域,预测变量的测

量经常带有误差,例如在医学研究脂肪吸收量与乳

腺癌患病率之间的关系这一问题中,脂肪的吸收量

是无法直接观测的,只能根据脂肪的摄入量来计算。

在分析带有测量误差的数据时,如果忽略测量误差

所得结果是不可靠的,通常会导致均值回归或者分

位数回归的参数估计是有偏的。关于带测量误差的均值回归,Fuller给出经典

最小二乘在忽略测量误差存在的情况下做出的参

数估计不再是无偏的,并推导出了偏差的具体形

式[1]1_4。为了解决测量误差带来的有偏问题,相

关的方法包括:回归递减法2 (修正偏差:

CorrectionRegression)、模拟外推法(SIMEX)3、工

具变量法(增加工具变量信息)[4]147—150、正交回归

法[5]等。分位数回归用于研究在给定预测变量条件下,

响应变量在不同分位数下的分布情况[6—7]。比普通

的最小二乘均值回归能够获取更多的关于响应变量

的分布信息,可以说传统的最小二乘只是均值的回

归,而分位数回归不仅可以反映均值的信息,而且还

可以反映分布的上尾和下尾的信息。特别地,实际收稿日期:2017 —07 —08;修复日期:2017 —11 —18问题中响应变量与预测变量之间的关系较为复杂,

比如当数据出现尖峰或厚尾的分布和存在显著的异

方差等情况时,传统的均值回归并不能充分利用数

据信息来反映变量之间的真实关系。本文将测量误差引入分位数回归模型中,重

点研究带测量误差的分位数回归模型的参数估计

问题。相对于带测量误差的均值回归,这类研究

相对很少,因为校正分位数回归中预测变量的测

量误差有两大难点[]:第一,回归误差项以及测量

误差项的分布形式未知(若已知可利用似然函数

法得到一致估计);第二,不同于均值回归,随机变

量和的期望等于期望之和,而分位数回归中随机

变量和的分位数不等于分位数之和。He等提出

了正交回归法,通过最小化正交残差的分位数损

失函数得到参数估计[],该方法要求回归误差与

测量误差服从球形对称分布;Hu等提出了基于条

件密度函数的非参数模型对参数进行估计[10]; Wei

等提出了通过对整个分位数过程进行建模估计给

定^条件下^的密度函数,从而用迭代的方法得

到参数估计[11],但计算量庞大且过于复杂;Wang

等提出带测量误差分位数回归的校正损失估

计[]Jiang提出的复合分位数回归方法[12]与Shim

提出的加权正交回归的估计方法[13],同样假设误作者简介:关静,女,河北大城人,管理科学与工程博士,副教授,研究方向:数理统计,应用数学。13


更多推荐

回归,位数,测量误差,研究