您的当前位置:首页正文

(整理)第三章 多元线性回归模型案例及作业

来源:画鸵萌宠网
精品文档

1. 表1列出了中国2000年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y,资产合计K及职工人数L。

序号 1 2 3 4 5 工业总产值Y/亿元

资产合计K/亿元

职工人数L/万人

序号 17 18 19 20 21 工业总产值Y/亿元

资产合计K/亿元

职工人数L/万人

3722.700 3078.220 113.0000 1442.520 1684.430 67.00000 1752.370 2742.770 84.00000 1451.290 1973.820 27.00000 5149.300 5917.010 327.0000 812.7000 1118.810 43.00000 1899.700 2052.160 61.00000 3692.850 6113.110 240.0000 4732.900 9228.250 222.0000 2180.230 2866.650 80.00000 6 2291.160 1758.770 120.0000 22 2539.760 2545.630 7 1345.170 939.1000 58.00000 23 3046.950 4787.900 8 656.7700 694.9400 31.00000 24 2192.630 3255.290 9 370.1800 363.4800 16.00000 25 5364.830 8129.680 10 1590.360 2511.990 66.00000

26 4834.680 5260.200 11

27

616.7100 973.7300 58.00000

7549.580 7518.790 12

617.9400 516.0100 28.00000

28 867.9100 984.5200

13 4429.190 3785.910 61.00000 29 4611.390 18626.94 14 5749.020 8688.030 254.0000 30 170.3000 610.9100 15 1781.370 2798.900 83.00000 31

325.5300 1523.190 16

1243.070 1808.440 33.00000

设定模型为:YAKLe

(1) 利用上述资料,进行回归分析;

(2) 回答:中国2000年的制造业总体呈现规模报酬不变状态吗? 将模型进行双对数变换如下:

lnYlnAlnKlnL

1)进行回归分析:

精品文档

96.00000 222.0000 163.0000 244.0000 145.0000

138.0000

46.00000 218.0000 19.00000 45.00000

精品文档

得到如下回归结果:

于是,样本回归方程为:

ˆ1.1540.609lnK0.361lnL lnY (1.59) (3.45) (1.79)

R20.8099,R0.7963,F59.66

从回归结果可以看出,模型的拟合度较好,在显著性水平0.1的条件下,各项系

数均通过了t检验。从F检验可以看出,方程对Y的解释程度较少。

R0.7963表明,工业总产值对数值的79.6%的变化可以由资产合计对数与职工

精品文档

精品文档

的对数值的变化来解释,但仍有20.4%的变化是由其他因素的变化影响的。

ˆ0.971,即资产与劳动的产出弹性之和近似为1,ˆ从上述回归结果看,表明中国制造业在2000年基本呈现规模报酬不变的状态。

2. 表3.3列出了某地区家庭人均鸡肉年消费量Y与家庭月平均收入X,鸡肉价格P1,猪肉价格P2与牛肉价格P3的相关数据。

年份 Y/千

X/

P1/(元/P2/(元/P3/(元/年份 Y/千P1/(元/

P2/(元/

元 千克)

千克)

千克)

克 X/元 千克) 千克)

1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258

6.64 14.10 1990 4.04 768 3.86 7.32 10.61 2002 5.29 2478

7.04

16.82

1991 4.03 843

3.98

6.78

10.48

(1) 求出该地区关于家庭鸡肉消费需求的如下模型:

lnY01lnX2lnP13lnP24lnP3u

(2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。

先做回归分析,过程如下:

精品文档

P3/(元/千克)

11.40 12.41 12.76 14.29 14.36 13.92 16.55 20.33 21.96 22.16 23.26

精品文档

输出结果如下:

所以,回归方程为:

lnY0.73150.3463lnX0.5021lnP10.1469lnP20.0872lnP3

(-2.463) (4.182) (-4.569) (1.483) (0.873)

由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,

而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显著。

验证猪肉价格和鸡肉价格是否有影响,可以通过赤池准则(AIC)和施瓦茨准则

精品文档

精品文档

(SC)。若AIC值或SC值减少了,就应该去掉该解释变量。

去掉猪肉价格P2与牛肉价格P3重新进行回归分析,结果如下:

Variable C LOG(X) LOG(P1)

R-squared

Coefficient

-1.125797 0.451547 -0.372735

Std. Error

0.088420 0.024554 0.063104

t-Statistic

-12.73237 18.38966 -5.906668

Prob.

0.0000 0.0000 0.0000

1.361301 0.187659 -4.218445 -4.070337 497.2843 0.000000

0.980287 Mean dependent var 0.978316 S.D. dependent var 0.027634 Akaike info criterion 0.015273 Schwarz criterion 51.51212 F-statistic 1.877706 Prob(F-statistic)

Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

通过比较可以看出,AIC值和SC值都变小了,所以应该去掉猪肉价格P2与牛肉价格P3这两个解释变量。所以该地区猪肉与牛肉价格确实对家庭的鸡肉消费不产生显著影响。

3、 某硫酸厂生产的硫酸的透明度指标一直达不到优质要求,经分析透明度低与硫酸中金属杂质的含量太高有关。影响透明度的主要金属杂质是铁、钙、铅、镁等。通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。

测量了47组样本值,数据见表3.4。

表3.4 硫酸透明度y与铁杂质含量x数据

序数 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

精品文档

X 31 32 34 35 36 37 39 40 42 42 43 43 48 49 50 52 Y 190 190 180 140 150 120 110 81 100 80 110 80 68 80 50 70 序数 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 X 60 60 61 63 64 65 69 74 74 76 79 85 87 89 99 76 Y 50 41 52 34 40 25 30 20 40 25 30 25 16 16 20 20

精品文档

17 18 19 20 21 22 23 24

52 53 54 54 56 56 58 58 50 60 44 54 48 50 56 52

41 42 43 44 45 46 47 100 100 110 110 122 154 210 20 20 15 15 27 20 20

硫酸透明度y与铁杂质含量的散点图如下

所以应该建立非线性回归模型。

1. 通过线性化的方式估计非线性模型。

(1) 建立倒数模型,在Equation Specification(方程设定)框中输入

精品文档

精品文档

得到输出结果为

所以倒数表达式为:

1/y0.0692.37(1/x)

精品文档

精品文档

(18.57) (-11.95)

R20.76,F143,DW1.095

(2) 建立指数函数

方程设定为:

得到输出结果为:

所以指数表达式为:

lny1.99104.5(1/x)

精品文档

精品文档

(22) (21.6)

R20.91,F468.38,DW1.71

把表达式还原为指数形式:

3lnyln(7.33)104.5(1/x) 即 y7.3e1104.5(x

)可决系数也由0.76提高到0.91,可见拟合为指数函数比倒数函数更好。

2. 直接估计非线性回归模型

直接估计的方程设定如下图所示:

得到输出结果为:

精品文档

精品文档

对应的非线性估计结果是:

y8.2965e1100.1()x

2 (11) (29.4) R0.96

可见可决系数由0.91提高到0.96,则直接估计结果比线性化之后估计更好。

精品文档

因篇幅问题不能全部显示,请点此查看更多更全内容

Top