Matlab中polyfit和regress

来源：个人技术集锦

1.表中是道琼斯工业指数（DJIA）和标准普尔500种股票指数（S&P500）1988年至1997年对应股票的收益率资料：

计算两种指数收益率的相关系数，分析其相关程度，以0.05的显著性水平检验相关系数的显著性。

1 x = [16.0 31.7 -0.4 23.9 7.4 16.8 4.9 36.4 28.6 24.9];

2 y = [16.6 31.5 -3.2 30.0 7.6 10.1 1.3 37.6 23.0 33.4];

3 scatter(x,y,'r*');

4 xlabel('DJIA收益率（%）');

5 ylabel('S&P500收益率（%）');

6 p = polyfit(x,y,1);%1表示一次函数

7 hold on;

8 xx = -5:1:40;

9 yy = polyval(p,xx);

10 plot(xx,yy,'b-');%画出来的是光滑的曲线

11 grid;

12 title('回归分析表')

13 hold off;

14 [r,p,rlo,rup] = corrcorf(x,y)%相关分析

16 >> [r,p,rlo,rup] = corrcoef(x,y)

18 r =

20 1.0000 0.9481

21 0.9481 1.0000

24 p =

26 1.0000 0.0000

27 0.0000 1.0000

30 rlo =

32 1.0000 0.7903

33 0.7903 1.0000

36 rup =

38 1.0000 0.9880

39 0.9880 1.0000

41 >> [i,j] = find(p<0.05);

42 >> [i,j] = find(p<0.05)

44 i =

46 2

47 1

50 j =

52 1

53 2

55 %r(i,j)表示相关系数

56 %P表示假设检验的P-value值，P-value值越小表示的相关性越显著。

57 %一般以P < 0.05 为显著， P<0.01 为非常显著

附录：r(1,2) = r(2,1) = 0.9481便是相关系数，t = r*sqrt(n-2)/sqrt(1-r^2) = 8.4335，tα/2 = 2.31，则结果是显著的。

rlo和rup是r在%95可信度下的置信区间。

2.regress解决上题

1 x = [16.0 31.7 -0.4 23.9 7.4 16.8 4.9 36.4 28.6 24.9];

2 y = [16.6 31.5 -3.2 30.0 7.6 10.1 1.3 37.6 23.0 33.4];

4 scatter(x,y,'r*');

5 xlabel('DJIA收益率（%）');

6 ylabel('S&P500收益率（%）');

7 Y = y';

8 X = [ones(length(y),1),x'];

9 [b,bint,r,rint,stats]=regress(Y,X)

10 %下面是返回值

11 b =

13 -2.5086

14 1.1198

17 bint =

19 -9.3225 4.3052

20 0.8137 1.4259

23 r =

25 1.1918

26 -1.4891

27 -0.2435

28 5.7454

29 1.8221

30 -6.2040

31 -1.6784

32 -0.6522

33 -6.5177

34 8.0256

37 rint =

39 -10.0742 12.4578

40 -11.9810 9.0029

41 -9.6540 9.1671

42 -4.3221 15.8128

43 -8.7610 12.4052

44 -16.1645 3.7565

45 -11.9494 8.5926

46 -10.4663 9.1620

47 -15.8388 2.8034

48 -0.7121 16.7633

51 stats =

53 0.8990 71.1816 0.0000 23.5811

54 %ployval函数中第一个多项式系数（行向量）是按高到低，而regress中的b是从低到高，而且是个列向量，不可直

56 %接bb = b',若是这样还需逆置（fliplr(bb)）,或者直接顺时针旋转90

57 %B=rot90(A):矩阵B是矩阵A沿逆时针方向旋转90。得到的

58 %B=rot90(A,k):矩阵B是矩阵A沿逆时针方向旋转k*90。得到的(要想顺时针旋转，k取-1)

60 xx = -5:5:40;

61 yy = polyval(rot90(b,-1));

62 hold on;

63 plot(xx,yy,'r')

64 grid

进行线性回归时，有4个基本假定：

① 因变量与自变量之间存在线性关系；

② 残差是独立的；

③ 残差满足方差奇性；

④ 残差满足正态分布。

在Matlab软件包中有一个做一般多元回归分析的命令regeress，调用格式如下： [b, bint, r, rint, stats] = regress(y,X,alpha) 或者 [b, bint, r, rint, stats] = regress(y,X) 此时，默认alpha ＝ 0.05.

这里，y是一个的列向量，X是一个的矩阵，其中第一列是全1向量（这一点对于回归来说很重要，这一个全1列向量对应回归方程的常数项），一般情况下，需要人工造一个全1列向量。

回归方程具有如下形式：其中，是残差。在返回项[b,bint,r,rint,stats]中，

① 是回归方程的系数； ② 是一个矩阵，它的第行表示的(1-alpha)置信区间； ③ 是的残差列向量； ④ 是矩阵，它的第行表示第个残差的(1-alpha)置信区间；

注释：残差与残差区间杠杆图，最好在0点线附近比较均匀的分布，而不呈现一定的规律性，如果是这样，就说明回归分析做得比较理想。 ⑤ 一般的，返回4个值：值、F_检验值、阈值，与显著性概率相关的值（如果这个值不存在，则，只输出前3项）。

注释：（1）一般说来，值越大越好。（2）人们一般用以下统计量对回归方程做显著性检验：F_检验、t_检验、以及相关系数检验法。Matlab软件包输出F_检验值和阈值。一般说来，F_检验值越大越好，特别的，应该有F_检验值。（3）与显著性概率相关的值应该满足。如果，则说明回归方程中有多余的自变量，可以将这些多余的自变量从回归方程中剔除（见下面逐步回归的内容）。这几个技术指标说明拟合程度的好坏。这几个指标都好，就说明回归方程是有意义的。

3.解同余方程组

1 >> syms n

2 >> solve(mod(n,10) - 9,mod(n,9) - 8,mod(n,8) - 7)

3 Warning: 3 equations in 1 variables.

4 Warning: Explicit solution could not be found.

5 > In solve at 81

7 ans =

9 [ empty sym ]

注意：matlab里求余不是%也不是mod，而是rem(x,y)

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

Matlab中polyfit和regress