许可优化
许可优化
产品
产品
解决方案
解决方案
服务支持
服务支持
关于
关于
软件库
当前位置:服务支持 >  软件文章 >  重学统计学第15章:多元回归分析详解

重学统计学第15章:多元回归分析详解

阅读数 8
点赞 0
article_banner

怎么算两列数之间的 correlatoin coefficient?

15.1 Multiple Regression Model

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

15.3 Coefficient of Determination

这里写图片描述

这里写图片描述

Why Adjusted?

   Avoid overestimating the impact of adding an independent variable on the amount of variability explained by the estimated regression equation.

15.4 Model Assumptions

这里写图片描述

这里写图片描述

15.5 Testing for Significance

F test for overall significance; T test for individual significance

F Test

H0: β1 = β2 = … = βp = 0

   Ha: One or more of the parameters is not equal to zero
这里写图片描述

   n= 观测数目

   p =自变量数目

这里写图片描述

t Test

这里写图片描述

Multicollinearity 多重共线性

当多元回归方程总体显著性的 F 检验表明有一个显著关系时,我们可能得出单个参数没有一个是显著地不同于0的结论。只有当自变量之间的相关性非常小,才有可能回避这个问题。

F test is significant. but two t test is not significant. With x2 already in the model, x1 does not make a significant contribution to determining the value of y. 怎么发现?当两个自变量的 correlation coefficient >0.7

15.7 Qualitative Independent Variables

如果 qualitative variables 是两个的话,那么可以变成 0 1

The important point to remember is that when a qualitative variable has k levels, k-1 dummy variables are required in the multiple regression analysis.

15.8 Residual Analysis

Detecting Outliers

Minitab classifies an observation as an outlier if the value of its standardized residual is less than -2 or greater than +2.

Influential Observations

Minitab computes the leverage values and uses the rule of thumb hi > 3( p + 1)/n to identify influential observations.

Cook’s Distance

这里写图片描述

如果 Di >1,那么表明第 i 次观测值是一个有影响力的观测值,并对这个观测值做进一步的考察。

15.9 Logistic Regression

这里写图片描述

这里写图片描述

   The Probability of y=1 given x1,x2,…,xp

这里写图片描述

Testing for Significance

H0: β1 = β2 = 0

   Ha: One or both of the parameters is not equal to zero

G follows a chi-square distribution with degrees of freedom equal to the number of independent variables in the model

   如果是一个个的 Variable,就用 z test

Managerial Use

问题是:发 coupon,想预测一下哪些消费者在收到 coupon 会用?

   通过 logistics regression,得到下面的这张表:
这里写图片描述

   结果:

   Customers who have a Simmons credit card: Send the catalog to every customer who spent 2000 or more last year

   Customers who do not have a Simmons credit card: Send the catalog to every customer who spent 6000 or more last year

Interpreting Logistic Regression Equation

The odds in favor of an event occurring is defined as the probability the event will occur divided by the probability the event will not occur.

Odds ratio: odds of a one-unit increase in only one of the independent variables.

   Odds Ratio = odds1 / odds0

这里写图片描述

Logit Transformation

这里写图片描述

这里写图片描述


免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删

相关文章
技术文档
QR Code
微信扫一扫,欢迎咨询~
customer

online

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 board-phone 155-2731-8020
close1
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

姓名不为空

姓名不为空
手机不正确

手机不正确

手机不正确
公司不为空

公司不为空

公司不为空