统计建模:线性回归与离散回归详解
1. Patsy 公式与线性回归基础
Patsy 库在统计建模中具有显著优势,其公式能够自动对分类变量进行编码,方便用户在模型中轻松添加或移除数值和分类变量。而 statsmodels 库支持多种统计模型,不同模型虽适用于不同场景,但大多遵循相似的使用模式,这使得在不同模型间切换变得容易。
1.1 statsmodels 统计模型使用流程
使用 statsmodels 建立和分析统计模型的基本流程如下:
1. 创建模型实例 :可以使用 sm.MODEL(y, X) 或 smf.model(formula, data) 来创建,其中 MODEL 和 model 代表特定模型,如 OLS 、 GLS 、 Logit 等。大写名称的类以设计矩阵为参数,小写名称的类以 Patsy 公式和数据框为参数。
2. 拟合模型 :调用 model.fit() 方法进行拟合,该方法会执行拟合操作并返回一个结果对象,此对象包含用于进一步分析的方法和属性。
3. 查看摘要统计信息 :使用 result.summary() 方法输出拟合结果的摘要文本,其中包含多种统计信息,有助于判断统计模型是否能成功解释数据。查看此输出通常是分析拟合结果的良好起点。
超级会员免费看
订阅专栏 解锁全文
4万+

被折叠的 条评论
为什么被折叠?



