暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

R语言分段回归数据数据分析案例报告

拓端数据部落 2022-12-23
309

原文链接: http://tecdat.cn/?p=3805 



我们在这里讨论所谓的“分段线性回归模型”,因为它们利用包含虚拟变量的交互项点击文末“阅读原文”获取完整代码数据


读取数据

data=read.csv("artificial-cover.csv")

复制


查看部分数据

head(data)

#
#   tree.cover shurb.grass.cover
## 1       13.2              16.8
## 2       17.2              21.8
## 3       45.4              48.8
## 4       53.6              58.7
## 5       58.5              55.5
## 6       63.3              47.2

复制



###########用lm拟合,主要注意部分是bs(age,knots=c(...))这部分把自变量分成不同部分
fit =lm(tree.cover~bs(shurb.grass.cover ,knots
############进行预测,预测数据也要分区
pred= predict (fit , newdata =list(shurb.grass.cover =data$shurb.grass.cover),se=T)
#############然后画图
plot(fit)

复制

可以构造一个相对复杂的 LOWESS 模型(span参数取小一些),然后和一个简单的模型比较,如:

qplot(x, y) + geom_smooth()  # 总趋势

复制

相关视频



散点图分为两部分

我们可以将原始散点图分为两部分,并拟合两条单独但相连的线。估计的分段式函数连接,在描述数据趋势方面做得更好。


点击标题查阅往期内容


样条曲线分段线性回归模型piecewise regression估计个股beta值分析收益率数据


左右滑动查看更多


01

02

03

04



因此,让我们为这些数据建立一个分段线性回归模型并可视化:

0) + geom_smooth() + theme(panel.background = element_rect(fill = 'white', colour = 'black')) 

复制

 







点击文末“阅读原文”

获取全文完整代码数据资料


本文选自《R语言分段回归数据数据分析案例报告》。


点击标题查阅往期内容

【视频】CNN(卷积神经网络)模型以及R语言实现回归数据分析
用收缩估计股票beta系数回归分析Microsoft收益率风险
对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归
多项式Logistic逻辑回归进行多类别分类和交叉验证准确度箱线图可视化
R语言分段线性回归分析预测车辆的制动距离
R语言分段回归数据数据分析案例报告
R语言stan进行基于贝叶斯推断的回归模型
R语言时变面板平滑转换回归模型TV-PSTR分析债务水平对投资的影响
R语言线性回归和时间序列分析北京房价影响因素可视化案例
R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
R语言实现CNN(卷积神经网络)模型进行回归数据分析
R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归
R语言中使用非凸惩罚函数回归(SCAD、MCP)分析前列腺数据
【视频】R语言实现CNN(卷积神经网络)模型进行回归数据分析
R语言ISLR工资数据进行多项式回归和样条回归分析
R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型
R语言如何和何时使用glmnet岭回归
逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化
高维数据惩罚回归方法:主成分回归PCR、岭回归、lasso、弹性网络elastic net分析基因数
分类回归决策树交互式修剪和更美观地可视化分析细胞图像分割数据集
实现广义相加模型GAM和普通最小二乘(OLS)回归
贝叶斯线性回归和多元线性回归构建工资预测模型
Python支持向量回归SVR拟合、预测回归数据和可视化准确性检查实例
逻辑回归(对数几率回归,Logistic)分析研究生录取数据实例
广义线性模型glm泊松回归的lasso、弹性网络分类预测学生考试成绩数据和交叉验证
非线性回归nls探索分析河流阶段性流量数据和评级曲线、流量预测可视化
特征选择方法——最佳子集回归、逐步回归
线性回归和时间序列分析北京房价影响因素可视化案例
贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据
用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化
PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
R语言集成模型:提升树boosting、随机森林、约束最小二乘法加权平均模型融合分析时间序列数据
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
R语言基于树的方法:决策树,随机森林,Bagging,增强树
R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
spss modeler用决策树神经网络预测ST的股票
R语言中使用线性模型、回归决策树自动组合特征因子水平
R语言中自编基尼系数的CART回归决策树的实现
R语言用rle,svm和rpart决策树进行时间序列预测
python在Scikit-learn中用决策树和随机森林预测NBA获胜者
python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证
R语言里的非线性模型:多项式回归、局部样条、平滑样条、 广义相加模型GAM分析
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
R语言ISLR工资数据进行多项式回归和样条回归分析
R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量
R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测
R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化
如何用R语言在机器学习中建立集成模型?
R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测
在python 深度学习Keras中计算神经网络集成模型
R语言ARIMA集成模型预测时间序列分析
R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者
R语言基于树的方法:决策树,随机森林,Bagging,增强树
R语言基于Bootstrap的线性回归预测置信区间估计方法
R语言使用bootstrap和增量法计算广义线性模型(GLM)预测置信区间
R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
Matlab建立SVM,KNN和朴素贝叶斯模型分类绘制ROC曲线
matlab使用分位数随机森林(QRF)回归树检测异常值



文章转载自拓端数据部落,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论