github线性回归怎么实现

免费建站   2024年04月13日 10:32  

本篇内容介绍了“github线性回归怎么实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

Simple Linear Regression

Data Preprocessing

1 读入数据集

#Importingthedatasetdataset<-read.csv('studentscores.csv')#时间和得分之间的关系HoursScores12.52125.14733.22748.57553.53061.520plot(dataset$Hours,dataset$Scores)#

2 数据预处理

首先按照上次分享的进行数据预处理

R|ML_code-入门(1)

3 训练集和测试集

将数据按照4:1拆分,每一组分别包含自变量和因变量

#SplittingthedatasetintotheTrainingsetandTestset#install.packages('caTools')library(caTools)set.seed(123)split=sample.split(dataset$Scores,SplitRatio=1/4)training_set<-subset(dataset,split==TRUE)test_set<-subset(dataset,split==FALSE)#FeatureScaling#training_set<-scale(training_set)#test_set<-scale(test_set)

4 模型拟合及预测

通过训练集进行模型拟合得到曲线,然后将测试集的X_test带入曲线中,得到预测结果y_pred,最后将预测结果y_pred与测试集中的y_test进行比较,确定预测是否准确。

#FittingSimpleLinearRegressiontotheTrainingsetregressor=lm(formula=Scores~Hours,data=training_set)#Predictingtheresultsy_pred<-predict(regressor,newdata=test_set)

5 结果可视化

#VisualisingtheTrainingresultslibrary(ggplot2)ggplot()+geom_point(aes(x=training_set$Hours,y=training_set$Scores),colour='red')+geom_line(aes(x=training_set$Hours,y=predict(regressor,newdata=training_set)),colour='blue')+ggtitle('ScoresvsHours(Trainingset)')+xlab('Hours')+ylab('Scores')#VisualisingtheTestresultslibrary(ggplot2)ggplot()+geom_point(aes(x=test_set$Hours,y=test_set$Scores),colour='red')+geom_line(aes(x=training_set$Hours,y=predict(regressor,newdata=training_set)),colour='blue')+ggtitle('ScoresvsHours(Testset)')+xlab('Hours')+ylab('Scores')

“github线性回归怎么实现”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!

域名注册
购买VPS主机

您或许对下面这些文章有兴趣:                    本月吐槽辛苦排行榜

看贴要回贴有N种理由!看帖不回贴的后果你懂得的!


评论内容 (*必填):
(Ctrl + Enter提交)   

部落快速搜索栏

各类专题梳理

网站导航栏

X
返回顶部