如何使用R读取DataSet

9 浏览
0 Comments

如何使用R读取DataSet

我有3个CSV文件。train.csv - 训练集,test.csv - 测试集和sampleSubmission.csv - 一个正确格式的样本提交文件。我在R中是新手。我不知道如何读取它。

这是数据集的驱动器链接

https://drive.google.com/open?id=1YPw-MPlW7g2y19GT1ITy_fHbjrKBNc-M

0
0 Comments

问题的出现原因:

问题出现的原因是需要使用R语言读取数据集,但是没有提供具体的方法和代码。

解决方法:

下面提供了一个简单的解决方法,可以使用以下代码来读取数据集:

dTest <- read.csv("test.csv")  #读取数据集
dTrain <- read.csv("train.csv")
dSub <- read.csv("sub.csv")
dTrain$y <- as.logical(dTrain$y) #将y的类型更改为逻辑型
library(rpart)
dtree <- rpart(y ~ . - id, data=dTrain) #构建决策树
all(dSub$id == dTest$id) #测试dSub$id的顺序是否等于dTest$id
#[1] TRUE
dSub$y <- predict(dtree, newdata=dTest) #进行预测
head(dSub)

以上就是读取数据集的方法和代码。

0