如何使用R读取DataSet
如何使用R读取DataSet
我有3个CSV文件。train.csv - 训练集,test.csv - 测试集和sampleSubmission.csv - 一个正确格式的样本提交文件。我在R中是新手。我不知道如何读取它。
这是数据集的驱动器链接
https://drive.google.com/open?id=1YPw-MPlW7g2y19GT1ITy_fHbjrKBNc-M
问题的出现原因:
问题出现的原因是需要使用R语言读取数据集,但是没有提供具体的方法和代码。
解决方法:
下面提供了一个简单的解决方法,可以使用以下代码来读取数据集:
dTest <- read.csv("test.csv") #读取数据集 dTrain <- read.csv("train.csv") dSub <- read.csv("sub.csv") dTrain$y <- as.logical(dTrain$y) #将y的类型更改为逻辑型 library(rpart) dtree <- rpart(y ~ . - id, data=dTrain) #构建决策树 all(dSub$id == dTest$id) #测试dSub$id的顺序是否等于dTest$id #[1] TRUE dSub$y <- predict(dtree, newdata=dTest) #进行预测 head(dSub)
以上就是读取数据集的方法和代码。