In [1]:
#Start your first DM project with R
In [12]:
#载入数据集(一个简单的分类)
In [4]:
data(iris) #载入Iris数据集
In [5]:
dataset<-iris #重命名
In [9]:
index<-sample(1:nrow(dataset),0.8*nrow(dataset))
In [10]:
test<-dataset[-index,]
In [11]:
train<-dataset[index,]
In [13]:
#对数据集进行汇总
In [14]:
dim(train)#数据集的维度
Out[14]:
In [15]:
sapply(train,class)#属性的类型
Out[15]:
In [16]:
str(train)#可代替上面两个
In [17]:
head(train)#查看数据集
Out[17]:
In [19]:
levels(train$Species)#分类的层次
Out[19]:
In [20]:
summary(train)#统计归纳
Out[20]: