Dado que, boa parte do desempenho e resultado das técnicas vistas em sala de aula são diretamente impactadas pela escolha ou tratamento do espaço de entrada (ou espaço de amostras) nessa parte de nosso projeto iremos fazer um estudo das features, possiveis correlações e principalmente remoção das features pouco significativas.
In [1]:
load_dataset <- function(filename) {
# Load and return the content of `filename` into a DataFrame
read.csv(filename)
}
In [2]:
dataset <- load_dataset("../dataset/xAPI-Edu-Data-full.csv")
head(dataset)
In [3]:
str(dataset)
In [4]:
names(dataset)
In [5]:
summary(dataset)