Exercise 18

Analyze class homeworks


In [101]:
import pandas as pd
import numpy as np

%matplotlib inline
import matplotlib.pyplot as plt

data = pd.read_excel('../datasets/E18.xlsx')
data.head()


Out[101]:
Sexo T1 T2 T3 T4 T5 T6
0 H Un científico de datos y un ingeniero de datos... NaN Los árboles de decisión es uno de los algoritm... NaN En el documento "Do We Need Hundreds of Classi... Boosting builds models from individual so call...
1 H Aunque los dos perfiles cuentan con habilidade... Aunque el conceso no es total en el tema de ma... NaN En Machine Learing el propósito de los métodos... El paper publicado en 2014 hace una evaluación... Gradient Boosting ClassifierGradient Boosting ...
2 H Python vs Stata. Analizar información es un pr... En el marco del Machine Learning encontramos c... Árbol de clasificación Como su nombre lo indic... Este es un mecanismo que utiliza varios algori... El paper analiza 179 clasificadores de 17 dife... Gradient Boosting Classifier busca aprender de...
3 M Los algoritmos de machine learning buscan pred... Los algoritmos de machine learning buscan pred... Los arboles de decisión pertenecen a los algor... Consideremos el siguiente ejemplo: Una persona... ¿Se necesitan cientos de modelos para resolver... NaN
4 H Python vs R para análisis de datos. A pesar de... Tipos de aprendizaje en Machine Learning. El M... Tipos de árboles de decisión y aplicaciones. U... La combinación de modelos o ensemble es un mod... En el articulo se analizan cerca de 180 clasif... XGBoosting vs GBoosting. A pesar de que el alg...

Exercise 18.1

Analyze the writing patterns of each student


In [ ]:

Exercise 18.2

Evaluate the similarities of the homeworks of the students

tip: https://github.com/orsinium/textdistance


In [ ]:

Exercise 18.3

Create a classifier to predict the sex of each student


In [ ]: