Antes de meternos a tratar el problema de clasificacion, vamos a ver unas cosas basicas de las gaussianas. Atravez de ellas vamos a entender algunos conceptos de la estadistica y la probabilidad.
En particular vamos a ver los conceptos de:
In [ ]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
In [ ]:
Edades = np.array([10,15, 16, 17, 18, 19, 20, 21, 22, 23, 24,25,26,30,32,33,34,37,38])
Frecuencia = np.array([2,1,20,12,12,20,16,17,9,4,1,2,1,2,1,1,1,1,3])
print(sum(Frecuencia))
plt.bar(Edades, Frecuencia)
plt.show()
In [ ]:
x = np.random.rand(10)
sns.distplot(x,kde=False)
plt.xlim(0,1)
plt.show()
In [ ]:
s = np.random.poisson(2,2000)
sns.distplot(s,kde=False)
plt.show()
In [ ]:
x=np.random.randn(50)
sns.distplot(x)
plt.show()
Una forma de automatizar esto es:
In [ ]:
numeros = [10,50,100,1000,10000]
for n in numeros:
x = np.random.randn(n)
sns.distplot(x)
plt.title('n = %d'%n)
plt.show()
Tambien podemos hacerlo de otra manera con np.random.normal() que tiene 3 argumentos:
In [ ]:
numeros = np.random.normal(loc=2.0,scale=2.0,size=1000)
sns.distplot(numeros)
plt.show()
In [ ]:
In [ ]:
In [ ]:
x = np.random.normal(loc=2.0,scale=0.5,size=100)
y = np.random.normal(loc=2.0,scale=0.5,size=100)
plt.scatter(x,y,c='r',label='rojos')
plt.legend()
plt.show()
Hacer:
Discussion
In [ ]:
In [ ]: