Análisis de los datos obtenidos

Uso de ipython para el análsis y muestra de los datos obtenidos durante la producción.Se implementa un regulador experto. Los datos analizados son del día 13 de Agosto del 2015

Los datos del experimento:

Hora de inicio: 10:30
Hora final : 11:00
Filamento extruido: 447cm
$T: 150ºC$
$V_{min} tractora: 1.5 mm/s$
$V_{max} tractora: 3.4 mm/s$
Los incrementos de velocidades en las reglas del sistema experto son distintas:
- En los caso 3 y 5 se mantiene un incremento de +2.
- En los casos 4 y 6 se reduce el incremento a -1.



In [20]:

    
#Importamos las librerías utilizadas
import numpy as np
import pandas as pd
import seaborn as sns



In [21]:

    
#Mostramos las versiones usadas de cada librerías
print ("Numpy v{}".format(np.__version__))
print ("Pandas v{}".format(pd.__version__))
print ("Seaborn v{}".format(sns.__version__))









    



Numpy v1.9.2
Pandas v0.16.2
Seaborn v0.6.0



In [22]:

    
#Abrimos el fichero csv con los datos de la muestra
datos = pd.read_csv('ensayo4.CSV')



In [23]:

    
%pylab inline









    



Populating the interactive namespace from numpy and matplotlib






    



WARNING: pylab import has clobbered these variables: ['box']
`%matplotlib` prevents importing * from pylab and numpy



In [24]:

    
#Almacenamos en una lista las columnas del fichero con las que vamos a trabajar
columns = ['Diametro X','Diametro Y', 'RPM TRAC']



In [25]:

    
#Mostramos un resumen de los datos obtenidoss
datos[columns].describe()
#datos.describe().loc['mean',['Diametro X [mm]', 'Diametro Y [mm]']]









    Out[25]:






  
    
      
      Diametro X
      Diametro Y
      RPM TRAC
    
  
  
    
      count
      1125.000000
      1125.000000
      1125.000000
    
    
      mean
      1.715315
      1.723081
      2.449800
    
    
      std
      0.232539
      0.240764
      0.882116
    
    
      min
      1.011880
      1.000236
      1.497500
    
    
      25%
      1.516554
      1.517422
      1.497500
    
    
      50%
      1.723012
      1.712803
      2.387500
    
    
      75%
      1.883591
      1.908185
      3.500000
    
    
      max
      2.307976
      2.344920
      3.500000

Representamos ambos diámetro y la velocidad de la tractora en la misma gráfica



In [26]:

    
graf = datos.ix[:, "Diametro X"].plot(figsize=(16,10),ylim=(0.5,3))
graf.axhspan(1.65,1.85, alpha=0.2)
graf.set_xlabel('Tiempo (s)')
graf.set_ylabel('Diámetro (mm)')
#datos['RPM TRAC'].plot(secondary_y='RPM TRAC')









    Out[26]:





<matplotlib.text.Text at 0x9883f10>



In [27]:

    
box = datos.ix[:, "Diametro X":"Diametro Y"].boxplot(return_type='axes')
box.axhspan(1.65,1.85, alpha=0.2)









    Out[27]:





<matplotlib.patches.Polygon at 0x9ad69f0>

Con esta segunda aproximación se ha conseguido estabilizar los datos. Se va a tratar de bajar ese porcentaje. Como cuarta aproximación, vamos a modificar las velocidades de tracción. El rango de velocidades propuesto es de 1.5 a 5.3, manteniendo los incrementos del sistema experto como en el actual ensayo.



In [ ]:

Comparativa de Diametro X frente a Diametro Y para ver el ratio del filamento



In [28]:

    
plt.scatter(x=datos['Diametro X'], y=datos['Diametro Y'], marker='.')









    Out[28]:





<matplotlib.collections.PathCollection at 0x9daf9d0>

Filtrado de datos

Las muestras tomadas $d_x >= 0.9$ or $d_y >= 0.9$ las asumimos como error del sensor, por ello las filtramos de las muestras tomadas.



In [29]:

    
datos_filtrados = datos[(datos['Diametro X'] >= 0.9) & (datos['Diametro Y'] >= 0.9)]



In [30]:

    
#datos_filtrados.ix[:, "Diametro X":"Diametro Y"].boxplot(return_type='axes')

Representación de X/Y



In [31]:

    
plt.scatter(x=datos_filtrados['Diametro X'], y=datos_filtrados['Diametro Y'], marker='.')









    Out[31]:





<matplotlib.collections.PathCollection at 0x9df2c90>

Analizamos datos del ratio



In [32]:

    
ratio = datos_filtrados['Diametro X']/datos_filtrados['Diametro Y']
ratio.describe()









    Out[32]:





count    1125.000000
mean        1.006727
std         0.148785
min         0.535851
25%         0.911347
50%         0.993264
75%         1.091330
max         1.721730
dtype: float64



In [33]:

    
rolling_mean = pd.rolling_mean(ratio, 50)
rolling_std = pd.rolling_std(ratio, 50)
rolling_mean.plot(figsize=(12,6))
# plt.fill_between(ratio, y1=rolling_mean+rolling_std, y2=rolling_mean-rolling_std, alpha=0.5)
ratio.plot(figsize=(12,6), alpha=0.6, ylim=(0.5,1.5))









    Out[33]:





<matplotlib.axes._subplots.AxesSubplot at 0x9db9590>

Límites de calidad

Calculamos el número de veces que traspasamos unos límites de calidad. $Th^+ = 1.85$ and $Th^- = 1.65$



In [34]:

    
Th_u = 1.85
Th_d = 1.65



In [35]:

    
data_violations = datos[(datos['Diametro X'] > Th_u) | (datos['Diametro X'] < Th_d) |
                       (datos['Diametro Y'] > Th_u) | (datos['Diametro Y'] < Th_d)]



In [36]:

    
data_violations.describe()









    Out[36]:






  
    
      
      Tmp Husillo
      Tmp Nozzle
      Diametro X
      Diametro Y
      MARCHA
      PARO
      RPM EXTR
      RPM TRAC
    
  
  
    
      count
      1058.000000
      1058.000000
      1058.000000
      1058.000000
      1058
      1058
      1058
      1058.000000
    
    
      mean
      63.973535
      151.231664
      1.712236
      1.721711
      1
      1
      0
      2.434397
    
    
      std
      0.708737
      0.791708
      0.239010
      0.247800
      0
      0
      0
      0.883503
    
    
      min
      62.900000
      149.500000
      1.011880
      1.000236
      True
      True
      0
      1.497500
    
    
      25%
      63.200000
      150.600000
      1.516554
      1.517422
      1
      1
      0
      1.497500
    
    
      50%
      64.100000
      151.200000
      1.700073
      1.701310
      1
      1
      0
      2.387500
    
    
      75%
      64.600000
      151.800000
      1.895061
      1.919678
      1
      1
      0
      3.500000
    
    
      max
      65.000000
      153.200000
      2.307976
      2.344920
      True
      True
      0
      3.500000



In [37]:

    
data_violations.plot(subplots=True, figsize=(12,12))









    Out[37]:





array([<matplotlib.axes._subplots.AxesSubplot object at 0x09E1DDF0>,
       <matplotlib.axes._subplots.AxesSubplot object at 0x09E74D90>,
       <matplotlib.axes._subplots.AxesSubplot object at 0x09EA41B0>,
       <matplotlib.axes._subplots.AxesSubplot object at 0x09EC2850>,
       <matplotlib.axes._subplots.AxesSubplot object at 0x09EE9B30>,
       <matplotlib.axes._subplots.AxesSubplot object at 0x08CACF90>,
       <matplotlib.axes._subplots.AxesSubplot object at 0x09F21350>,
       <matplotlib.axes._subplots.AxesSubplot object at 0x09F4A6D0>], dtype=object)



In [ ]:

	Diametro X	Diametro Y	RPM TRAC
count	1125.000000	1125.000000	1125.000000
mean	1.715315	1.723081	2.449800
std	0.232539	0.240764	0.882116
min	1.011880	1.000236	1.497500
25%	1.516554	1.517422	1.497500
50%	1.723012	1.712803	2.387500
75%	1.883591	1.908185	3.500000
max	2.307976	2.344920	3.500000

	Tmp Husillo	Tmp Nozzle	Diametro X	Diametro Y	MARCHA	PARO	RPM EXTR	RPM TRAC
count	1058.000000	1058.000000	1058.000000	1058.000000	1058	1058	1058	1058.000000
mean	63.973535	151.231664	1.712236	1.721711	1	1	0	2.434397
std	0.708737	0.791708	0.239010	0.247800	0	0	0	0.883503
min	62.900000	149.500000	1.011880	1.000236	True	True	0	1.497500
25%	63.200000	150.600000	1.516554	1.517422	1	1	0	1.497500
50%	64.100000	151.200000	1.700073	1.701310	1	1	0	2.387500
75%	64.600000	151.800000	1.895061	1.919678	1	1	0	3.500000
max	65.000000	153.200000	2.307976	2.344920	True	True	0	3.500000