notebook.community

Edit and run



In [1]:

    
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris



In [2]:

    
data = load_iris()



In [3]:

    
X = data['data']
y = data['target']



In [4]:

    
print(X.shape)



In [5]:

    
print(X[:5])









    



[[5.1 3.5 1.4 0.2]
 [4.9 3.  1.4 0.2]
 [4.7 3.2 1.3 0.2]
 [4.6 3.1 1.5 0.2]
 [5.  3.6 1.4 0.2]]



In [6]:

    
print(y.shape)









    



(150,)



In [7]:

    
print(y)









    



[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]



In [8]:

    
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)



In [9]:

    
print(X_train.shape)



In [10]:

    
print(X_test.shape)



In [11]:

    
print(y_train.shape)









    



(112,)



In [12]:

    
print(y_test.shape)









    



(38,)



In [13]:

    
print(y_test)









    



[2 1 0 2 0 2 0 1 1 1 2 1 1 1 1 0 1 1 0 0 2 1 0 0 2 0 0 1 1 0 2 1 0 2 2 1 0
 1]



In [14]:

    
print((y_test == 0).sum())



In [15]:

    
print((y_test == 1).sum())



In [16]:

    
print((y_test == 2).sum())



In [17]:

    
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0, stratify=y)



In [18]:

    
print(y_test)









    



[0 0 0 0 1 1 1 0 1 2 2 2 1 2 1 0 0 2 0 1 2 1 1 0 2 0 0 1 2 1 0 1 2 2 0 1 2
 2]



In [19]:

    
print((y_test == 0).sum())



In [20]:

    
print((y_test == 1).sum())



In [21]:

    
print((y_test == 2).sum())