notebook.community

Edit and run



In [1]:

    
import os
import sys
root_path = os.path.abspath("../../../")
if root_path not in sys.path:
    sys.path.append(root_path)

import time
import numpy as np

from Util.Util import DataUtil
from Util.ProgressBar import ProgressBar

train_num = 6000
(x_train, y_train), (x_test, y_test) = DataUtil.get_dataset(
    "mushroom", "../../../_Data/mushroom.txt",
    n_train=train_num, tar_idx=0
)
x_train, y_train, wc, features, feat_dicts, label_dict = DataUtil.quantize_data(x_train, y_train)
x_test, y_test = DataUtil.transform_data(x_test, y_test, wc, feat_dicts, label_dict)



In [2]:

    
from sklearn.linear_model import LogisticRegression

clf = LogisticRegression()
clf.fit(x_train, y_train)
y_pred = clf.predict(x_test)



In [3]:

    
with open("../../../_Data/prices.txt", "r") as file:
    data = np.array([line.strip().split(",") for line in file], dtype=np.float32)
data[:3]









    Out[3]:





array([[   2104.,  399900.],
       [   1600.,  329900.],
       [   2400.,  369000.]], dtype=float32)



In [4]:

    
length = len(data)
n_train, n_cv = int(0.7*length), int(0.15*length)
idx = np.random.permutation(length)
train_idx, cv_idx = idx[:n_train], idx[n_train:n_train+n_cv]
test_idx = idx[n_train+n_cv:]
train, cv, test = data[train_idx], data[cv_idx], data[test_idx]
print(len(train), len(cv), len(test), length)



In [5]:

    
letters = np.array(list("qwertyuiopasdfghjklzxcvbnm"))
data = letters[np.random.randint(0, 26, 10000)]
features = set(data)
feat_dic = {c: i for i, c in enumerate(sorted(features))}

def transform(data, feat_dic):
    return [feat_dic[c] for c in data]

print(data[:3], transform(data, feat_dic)[:3])









    



['m' 'i' 'f'] [12, 8, 5]



In [6]:

    
data = ["a", "c", "b"]
print(data, transform(data, feat_dic))









    



['a', 'c', 'b'] [0, 2, 1]



In [7]:

    
def task(cost=0.5, epoch=3, name="", sub_task=None):
    def sub():
        bar = ProgressBar(max_value=epoch, name=name)
        for _ in range(epoch):
            time.sleep(cost)
            if sub_task is not None:
                sub_task()
            bar.update()
    return sub

task(name="Task1", sub_task=task(
    name="Task2", sub_task=task(
        name="Task3")))()









    



## #    Task1     # Progress bar initialized  ##
## #    Task2     # Progress bar initialized  ##
## #    Task3     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  1.503 s; Average:   0 h   0 min 0.5009 s  ## min 0.5008 s 
## #    Task2     # [----------                    ] : 1 / 3 ##  Time Cost:   0 h   0 min  2.003 s; Average:   0 h   0 min  2.003 s 
## #    Task3     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  1.501 s; Average:   0 h   0 min 0.5005 s  ## min 0.5003 s 
## #    Task2     # [--------------------          ] : 2 / 3 ##  Time Cost:   0 h   0 min  4.006 s; Average:   0 h   0 min  2.003 s 
## #    Task3     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  1.503 s; Average:   0 h   0 min  0.501 s  ## min 0.5008 s 
## #    Task2     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min   6.01 s; Average:   0 h   0 min  2.003 s  ##
## #    Task1     # [----------                    ] : 1 / 3 ##  Time Cost:   0 h   0 min  6.511 s; Average:   0 h   0 min  6.511 s 
## #    Task2     # Progress bar initialized  ##
## #    Task3     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  1.501 s; Average:   0 h   0 min 0.5005 s  ## min 0.5005 s 
## #    Task2     # [----------                    ] : 1 / 3 ##  Time Cost:   0 h   0 min  2.002 s; Average:   0 h   0 min  2.002 s 
## #    Task3     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  1.501 s; Average:   0 h   0 min 0.5004 s  ## min 0.5006 s 
## #    Task2     # [--------------------          ] : 2 / 3 ##  Time Cost:   0 h   0 min  4.004 s; Average:   0 h   0 min  2.002 s 
## #    Task3     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  1.502 s; Average:   0 h   0 min 0.5006 s  ## min 0.5005 s 
## #    Task2     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  6.007 s; Average:   0 h   0 min  2.002 s  ##
## #    Task1     # [--------------------          ] : 2 / 3 ##  Time Cost:   0 h   0 min  13.02 s; Average:   0 h   0 min  6.509 s 
## #    Task2     # Progress bar initialized  ##
## #    Task3     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  1.501 s; Average:   0 h   0 min 0.5005 s  ## min 0.5005 s 
## #    Task2     # [----------                    ] : 1 / 3 ##  Time Cost:   0 h   0 min  2.002 s; Average:   0 h   0 min  2.002 s 
## #    Task3     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  1.502 s; Average:   0 h   0 min 0.5007 s  ## min 0.5005 s 
## #    Task2     # [--------------------          ] : 2 / 3 ##  Time Cost:   0 h   0 min  4.004 s; Average:   0 h   0 min  2.002 s 
## #    Task3     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  1.502 s; Average:   0 h   0 min 0.5007 s  ## min 0.5005 s 
## #    Task2     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  6.007 s; Average:   0 h   0 min  2.002 s  ##
## #    Task1     # (3 : 0 -> 3) Task Finished. Time Cost:   0 h   0 min  19.53 s; Average:   0 h   0 min  6.508 s  ##