In [ ]:

    
%matplotlib inline
import importlib
import utils2; importlib.reload(utils2)
from utils2 import *



In [ ]:

    
cfg = tf.ConfigProto()
cfg.gpu_options.allow_growth = True
sess = tf.Session(config=cfg)



In [ ]:

    
a = tf.placeholder("float")
b = tf.placeholder("float")
y = tf.multiply(a, b)

print (sess.run(y, feed_dict={a: 3, b: 3}))

Simple regression



In [ ]:

    
num_points = 1000
x_data= np.random.normal(0.0, 0.55, (num_points,))
y_data= x_data * 0.1 + 0.3 + np.random.normal(0.0, 0.03, (num_points,))



In [ ]:

    
plt.scatter(x_data, y_data);



In [ ]:

    
loss = tf.reduce_mean(tf.square(y - y_data))
optimizer = tf.train.GradientDescentOptimizer(0.5)
train = optimizer.minimize(loss)



In [ ]:

    
init = tf.global_variables_initializer()



In [ ]:

    
sess = tf.InteractiveSession(config=cfg)



In [ ]:

    
init.run()
for step in range(8):
    train.run()
    print (step, W.eval(), b.eval())



In [ ]:

    
plt.scatter(x_data, y_data)
plt.plot(x_data, W.eval() * x_data + b.eval());

Variable scope



In [ ]:

    
tf.reset_default_graph()



In [ ]:

    
with tf.variable_scope("foo"):
    v = tf.get_variable("v", [2,3])
v.name



In [ ]:

    
v.get_shape()



In [ ]:

    
with tf.variable_scope("foo", reuse=True):
 v1 = tf.get_variable("v", [2,3])



In [ ]:

    
v1==v



In [ ]:

    
v2 = tf.get_variable("v2", [1])



In [ ]:

    
v2.name

K-means clustering



In [ ]:

    
def plot_data(data, centroids):
    colour = plt.cm.rainbow(np.linspace(0,1,len(centroids)))
    for i, centroid in enumerate(centroids):
        samples = data[i*n_samples:(i+1)*n_samples]
        plt.scatter(samples[:,0], samples[:,1], c=colour[i])
        plt.plot(centroid[0], centroid[1], markersize=15, marker="x", color='k', mew=10)
        plt.plot(centroid[0], centroid[1], markersize=10, marker="x", color='m', mew=5)
    plt.show()



In [ ]:

    
n_clusters=10
n_samples =250
centroids = np.random.uniform(-35, 35, (n_clusters, 2))
slices = [np.random.multivariate_normal(centroids[i], np.diag([5., 5.]), n_samples)
           for i in range(n_clusters)]
data = np.concatenate(slices).astype(np.float32)



In [ ]:

    
plot_data(data, centroids)



In [ ]:

    
# Numpy Version
def find_initial_centroids_numpy(data, k):
    r_index = np.random.randint(data.shape[0])
    r = data[r_index, :][np.newaxis]
    initial_centroids = []
    for i in range(k):
        diff = data - np.expand_dims(r,1)
        dist = np.linalg.norm(diff, axis=2)  # 100x2  5x2 --> 100x5x2 --> 100x5
        farthest_index = np.argmax(np.min(dist, axis=0))
        farthest_point = data[farthest_index]
        initial_centroids.append(farthest_point)
        r = np.array(initial_centroids)
    return r



In [ ]:

    
def find_initial_centroids(data, k):
    r_index = tf.random_uniform([1], 0, tf.shape(data)[0], dtype=tf.int32)
    r = tf.expand_dims(data[tf.squeeze(r_index)], dim=1)
    initial_centroids = []
    for i in range(k):
        diff = tf.squared_difference(tf.expand_dims(data, 0), tf.expand_dims(r,1))
        dist = tf.reduce_sum(diff, axis=2)
        farthest_index = tf.argmax(tf.reduce_min(dist, axis=0), 0)
        farthest_point = data[tf.to_int32(farthest_index)]
        initial_centroids.append(farthest_point)
        r = tf.pack(initial_centroids)
    return r



In [ ]:

    
samples = tf.placeholder(tf.float32, (None, None))



In [ ]:

    
initial_centroids = find_initial_centroids(samples, n_clusters).eval({samples: data})



In [ ]:

    
def choose_random_centroids(samples, n_clusters):
    n_samples = tf.shape(samples)[0]
    random_indices = tf.random_shuffle(tf.range(0, n_samples))
    centroid_indices = random_indices[:n_clusters]
    return tf.gather(samples, centroid_indices)



In [ ]:

    
initial_centroids = find_initial_centroids_numpy(data, n_clusters)



In [ ]:

    
plot_data(data, initial_centroids)



In [ ]:

    
def assign_to_nearest(samples, centroids):
    dim_dists = tf.squared_difference(tf.expand_dims(samples, 0), tf.expand_dims(centroids, 1))
    return tf.argmin(tf.reduce_sum(dim_dists , 2), 0)



In [ ]:

    
def update_centroids(samples, nearest_indices, n_clusters):
    partitions = tf.dynamic_partition(samples, tf.to_int32(nearest_indices), n_clusters)
    return tf.concat(0, [tf.expand_dims(tf.reduce_mean(partition, 0), 0) 
                                  for partition in partitions])



In [ ]:

    
initial_centroids = choose_random_centroids(samples, n_clusters).eval({samples: data})



In [ ]:

    
curr_centroids = tf.Variable(initial_centroids)



In [ ]:

    
nearest_indices = assign_to_nearest(samples, curr_centroids)
updated_centroids = update_centroids(samples, nearest_indices, n_clusters)



In [ ]:

    
tf.global_variables_initializer().run()



In [ ]:

    
c = initial_centroids
for i in range(10):
    #TODO animate
    c2 = curr_centroids.assign(updated_centroids).eval({samples: data})
    if np.allclose(c,c2):
        break
    c=c2



In [ ]:

    
plot_data(data, curr_centroids.eval())

Tf->Keras LR (not working)



In [ ]:

    
class LinRegr(Layer):
    def __init__(self, **kwargs):
        super(LinRegr, self).__init__(**kwargs)

    def build(self, input_shape):
        input_dims = input_shape[1:]
        self.W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
        self.b = tf.Variable(tf.zeros([1]))
        self.built = True

    def call(self, x, mask=None):
        return self.W * x + self.b
    
    def get_output_shape_for(self, input_shape):
        return input_shape



In [ ]:

    
inp = Input((1,))
res = LinRegr()(inp)



In [ ]:

    
model = Model(inp, res)



In [ ]:

    
model.compile('adam', 'mse')



In [ ]:

    
model.fit(x_data, y_data, verbose=2)