working on alexnet

bcbbc645 · ppwwyyxx · 87f7e7cb · bcbbc645 · bcbbc645 · bcbbc645
Commit bcbbc645 authored Dec 29, 2015 by ppwwyyxx
9 changed files
--- a/dataflow/common.py
+++ b/dataflow/common.py
@@ -17,6 +17,7 @@ class BatchData(DataFlow):
            if set, might return a data point of a different shape
        """
        self.ds = ds
+        assert batch_size <= ds.size()
        self.batch_size = batch_size
        self.remainder = remainder

--- a/dataflow/dataset/__init__.py
+++ b/dataflow/dataset/__init__.py
@@ -8,7 +8,6 @@ import os
 import os.path
 def global_import(name):
-    print name
    p = __import__(name, globals(), locals())
    lst = p.__all__ if '__all__' in dir(p) else dir(p)
    for k in lst:

--- a/dataflow/dataset/cifar10.py
+++ b/dataflow/dataset/cifar10.py
@@ -63,6 +63,7 @@ class Cifar10(DataFlow):
        assert train_or_test in ['train', 'test']
        if dir is None:
            dir = os.path.join(os.path.dirname(__file__), 'cifar10_data')
+        maybe_download_and_extract(dir)
        if train_or_test == 'train':
            self.fs = [os.path.join(

--- a/infer.py
+++ b/infer.py
+#!/usr/bin/env python2
+# -*- coding: UTF-8 -*-
+# File: infer.py
+# Author: Yuxin Wu <ppwwyyxx@gmail.com>
+import tensorflow as tf
+from itertools import count
+import argparse
+import numpy as np
+from utils import *
+from utils.modelutils import describe_model, restore_params
+from utils import logger
+from dataflow import DataFlow
+def start_infer(config):
+    """
+    Args:
+        config: a tensorpack config dictionary
+    """
+    dataset_test = config['dataset_test']
+    assert isinstance(dataset_test, DataFlow), dataset_test.__class__
+    # a tf.ConfigProto instance
+    sess_config = config.get('session_config', None)
+    assert isinstance(sess_config, tf.ConfigProto), sess_config.__class__
+    # TODO callback should have trigger_step and trigger_end?
+    callback = config['callback']
+    # restore saved params
+    params = config.get('restore_params', {})
+    # input/output variables
+    input_vars = config['inputs']
+    get_model_func = config['get_model_func']
+    output_vars, cost_var = get_model_func(input_vars, is_training=False)
+    # build graph
+    G = tf.get_default_graph()
+    G.add_to_collection(FORWARD_FUNC_KEY, get_model_func)
+    for v in input_vars:
+        G.add_to_collection(INPUT_VARS_KEY, v)
+    for v in output_vars:
+        G.add_to_collection(OUTPUT_VARS_KEY, v)
+    describe_model()
+    sess = tf.Session(config=sess_config)
+    sess.run(tf.initialize_all_variables())
+    restore_params(sess, params)
+    with sess.as_default():
+        with timed_operation('running one batch'):
+            for dp in dataset_test.get_data():
+                feed = dict(zip(input_vars, dp))
+                fetches = [cost_var] + output_vars
+                results = sess.run(fetches, feed_dict=feed)
+                cost = results[0]
+                outputs = results[1:]
+                prob = outputs[0]
+                callback(dp, outputs, cost)
+def main(get_config_func):
+    parser = argparse.ArgumentParser()
+    parser.add_argument('--gpu', help='comma separated list of GPU(s) to use.') # nargs='*' in multi mode
+    args = parser.parse_args()
+    if args.gpu:
+        os.environ['CUDA_VISIBLE_DEVICES'] = args.gpu
+    with tf.Graph().as_default():
+        config = get_config_func()
+        start_infer(config)
--- a/models/_common.py
+++ b/models/_common.py
@@ -4,6 +4,7 @@
 # Author: Yuxin Wu <ppwwyyxx@gmail.com>
 import tensorflow as tf
+from utils.modelutils import *
 from utils.summary import *
 from utils import logger

--- a/models/conv2d.py
+++ b/models/conv2d.py
@@ -12,18 +12,22 @@ __all__ = ['Conv2D']
 @layer_register(summary_activation=True)
 def Conv2D(x, out_channel, kernel_shape,
           padding='VALID', stride=1,
-           W_init=None, b_init=None, nl=tf.nn.relu):
+           W_init=None, b_init=None,
+           nl=tf.nn.relu, split=1):
    """
    kernel_shape: (h, w) or a int
    stride: (h, w) or a int
    padding: 'valid' or 'same'
+    split: split channels. used in alexnet
    """
    in_shape = x.get_shape().as_list()
    in_channel = in_shape[-1]
+    assert in_channel % split == 0
+    assert out_channel % split == 0
    kernel_shape = shape2d(kernel_shape)
    padding = padding.upper()
-    filter_shape = kernel_shape + [in_channel, out_channel]
+    filter_shape = kernel_shape + [in_channel / split, out_channel]
    stride = shape4d(stride)
    if W_init is None:
@@ -34,6 +38,14 @@ def Conv2D(x, out_channel, kernel_shape,
    W = tf.get_variable('W', filter_shape, initializer=W_init) # TODO collections
    b = tf.get_variable('b', [out_channel], initializer=b_init)
-    conv = tf.nn.conv2d(x, W, stride, padding)
+    if split == 1:
+        conv = tf.nn.conv2d(x, W, stride, padding)
+    else:
+        inputs = tf.split(3, split, x)
+        kernels = tf.split(3, split, W)
+        outputs = [tf.nn.conv2d(i, k, stride, padding)
+                   for i, k in zip(inputs, kernels)]
+        conv = tf.concat(3, outputs)
    return nl(tf.nn.bias_add(conv, b))
--- a/train.py
+++ b/train.py
@@ -4,18 +4,20 @@
 # Author: Yuxin Wu <ppwwyyxx@gmail.com>
 import tensorflow as tf
+from itertools import count
+import argparse
 from utils import *
 from utils.concurrency import EnqueueThread,coordinator_guard
-from utils.summary import summary_moving_average, describe_model
+from utils.summary import summary_moving_average
+from utils.modelutils import restore_params, describe_model
+from utils import logger
 from dataflow import DataFlow
-from itertools import count
-import argparse
 def prepare():
    global_step_var = tf.Variable(
        0, trainable=False, name=GLOBAL_STEP_OP_NAME)
 def start_train(config):
    """
    Start training with the given config
@@ -36,6 +38,9 @@ def start_train(config):
    sess_config = config.get('session_config', None)
    assert isinstance(sess_config, tf.ConfigProto), sess_config.__class__
+    # restore saved params
+    params = config.get('restore_params', {})
    # input/output variables
    input_vars = config['inputs']
    input_queue = config['input_queue']
@@ -78,6 +83,8 @@ def start_train(config):
    sess = tf.Session(config=sess_config)
    sess.run(tf.initialize_all_variables())
+    restore_params(sess, params)
    # start training:
    coord = tf.train.Coordinator()
    # a thread that keeps filling the queue

--- a/utils/modelutils.py
+++ b/utils/modelutils.py
+#!/usr/bin/env python2
+# -*- coding: UTF-8 -*-
+# File: modelutils.py
+# Author: Yuxin Wu <ppwwyyxx@gmail.com>
+import tensorflow as tf
+import logger
+def restore_params(sess, params):
+    variables = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES)
+    var_dict = dict([v.name, v] for v in variables)
+    for name, value in params.iteritems():
+        try:
+            var = var_dict[name]
+        except (ValueError, KeyError):
+            logger.warn("Param {} not found in this graph".format(name))
+            continue
+        logger.info("Restoring param {}".format(name))
+        sess.run(var.assign(value))
+def describe_model():
+    """ describe the current model parameters"""
+    train_vars = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES)
+    msg = [""]
+    total = 0
+    for v in train_vars:
+        shape = v.get_shape()
+        ele = shape.num_elements()
+        total += ele
+        msg.append("{}: shape={}, dim={}".format(
+            v.name, shape.as_list(), ele))
+    msg.append("Total dim={}".format(total))
+    logger.info("Model Params: {}".format('\n'.join(msg)))
+def get_shape_str(tensors):
+    """ return the shape string for a tensor or a list of tensors"""
+    if isinstance(tensors, list):
+        shape_str = ",".join(
+            map(str(x.get_shape().as_list()), tensors))
+    else:
+        shape_str = str(tensors.get_shape().as_list())
+    return shape_str
--- a/utils/summary.py
+++ b/utils/summary.py
@@ -60,27 +60,3 @@ def summary_moving_average(cost_var):
        tf.scalar_summary(c.op.name, averager.average(c))
    return avg_maintain_op
-def describe_model():
-    """ describe the current model parameters"""
-    train_vars = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES)
-    msg = [""]
-    total = 0
-    for v in train_vars:
-        shape = v.get_shape()
-        ele = shape.num_elements()
-        total += ele
-        msg.append("{}: shape={}, dim={}".format(
-            v.name, shape.as_list(), ele))
-    msg.append("Total dim={}".format(total))
-    logger.info("Model Params: {}".format('\n'.join(msg)))
-def get_shape_str(tensors):
-    """ return the shape string for a tensor or a list of tensors"""
-    if isinstance(tensors, list):
-        shape_str = ",".join(
-            map(str(x.get_shape().as_list()), tensors))
-    else:
-        shape_str = str(tensors.get_shape().as_list())
-    return shape_str