fix trainconfig

adb45736 · Yuxin Wu · acd7f798 · adb45736 · adb45736
Commit adb45736 authored Jul 25, 2016 by Yuxin Wu
Hide whitespace changes
Inline Side-by-side

Showing with 10 additions and 6 deletions

tensorpack/train/config.py tensorpack/train/config.py +8 -4

tensorpack/train/multigpu.py tensorpack/train/multigpu.py +2 -2

No files found.
--- a/tensorpack/train/config.py
+++ b/tensorpack/train/config.py
@@ -55,6 +55,13 @@ class TrainConfig(object):
        self.max_epoch = int(kwargs.pop('max_epoch', 99999))
        assert self.step_per_epoch > 0 and self.max_epoch > 0

+        if 'nr_tower' in kwargs or 'tower' in kwargs:
+            self.set_tower(**kwargs)
+
+        self.extra_threads_procs = kwargs.pop('extra_threads_procs', [])
+        assert len(kwargs) == 0, 'Unknown arguments: {}'.format(str(kwargs.keys()))
+
+    def set_tower(self, **kwargs):
        nr_tower = kwargs.pop('nr_tower', None)
        tower = kwargs.pop('tower', None)
        assert nr_tower is None or tower is None, "Cannot set both nr_tower and tower!"
@@ -64,7 +71,4 @@ class TrainConfig(object):
            if isinstance(tower, int):
                tower = list(range(tower))
        self.tower = tower
-
-        self.extra_threads_procs = kwargs.pop('extra_threads_procs', [])
-        assert len(kwargs) == 0, 'Unknown arguments: {}'.format(str(kwargs.keys()))
-
+        assert isinstance(self.tower, list)
--- a/tensorpack/train/multigpu.py
+++ b/tensorpack/train/multigpu.py
@@ -93,7 +93,7 @@ class AsyncMultiGPUTrainer(MultiGPUTrainer):
        # sync have consistent effective learning rate
        def scale(grads):
            with tf.name_scope('async_scale_grad'):
-                return [(grad / self.config.nr_tower if grad is not None else None, var)
+                return [(grad / len(self.config.tower) if grad is not None else None, var)
                            for grad, var in grads]
        grad_list = map(scale, grad_list)
        grad_list = [self.process_grads(g) for g in grad_list]
@@ -113,7 +113,7 @@ class AsyncMultiGPUTrainer(MultiGPUTrainer):
        # itertools.count is atomic w.r.t. python threads
        self.async_step_counter = itertools.count()
        self.training_threads = []
-        for k in range(1, self.config.nr_tower):
+        for k in range(1, len(self.config.tower)):
            train_op = self.config.optimizer.apply_gradients(grad_list[k])
            def f(op=train_op): # avoid late-binding
                self.sess.run([op])