fix SyncMultiGPUTrainerReplicated for single-GPU case

f246dd59 · Yuxin Wu · 8f4183e7 · f246dd59
Commit f246dd59 authored Jul 26, 2017 by Yuxin Wu
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 1 deletion

tensorpack/train/multigpu.py tensorpack/train/multigpu.py +2 -1

No files found.
--- a/tensorpack/train/multigpu.py
+++ b/tensorpack/train/multigpu.py
@@ -249,7 +249,7 @@ class SyncMultiGPUTrainerReplicated(MultiGPUTrainerBase):
        from tensorflow.contrib import nccl
        nr_tower = len(tower_grads)
        if nr_tower == 1:
-            return tower_grads[0]
+            return [[x] for x in tower_grads[0]]
        new_tower_grads = []
        with tf.name_scope('AvgGrad'):
            for grad_and_vars in zip(*tower_grads):
@@ -284,6 +284,7 @@ class SyncMultiGPUTrainerReplicated(MultiGPUTrainerBase):
        for idx in range(self.config.nr_tower):
            with tf.device(raw_devices[idx]):
                grad_and_vars = [x[idx] for x in grads]
+                print(grad_and_vars)
                train_ops.append(opt.apply_gradients(
                    grad_and_vars, name='apply_grad_{}'.format(idx)))
        self.train_op = tf.group(*train_ops, name='train_op')