async training. accumulate on variable device

1021b385 · Yuxin Wu · c420730d · 1021b385
Commit 1021b385 authored Jun 15, 2017 by Yuxin Wu
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 3 deletions

tensorpack/train/multigpu.py tensorpack/train/multigpu.py +4 -3

No files found.
--- a/tensorpack/train/multigpu.py
+++ b/tensorpack/train/multigpu.py
@@ -325,9 +325,10 @@ class AsyncMultiGPUTrainer(MultiGPUTrainerBase, SingleCostFeedfreeTrainer):

        train_ops = []
        opt = self.model.get_optimizer()
-        for i in range(self.config.nr_tower):
-            with tf.device(raw_devices[i]):
-                grad_and_vars = grad_list[i]
+        for i, grad_and_vars in enumerate(zip(*grad_list)):
+            # Ngpu x 2
+            v = grad_and_vars[0][1]
+            with tf.device(v.device):
                train_ops.append(opt.apply_gradients(
                    grad_and_vars, name='apply_grad_{}'.format(i)))
        self.train_op = tf.group(*train_ops, name='train_op')