when ps_device=cpu, apply gradients on cpu

1f5c764d · Yuxin Wu · 3f1e9a14 · 1f5c764d · 1f5c764d
Commit 1f5c764d authored Sep 26, 2017 by Yuxin Wu
Show whitespace changes
Inline Side-by-side

Showing with 11 additions and 5 deletions

tensorpack/tfutils/tower.py tensorpack/tfutils/tower.py +1 -0

tensorpack/train/multigpu.py tensorpack/train/multigpu.py +10 -5

No files found.
--- a/tensorpack/tfutils/tower.py
+++ b/tensorpack/tfutils/tower.py
@@ -32,6 +32,7 @@ class TowerContext(object):
        self._index = int(index)
        if use_vs:
            self._vs_name = self._name
+            assert len(self._name)
        else:
            self._vs_name = ''


--- a/tensorpack/train/multigpu.py
+++ b/tensorpack/train/multigpu.py
@@ -157,13 +157,13 @@ class SyncMultiGPUTrainerParameterServer(MultiGPUTrainerBase):
        return new_tower_grads

    @staticmethod
-    def setup_graph(model, input, ps_device, tower):
+    def setup_graph(model, input, ps_device, towers):
        """
        Args:
            model (ModelDesc):
            input (InputSource):
            ps_device (str):
-            tower (list[int]):
+            towers (list[int]):

        Returns:
            tf.Operation: the training op
@@ -172,7 +172,7 @@ class SyncMultiGPUTrainerParameterServer(MultiGPUTrainerBase):
        """
        callbacks = input.setup(model.get_inputs_desc())

-        raw_devices = ['/gpu:{}'.format(k) for k in tower]
+        raw_devices = ['/gpu:{}'.format(k) for k in towers]
        if ps_device == 'gpu':
            devices = [LeastLoadedDeviceSetter(d, raw_devices) for d in raw_devices]
        else:
@@ -180,7 +180,7 @@ class SyncMultiGPUTrainerParameterServer(MultiGPUTrainerBase):
                worker_device=d, ps_device='/cpu:0', ps_tasks=1) for d in raw_devices]

        grad_list = MultiGPUTrainerBase.build_on_multi_tower(
-            tower,
+            towers,
            lambda: MultiGPUTrainerBase._build_graph_get_grads(model, input),
            devices)
        MultiGPUTrainerBase._check_grad_list(grad_list)
@@ -193,7 +193,12 @@ class SyncMultiGPUTrainerParameterServer(MultiGPUTrainerBase):
        grads = SyncMultiGPUTrainerParameterServer._average_grads(grad_list)
        # grads = grad_list[0]

-        train_op = model.get_optimizer().apply_gradients(grads, name='train_op')
+        opt = model.get_optimizer()
+        if ps_device == 'cpu':
+            with tf.device('/cpu:0'):
+                train_op = opt.apply_gradients(grads, name='train_op')
+        else:
+            train_op = opt.apply_gradients(grads, name='train_op')
        return train_op, callbacks

    def _setup(self):