small fix in staging

0be066fe · Yuxin Wu · 3f48ed30 · 0be066fe · 0be066fe
Commit 0be066fe authored May 05, 2017 by Yuxin Wu
Hide whitespace changes
Inline Side-by-side

Showing with 10 additions and 12 deletions

tensorpack/train/feedfree.py tensorpack/train/feedfree.py +5 -5

tensorpack/train/input_data.py tensorpack/train/input_data.py +5 -7

No files found.
--- a/tensorpack/train/feedfree.py
+++ b/tensorpack/train/feedfree.py
@@ -24,8 +24,8 @@ class FeedfreeTrainerBase(Trainer):
        Get input tensors from `self.input_method` and build the graph.
        """
        def f():
-            inputs = self._input_method.get_input_tensors()
+            self._input_tensors = self._input_method.get_input_tensors()
-            self.model.build_graph(inputs)
+            self.model.build_graph(self._input_tensors)
        ctx = get_current_tower_context()
        if ctx is None:
            with TowerContext(''):
@@ -98,7 +98,7 @@ class SimpleFeedfreeTrainer(SingleCostFeedfreeTrainer):
            cost, grads = self._get_cost_and_grad()
        self.train_op = self.config.optimizer.apply_gradients(grads, name='min_op')
        # skip training
-        # self.train_op = tf.group(*self.dequed_inputs)
+        # self.train_op = tf.group(*self._input_tensors)
 def QueueInputTrainer(config, input_queue=None, predict_tower=None):
@@ -117,9 +117,9 @@ def QueueInputTrainer(config, input_queue=None, predict_tower=None):
    else:
        assert isinstance(config.data, QueueInput), config.data
-    # from tensorpack.train.input_data import QueueInput, FeedfreeInput, StagingInputWrapper, DummyConstantInput
+    # from tensorpack.train.input_data import StagingInputWrapper, DummyConstantInput
    # config.data = StagingInputWrapper(config.data, ['/gpu:0'])
-    # config.data = DummyConstantInput([[64,224,224,3], [64]])
+    # config.data = DummyConstantInput([[128,224,224,3], [128]])
    if predict_tower is not None:
        log_deprecated("Argument `predict_tower` in trainer", "Use TrainConfig(predict_tower=...) instead!")

--- a/tensorpack/train/input_data.py
+++ b/tensorpack/train/input_data.py
@@ -169,7 +169,6 @@ class QueueInput(FeedfreeInput):
    def get_input_tensors(self):
        ret = self.queue.dequeue(name='input_deque')
-        #ret[0]= tf.Print(ret[0], [tf.reduce_mean(ret[0])], "asdf")
        if isinstance(ret, tf.Tensor):  # only one input
            ret = [ret]
        assert len(ret) == len(self.input_placehdrs)
@@ -326,7 +325,7 @@ class StagingInputWrapper(FeedfreeInput):
            self.stage_op = stage_op
            # TODO make sure both stage/unstage are run, to avoid OOM
            self.fetches = tf.train.SessionRunArgs(
-                fetches=[stage_op])
+                fetches=[stage_op, unstage_op])
        def _before_train(self):
            # pre-fill the staging area
@@ -350,8 +349,8 @@ class StagingInputWrapper(FeedfreeInput):
        self.setup_staging_areas()
    def setup_training(self, trainer):
-        super(StagingInputWrapper, self).setup_training(trainer)
        self._input.setup_training(trainer)
+        self.setup_staging_areas()
        trainer.register_callback(
            StagingInputWrapper.StagingCallback(
@@ -359,11 +358,10 @@ class StagingInputWrapper(FeedfreeInput):
    def setup_staging_areas(self):
        for idx, device in enumerate(self._devices):
-            inputs = self._input.get_input_tensors()
-            dtypes = [x.dtype for x in inputs]
            with tf.device(device):
-                stage = StagingArea(
+                inputs = self._input.get_input_tensors()
-                    dtypes, shapes=None)
+                dtypes = [x.dtype for x in inputs]
+                stage = StagingArea(dtypes, shapes=None)
                self._stage_ops.append(stage.put(inputs))
                self._areas.append(stage)
                outputs = stage.get()