a3c supports cpu

6087698d · Yuxin Wu · 61384a65 · 6087698d · 6087698d · 6087698d
Commit 6087698d authored Nov 13, 2016 by Yuxin Wu
Showing with 24 additions and 16 deletions

examples/HED/hed.py examples/HED/hed.py +9 -8

examples/OpenAIGym/run-atari.py examples/OpenAIGym/run-atari.py +1 -1

examples/OpenAIGym/train-atari.py examples/OpenAIGym/train-atari.py +14 -7

No files found.
--- a/examples/HED/hed.py
+++ b/examples/HED/hed.py
@@ -80,14 +80,15 @@ class Model(ModelDesc):
        wrong = tf.cast(tf.not_equal(pred, edgemap), tf.float32)
        wrong = tf.reduce_mean(wrong, name='train_error')
-        wd_w = tf.train.exponential_decay(2e-4, get_global_step_var(),
+        if get_current_tower_context().is_training:
-                                          80000, 0.7, True)
+            wd_w = tf.train.exponential_decay(2e-4, get_global_step_var(),
-        wd_cost = tf.mul(wd_w, regularize_cost('.*/W', tf.nn.l2_loss), name='wd_cost')
+                                              80000, 0.7, True)
-        costs.append(wd_cost)
+            wd_cost = tf.mul(wd_w, regularize_cost('.*/W', tf.nn.l2_loss), name='wd_cost')
+            costs.append(wd_cost)
-        add_moving_summary(costs + [wrong])
-        add_param_summary([('.*/W', ['histogram'])])   # monitor W
+            add_moving_summary(costs + [wrong])
-        self.cost = tf.add_n(costs, name='cost')
+            add_param_summary([('.*/W', ['histogram'])])   # monitor W
+            self.cost = tf.add_n(costs, name='cost')
    def get_gradient_processor(self):
        return [ScaleGradient([('convfcweight.*', 0.1), ('conv5_.*', 5)]) ]

--- a/examples/OpenAIGym/run-atari.py
+++ b/examples/OpenAIGym/run-atari.py
@@ -69,7 +69,7 @@ def run_submission(cfg, output, nr):
        if k != 0:
            player.restart_episode()
        score = play_one_episode(player, predfunc)
-        print("Total:", score)
+        print("Score:", score)
 def do_submit(output):
    gym.upload(output, api_key='xxx')

--- a/examples/OpenAIGym/train-atari.py
+++ b/examples/OpenAIGym/train-atari.py
@@ -242,16 +242,23 @@ if __name__ == '__main__':
        elif args.task == 'eval':
            eval_model_multithread(cfg, EVAL_EPISODE)
    else:
-        nr_gpu = get_nr_gpu()
+        if args.gpu:
-        if nr_gpu > 1:
+            nr_gpu = get_nr_gpu()
-            predict_tower = range(nr_gpu)[-nr_gpu/2:]
+            if nr_gpu > 1:
+                predict_tower = range(nr_gpu)[-nr_gpu/2:]
+            else:
+                predict_tower = [0]
+            PREDICTOR_THREAD = len(predict_tower) * PREDICTOR_THREAD_PER_GPU
+            train_tower = range(nr_gpu)[:-nr_gpu/2] or [0]
+            logger.info("[BA3C] Train on gpu {} and infer on gpu {}".format(
+                ','.join(map(str, train_tower)), ','.join(map(str, predict_tower))))
        else:
+            nr_gpu = 0
+            PREDICTOR_THREAD = 1
            predict_tower = [0]
-        PREDICTOR_THREAD = len(predict_tower) * PREDICTOR_THREAD_PER_GPU
+            train_tower = [0]
        config = get_config()
        if args.load:
            config.session_init = SaverRestore(args.load)
-        config.tower = range(nr_gpu)[:-nr_gpu/2] or [0]
+        config.tower = train_tower
-        logger.info("[BA3C] Train on gpu {} and infer on gpu {}".format(
-            ','.join(map(str, config.tower)), ','.join(map(str, predict_tower))))
        AsyncMultiGPUTrainer(config, predict_tower=predict_tower).train()