speedup lr_mult=0 by skipping the gradient computation.

a949bfa6 · Yuxin Wu · b5a238a7 · a949bfa6 · a949bfa6 · a949bfa6
Commit a949bfa6 authored Apr 21, 2016 by Yuxin Wu
Showing with 9 additions and 6 deletions

examples/cifar10-convnet.py examples/cifar10-convnet.py +1 -1

tensorpack/dataflow/prefetch.py tensorpack/dataflow/prefetch.py +1 -2

tensorpack/tfutils/gradproc.py tensorpack/tfutils/gradproc.py +7 -3

No files found.
--- a/examples/cifar10-convnet.py
+++ b/examples/cifar10-convnet.py
 #!/usr/bin/env python
 # -*- coding: UTF-8 -*-
-# File: cifar10_convnet.py
+# File: cifar10-convnet.py
 # Author: Yuxin Wu <ppwwyyxx@gmail.com>
 import tensorflow as tf

--- a/tensorpack/dataflow/prefetch.py
+++ b/tensorpack/dataflow/prefetch.py
@@ -49,8 +49,7 @@ class PrefetchData(ProxyDataFlow):
            x.start()
    def get_data(self):
-        tot_cnt = 0
+        for _ in range(self._size):
-        for _ in range(tot_cnt):
            dp = self.queue.get()
            yield dp

--- a/tensorpack/tfutils/gradproc.py
+++ b/tensorpack/tfutils/gradproc.py
@@ -61,14 +61,18 @@ class ScaleGradient(GradientProcessor):
        self.multipliers = multipliers
    def _process(self, grads):
-        # TODO use None for zero can speed up (or not)?
        ret = []
        for grad, var in grads:
            varname = var.op.name
            for regex, val in self.multipliers:
-                if re.search(regex, varname):
+                # always match against the whole name
+                if not regex.endswith('$'):
+                    regex = regex + '$'
+                if re.match(regex, varname):
                    logger.info("Apply lr multiplier {} for {}".format(val, varname))
-                    ret.append((grad * val, var))
+                    if val != 0:    # skip zero to speed up
+                        ret.append((grad * val, var))
                    break
            else:
                ret.append((grad, var))