move rcnn forward backward task to model zoo (#1288)

Jerryzcn · web-flow · commit e043d56c41ab · 2020-05-06T00:43:18.000-07:00
* move rcnn forward backward task to model zoo * revert #1249 * fix * fix * docstring * fix style * add docs
diff --git a/gluoncv/model_zoo/rcnn/faster_rcnn/__init__.py b/gluoncv/model_zoo/rcnn/faster_rcnn/__init__.py
@@ -5,3 +5,4 @@
 from .faster_rcnn import *
 from .predefined_models import *
 from .rcnn_target import RCNNTargetGenerator, RCNNTargetSampler
+from .data_parallel import ForwardBackwardTask
diff --git a/gluoncv/model_zoo/rcnn/faster_rcnn/data_parallel.py b/gluoncv/model_zoo/rcnn/faster_rcnn/data_parallel.py
@@ -0,0 +1,86 @@
+"""Data parallel task for Faster RCNN Model."""
+
+from mxnet import autograd
+from mxnet.contrib import amp
+
+from gluoncv.utils.parallel import Parallelizable
+
+
+class ForwardBackwardTask(Parallelizable):
+    """ Faster R-CNN training task that can be scheduled concurrently using Parallel.
+    Parameters
+    ----------
+    net : gluon.HybridBlock
+        Faster R-CNN network.
+    optimizer : gluon.Trainer
+        Optimizer for the training.
+    rpn_cls_loss : gluon.loss
+        RPN box classification loss.
+    rpn_box_loss : gluon.loss
+        RPN box regression loss.
+    rcnn_cls_loss : gluon.loss
+        R-CNN box head classification loss.
+    rcnn_box_loss : gluon.loss
+        R-CNN box head regression loss.
+    mix_ratio : int
+        Object detection mixup ratio.
+    amp_enabled : bool
+        Whether to enable Automatic Mixed Precision.
+    """
+
+    def __init__(self, net, optimizer, rpn_cls_loss, rpn_box_loss, rcnn_cls_loss, rcnn_box_loss,
+                 mix_ratio, amp_enabled):
+        super(ForwardBackwardTask, self).__init__()
+        self.net = net
+        self._optimizer = optimizer
+        self.rpn_cls_loss = rpn_cls_loss
+        self.rpn_box_loss = rpn_box_loss
+        self.rcnn_cls_loss = rcnn_cls_loss
+        self.rcnn_box_loss = rcnn_box_loss
+        self.mix_ratio = mix_ratio
+        self.amp_enabled = amp_enabled
+
+    def forward_backward(self, x):
+        data, label, rpn_cls_targets, rpn_box_targets, rpn_box_masks = x
+        with autograd.record():
+            gt_label = label[:, :, 4:5]
+            gt_box = label[:, :, :4]
+            cls_pred, box_pred, _, _, _Z, rpn_score, rpn_box, _, cls_targets, \
+                box_targets, box_masks, _ = self.net(data, gt_box, gt_label)
+            # losses of rpn
+            rpn_score = rpn_score.squeeze(axis=-1)
+            num_rpn_pos = (rpn_cls_targets >= 0).sum()
+            rpn_loss1 = self.rpn_cls_loss(rpn_score, rpn_cls_targets,
+                                          rpn_cls_targets >= 0) * rpn_cls_targets.size / num_rpn_pos
+            rpn_loss2 = self.rpn_box_loss(rpn_box, rpn_box_targets,
+                                          rpn_box_masks) * rpn_box.size / num_rpn_pos
+            # rpn overall loss, use sum rather than average
+            rpn_loss = rpn_loss1 + rpn_loss2
+            # losses of rcnn
+            num_rcnn_pos = (cls_targets >= 0).sum()
+            rcnn_loss1 = self.rcnn_cls_loss(
+                cls_pred, cls_targets, cls_targets.expand_dims(-1) >= 0) * cls_targets.size / \
+                         num_rcnn_pos
+            rcnn_loss2 = self.rcnn_box_loss(box_pred, box_targets, box_masks) * box_pred.size / \
+                         num_rcnn_pos
+            rcnn_loss = rcnn_loss1 + rcnn_loss2
+            # overall losses
+            total_loss = rpn_loss.sum() * self.mix_ratio + rcnn_loss.sum() * self.mix_ratio
+
+            rpn_loss1_metric = rpn_loss1.mean() * self.mix_ratio
+            rpn_loss2_metric = rpn_loss2.mean() * self.mix_ratio
+            rcnn_loss1_metric = rcnn_loss1.mean() * self.mix_ratio
+            rcnn_loss2_metric = rcnn_loss2.mean() * self.mix_ratio
+            rpn_acc_metric = [[rpn_cls_targets, rpn_cls_targets >= 0], [rpn_score]]
+            rpn_l1_loss_metric = [[rpn_box_targets, rpn_box_masks], [rpn_box]]
+            rcnn_acc_metric = [[cls_targets], [cls_pred]]
+            rcnn_l1_loss_metric = [[box_targets, box_masks], [box_pred]]
+
+            if self.amp_enabled:
+                with amp.scale_loss(total_loss, self._optimizer) as scaled_losses:
+                    autograd.backward(scaled_losses)
+            else:
+                total_loss.backward()
+
+        return rpn_loss1_metric, rpn_loss2_metric, rcnn_loss1_metric, rcnn_loss2_metric, \
+               rpn_acc_metric, rpn_l1_loss_metric, rcnn_acc_metric, rcnn_l1_loss_metric
diff --git a/gluoncv/model_zoo/rcnn/mask_rcnn/__init__.py b/gluoncv/model_zoo/rcnn/mask_rcnn/__init__.py
@@ -4,3 +4,4 @@
 
 from .mask_rcnn import *
 from .predefined_models import *
+from .data_parallel import ForwardBackwardTask
diff --git a/gluoncv/model_zoo/rcnn/mask_rcnn/data_parallel.py b/gluoncv/model_zoo/rcnn/mask_rcnn/data_parallel.py
@@ -0,0 +1,107 @@
+"""Data parallel task for Mask R-CNN Model."""
+
+import mxnet as mx
+from mxnet import autograd
+from mxnet.contrib import amp
+
+from gluoncv.utils.parallel import Parallelizable
+
+
+class ForwardBackwardTask(Parallelizable):
+    """ Mask R-CNN training task that can be scheduled concurrently using Parallel.
+    Parameters
+    ----------
+    net : gluon.HybridBlock
+        Faster R-CNN network.
+    optimizer : gluon.Trainer
+        Optimizer for the training.
+    rpn_cls_loss : gluon.loss
+        RPN box classification loss.
+    rpn_box_loss : gluon.loss
+        RPN box regression loss.
+    rcnn_cls_loss : gluon.loss
+        R-CNN box head classification loss.
+    rcnn_box_loss : gluon.loss
+        R-CNN box head regression loss.
+    rcnn_mask_loss : gluon.loss
+        R-CNN mask head segmentation loss.
+    amp_enabled : bool
+        Whether to enable Automatic Mixed Precision.
+    """
+    def __init__(self, net, optimizer, rpn_cls_loss, rpn_box_loss, rcnn_cls_loss, rcnn_box_loss,
+                 rcnn_mask_loss, amp_enabled):
+        super(ForwardBackwardTask, self).__init__()
+        self.net = net
+        self._optimizer = optimizer
+        self.rpn_cls_loss = rpn_cls_loss
+        self.rpn_box_loss = rpn_box_loss
+        self.rcnn_cls_loss = rcnn_cls_loss
+        self.rcnn_box_loss = rcnn_box_loss
+        self.rcnn_mask_loss = rcnn_mask_loss
+        self.amp_enabled = amp_enabled
+
+    def forward_backward(self, x):
+        data, label, gt_mask, rpn_cls_targets, rpn_box_targets, rpn_box_masks = x
+        with autograd.record():
+            gt_label = label[:, :, 4:5]
+            gt_box = label[:, :, :4]
+            cls_pred, box_pred, mask_pred, roi, _, matches, rpn_score, rpn_box, _, \
+                cls_targets, box_targets, box_masks, indices = self.net(data, gt_box, gt_label)
+            # losses of rpn
+            rpn_score = rpn_score.squeeze(axis=-1)
+            num_rpn_pos = (rpn_cls_targets >= 0).sum()
+            rpn_loss1 = self.rpn_cls_loss(rpn_score, rpn_cls_targets,
+                                          rpn_cls_targets >= 0) * rpn_cls_targets.size / num_rpn_pos
+            rpn_loss2 = self.rpn_box_loss(rpn_box, rpn_box_targets,
+                                          rpn_box_masks) * rpn_box.size / num_rpn_pos
+            # rpn overall loss, use sum rather than average
+            rpn_loss = rpn_loss1 + rpn_loss2
+
+            # losses of rcnn
+            num_rcnn_pos = (cls_targets >= 0).sum()
+            rcnn_loss1 = self.rcnn_cls_loss(
+                cls_pred, cls_targets, cls_targets.expand_dims(-1) >= 0) * cls_targets.size / \
+                         num_rcnn_pos
+            rcnn_loss2 = self.rcnn_box_loss(box_pred, box_targets, box_masks) * box_pred.size / \
+                         num_rcnn_pos
+            rcnn_loss = rcnn_loss1 + rcnn_loss2
+
+            # generate targets for mask
+            roi = mx.nd.concat(
+                *[mx.nd.take(roi[i], indices[i]) for i in range(indices.shape[0])], dim=0) \
+                .reshape((indices.shape[0], -1, 4))
+            m_cls_targets = mx.nd.concat(
+                *[mx.nd.take(cls_targets[i], indices[i]) for i in range(indices.shape[0])], dim=0) \
+                .reshape((indices.shape[0], -1))
+            matches = mx.nd.concat(
+                *[mx.nd.take(matches[i], indices[i]) for i in range(indices.shape[0])], dim=0) \
+                .reshape((indices.shape[0], -1))
+            mask_targets, mask_masks = self.net.mask_target(roi, gt_mask, matches, m_cls_targets)
+            # loss of mask
+            mask_loss = self.rcnn_mask_loss(mask_pred, mask_targets, mask_masks) * \
+                        mask_targets.size / mask_masks.sum()
+
+            # overall losses
+            total_loss = rpn_loss.sum() + rcnn_loss.sum() + mask_loss.sum()
+
+            rpn_loss1_metric = rpn_loss1.mean()
+            rpn_loss2_metric = rpn_loss2.mean()
+            rcnn_loss1_metric = rcnn_loss1.sum()
+            rcnn_loss2_metric = rcnn_loss2.sum()
+            mask_loss_metric = mask_loss.sum()
+            rpn_acc_metric = [[rpn_cls_targets, rpn_cls_targets >= 0], [rpn_score]]
+            rpn_l1_loss_metric = [[rpn_box_targets, rpn_box_masks], [rpn_box]]
+            rcnn_acc_metric = [[cls_targets], [cls_pred]]
+            rcnn_l1_loss_metric = [[box_targets, box_masks], [box_pred]]
+            rcnn_mask_metric = [[mask_targets, mask_masks], [mask_pred]]
+            rcnn_fgmask_metric = [[mask_targets, mask_masks], [mask_pred]]
+
+            if self.amp_enabled:
+                with amp.scale_loss(total_loss, self._optimizer) as scaled_losses:
+                    autograd.backward(scaled_losses)
+            else:
+                total_loss.backward()
+
+        return rpn_loss1_metric, rpn_loss2_metric, rcnn_loss1_metric, rcnn_loss2_metric, \
+               mask_loss_metric, rpn_acc_metric, rpn_l1_loss_metric, rcnn_acc_metric, \
+               rcnn_l1_loss_metric, rcnn_mask_metric, rcnn_fgmask_metric
diff --git a/scripts/detection/faster_rcnn/train_faster_rcnn.py b/scripts/detection/faster_rcnn/train_faster_rcnn.py
@@ -16,7 +16,6 @@
 import numpy as np
 import mxnet as mx
 from mxnet import gluon
-from mxnet import autograd
 from mxnet.contrib import amp
 import gluoncv as gcv
 
@@ -29,9 +28,10 @@
     FasterRCNNDefaultValTransform
 from gluoncv.utils.metrics.voc_detection import VOC07MApMetric
 from gluoncv.utils.metrics.coco_detection import COCODetectionMetric
-from gluoncv.utils.parallel import Parallelizable, Parallel
+from gluoncv.utils.parallel import Parallel
 from gluoncv.utils.metrics.rcnn import RPNAccMetric, RPNL1LossMetric, RCNNAccMetric, \
     RCNNL1LossMetric
+from gluoncv.model_zoo.rcnn.faster_rcnn.data_parallel import ForwardBackwardTask
 
 try:
     import horovod.mxnet as hvd
@@ -415,64 +415,6 @@ def get_lr_at_iter(alpha, lr_warmup_factor=1. / 3.):
     return lr_warmup_factor * (1 - alpha) + alpha
 
 
-class ForwardBackwardTask(Parallelizable):
-    def __init__(self, net, optimizer, rpn_cls_loss, rpn_box_loss, rcnn_cls_loss, rcnn_box_loss,
-                 mix_ratio):
-        super(ForwardBackwardTask, self).__init__()
-        self.net = net
-        self._optimizer = optimizer
-        self.rpn_cls_loss = rpn_cls_loss
-        self.rpn_box_loss = rpn_box_loss
-        self.rcnn_cls_loss = rcnn_cls_loss
-        self.rcnn_box_loss = rcnn_box_loss
-        self.mix_ratio = mix_ratio
-
-    def forward_backward(self, x):
-        data, label, rpn_cls_targets, rpn_box_targets, rpn_box_masks = x
-        with autograd.record():
-            gt_label = label[:, :, 4:5]
-            gt_box = label[:, :, :4]
-            cls_pred, box_pred, roi, samples, matches, rpn_score, rpn_box, anchors, cls_targets, \
-            box_targets, box_masks, _ = self.net(data, gt_box, gt_label)
-            # losses of rpn
-            rpn_score = rpn_score.squeeze(axis=-1)
-            num_rpn_pos = (rpn_cls_targets >= 0).sum()
-            rpn_loss1 = self.rpn_cls_loss(rpn_score, rpn_cls_targets,
-                                          rpn_cls_targets >= 0) * rpn_cls_targets.size / num_rpn_pos
-            rpn_loss2 = self.rpn_box_loss(rpn_box, rpn_box_targets,
-                                          rpn_box_masks) * rpn_box.size / num_rpn_pos
-            # rpn overall loss, use sum rather than average
-            rpn_loss = rpn_loss1 + rpn_loss2
-            # losses of rcnn
-            num_rcnn_pos = (cls_targets >= 0).sum()
-            rcnn_loss1 = self.rcnn_cls_loss(cls_pred, cls_targets,
-                                            cls_targets.expand_dims(-1) >= 0) * cls_targets.size / \
-                         num_rcnn_pos
-            rcnn_loss2 = self.rcnn_box_loss(box_pred, box_targets, box_masks) * box_pred.size / \
-                         num_rcnn_pos
-            rcnn_loss = rcnn_loss1 + rcnn_loss2
-            # overall losses
-            total_loss = rpn_loss.sum() * self.mix_ratio + rcnn_loss.sum() * self.mix_ratio
-
-            rpn_loss1_metric = rpn_loss1.mean() * self.mix_ratio
-            rpn_loss2_metric = rpn_loss2.mean() * self.mix_ratio
-            rcnn_loss1_metric = rcnn_loss1.mean() * self.mix_ratio
-            rcnn_loss2_metric = rcnn_loss2.mean() * self.mix_ratio
-            rpn_acc_metric = [[rpn_cls_targets, rpn_cls_targets >= 0], [rpn_score]]
-            rpn_l1_loss_metric = [[rpn_box_targets, rpn_box_masks], [rpn_box]]
-            rcnn_acc_metric = [[cls_targets], [cls_pred]]
-            rcnn_l1_loss_metric = [[box_targets, box_masks], [box_pred]]
-
-            if args.amp:
-                with amp.scale_loss(total_loss, self._optimizer) as scaled_losses:
-                    autograd.backward(scaled_losses)
-            else:
-                total_loss.backward()
-
-        return rpn_loss1_metric, rpn_loss2_metric, rcnn_loss1_metric, rcnn_loss2_metric, \
-               rpn_acc_metric, rpn_l1_loss_metric, rcnn_acc_metric, rcnn_l1_loss_metric
-
-
 def train(net, train_data, val_data, eval_metric, batch_size, ctx, args):
     """Training pipeline"""
     args.kv_store = 'device' if (args.amp and 'nccl' in args.kv_store) else args.kv_store
@@ -539,10 +481,10 @@ def train(net, train_data, val_data, eval_metric, batch_size, ctx, args):
         logger.info(net.collect_train_params().keys())
     logger.info('Start training from [Epoch {}]'.format(args.start_epoch))
     best_map = [0]
-    rcnn_task = ForwardBackwardTask(net, trainer, rpn_cls_loss, rpn_box_loss, rcnn_cls_loss,
-                                    rcnn_box_loss, mix_ratio=1.0)
-    executor = Parallel(args.executor_threads, rcnn_task) if not args.horovod else None
     for epoch in range(args.start_epoch, args.epochs):
+        rcnn_task = ForwardBackwardTask(net, trainer, rpn_cls_loss, rpn_box_loss, rcnn_cls_loss,
+                                        rcnn_box_loss, mix_ratio=1.0, amp_enabled=args.amp)
+        executor = Parallel(args.executor_threads, rcnn_task) if not args.horovod else None
         mix_ratio = 1.0
         if not args.disable_hybridization:
             net.hybridize(static_alloc=args.static_alloc)
diff --git a/scripts/instance/mask_rcnn/train_mask_rcnn.py b/scripts/instance/mask_rcnn/train_mask_rcnn.py

Original file line number	Diff line number	Diff line change
`@@ -4,3 +4,4 @@`
`4`	`4`
`5`	`5`	`from .mask_rcnn import *`
`6`	`6`	`from .predefined_models import *`
	`7`	`+from .data_parallel import ForwardBackwardTask`