1 anno fa · 63a2f44fb2
--- a/models/detectors/rtdetr/basic_modules/basic.py
+++ b/models/detectors/rtdetr/basic_modules/basic.py
@@ -72,6 +72,7 @@ def multiclass_nms(scores, labels, bboxes, nms_thresh, num_classes, class_agnost
 
															     else:
														
 
															         return multiclass_nms_class_aware(scores, labels, bboxes, nms_thresh, num_classes)
														
 
															+
														
 
															 # ----------------- MLP modules -----------------
														
 
															 class MLP(nn.Module):
														
 
															     def __init__(self, in_dim, hidden_dim, out_dim, num_layers):
														
--- a/models/detectors/rtdetr/build.py
+++ b/models/detectors/rtdetr/build.py
@@ -24,7 +24,7 @@ def build_rtdetr(args, cfg, num_classes=80, trainable=False, deploy=False):
 
															                     topk            = 300,
														
 
															                     deploy          = deploy,
														
 
															                     no_multi_labels = args.no_multi_labels,
														
 
															-                    use_nms         = True,
														
 
															+                    use_nms         = True,   # NMS is beneficial 
														
 
															                     nms_class_agnostic = args.nms_class_agnostic
														
 
															                     )
														
--- a/models/detectors/rtdetr/rtdetr.py
+++ b/models/detectors/rtdetr/rtdetr.py
@@ -11,7 +11,7 @@ except:
 
															     from  rtdetr_decoder import build_transformer
														
 
															-# Real-time Transformer-based Object Detector
														
 
															+# Real-time DETR
														
 
															 class RT_DETR(nn.Module):
														
 
															     def __init__(self,
														
 
															                  cfg,
														
@@ -28,8 +28,6 @@ class RT_DETR(nn.Module):
 
															         # ----------- Basic setting -----------
														
 
															         self.num_classes = num_classes
														
 
															         self.num_topk = topk
														
 
															-        self.conf_thresh = conf_thresh
														
 
															-        self.no_multi_labels = no_multi_labels
														
 
															         self.deploy = deploy
														
 
															         # scale hidden channels by width_factor
														
 
															         cfg['hidden_dim'] = round(cfg['hidden_dim'] * cfg['width'])
														
@@ -37,7 +35,6 @@ class RT_DETR(nn.Module):
 
															         self.use_nms = use_nms
														
 
															         self.nms_thresh = nms_thresh
														
 
															         self.conf_thresh = conf_thresh
														
 
															-        self.topk_candidates = topk
														
 
															         self.no_multi_labels = no_multi_labels
														
 
															         self.nms_class_agnostic = nms_class_agnostic
														
--- a/models/detectors/rtpdetr/basic_modules/basic.py
+++ b/models/detectors/rtpdetr/basic_modules/basic.py
@@ -1,5 +1,6 @@
 
															 import math
														
 
															 import warnings
														
 
															+import numpy as np
														
 
															 import torch
														
 
															 import torch.nn as nn
														
@@ -72,6 +73,76 @@ def delta2bbox(proposals,
 
															     return bboxes
														
 
															+# ---------------------------- NMS ----------------------------
														
 
															+## basic NMS
														
 
															+def nms(bboxes, scores, nms_thresh):
														
 
															+    """"Pure Python NMS."""
														
 
															+    x1 = bboxes[:, 0]  #xmin
														
 
															+    y1 = bboxes[:, 1]  #ymin
														
 
															+    x2 = bboxes[:, 2]  #xmax
														
 
															+    y2 = bboxes[:, 3]  #ymax
														
 
															+
														
 
															+    areas = (x2 - x1) * (y2 - y1)
														
 
															+    order = scores.argsort()[::-1]
														
 
															+
														
 
															+    keep = []
														
 
															+    while order.size > 0:
														
 
															+        i = order[0]
														
 
															+        keep.append(i)
														
 
															+        # compute iou
														
 
															+        xx1 = np.maximum(x1[i], x1[order[1:]])
														
 
															+        yy1 = np.maximum(y1[i], y1[order[1:]])
														
 
															+        xx2 = np.minimum(x2[i], x2[order[1:]])
														
 
															+        yy2 = np.minimum(y2[i], y2[order[1:]])
														
 
															+
														
 
															+        w = np.maximum(1e-10, xx2 - xx1)
														
 
															+        h = np.maximum(1e-10, yy2 - yy1)
														
 
															+        inter = w * h
														
 
															+
														
 
															+        iou = inter / (areas[i] + areas[order[1:]] - inter + 1e-14)
														
 
															+        #reserve all the boundingbox whose ovr less than thresh
														
 
															+        inds = np.where(iou <= nms_thresh)[0]
														
 
															+        order = order[inds + 1]
														
 
															+
														
 
															+    return keep
														
 
															+
														
 
															+## class-agnostic NMS 
														
 
															+def multiclass_nms_class_agnostic(scores, labels, bboxes, nms_thresh):
														
 
															+    # nms
														
 
															+    keep = nms(bboxes, scores, nms_thresh)
														
 
															+    scores = scores[keep]
														
 
															+    labels = labels[keep]
														
 
															+    bboxes = bboxes[keep]
														
 
															+
														
 
															+    return scores, labels, bboxes
														
 
															+
														
 
															+## class-aware NMS 
														
 
															+def multiclass_nms_class_aware(scores, labels, bboxes, nms_thresh, num_classes):
														
 
															+    # nms
														
 
															+    keep = np.zeros(len(bboxes), dtype=np.int32)
														
 
															+    for i in range(num_classes):
														
 
															+        inds = np.where(labels == i)[0]
														
 
															+        if len(inds) == 0:
														
 
															+            continue
														
 
															+        c_bboxes = bboxes[inds]
														
 
															+        c_scores = scores[inds]
														
 
															+        c_keep = nms(c_bboxes, c_scores, nms_thresh)
														
 
															+        keep[inds[c_keep]] = 1
														
 
															+    keep = np.where(keep > 0)
														
 
															+    scores = scores[keep]
														
 
															+    labels = labels[keep]
														
 
															+    bboxes = bboxes[keep]
														
 
															+
														
 
															+    return scores, labels, bboxes
														
 
															+
														
 
															+## multi-class NMS 
														
 
															+def multiclass_nms(scores, labels, bboxes, nms_thresh, num_classes, class_agnostic=False):
														
 
															+    if class_agnostic:
														
 
															+        return multiclass_nms_class_agnostic(scores, labels, bboxes, nms_thresh)
														
 
															+    else:
														
 
															+        return multiclass_nms_class_aware(scores, labels, bboxes, nms_thresh, num_classes)
														
 
															+
														
 
															+
														
 
															 # ----------------- Customed NormLayer Ops -----------------
														
 
															 class FrozenBatchNorm2d(torch.nn.Module):
														
 
															     def __init__(self, n):
														
--- a/models/detectors/rtpdetr/build.py
+++ b/models/detectors/rtpdetr/build.py
@@ -23,6 +23,8 @@ def build_rtpdetr(args, cfg, num_classes=80, trainable=False, deploy=False):
 
															                      topk            = 300,
														
 
															                      deploy          = deploy,
														
 
															                      no_multi_labels = args.no_multi_labels,
														
 
															+                     use_nms         = True,   # NMS is beneficial 
														
 
															+                     nms_class_agnostic = args.nms_class_agnostic
														
 
															                      )
														
 
															     # -------------- Build criterion --------------
														
--- a/models/detectors/rtpdetr/rtpdetr.py
+++ b/models/detectors/rtpdetr/rtpdetr.py
@@ -3,26 +3,29 @@ import torch
 
															 import torch.nn as nn
														
 
															 try:
														
 
															-    from .basic_modules.basic import MLP
														
 
															+    from .basic_modules.basic import MLP, multiclass_nms
														
 
															     from .basic_modules.transformer import get_clones
														
 
															     from .rtpdetr_encoder import build_image_encoder
														
 
															     from .rtpdetr_decoder import build_transformer
														
 
															 except:
														
 
															-    from  basic_modules.basic import MLP
														
 
															+    from  basic_modules.basic import MLP, multiclass_nms
														
 
															     from  basic_modules.transformer import get_clones
														
 
															     from  rtpdetr_encoder import build_image_encoder
														
 
															     from  rtpdetr_decoder import build_transformer
														
 
															-# Real-time Plain Transformer-based Object Detector
														
 
															+# Real-time PlainDETR
														
 
															 class RT_PDETR(nn.Module):
														
 
															     def __init__(self,
														
 
															                  cfg,
														
 
															                  num_classes = 80,
														
 
															                  conf_thresh = 0.1,
														
 
															+                 nms_thresh  = 0.5,
														
 
															                  topk        = 300,
														
 
															                  deploy      = False,
														
 
															                  no_multi_labels = False,
														
 
															+                 use_nms     = False,
														
 
															+                 nms_class_agnostic = False,
														
 
															                  aux_loss    = False,
														
 
															                  ):
														
 
															         super().__init__()
														
@@ -33,11 +36,15 @@ class RT_PDETR(nn.Module):
 
															         self.num_classes = num_classes
														
 
															         self.num_topk = topk
														
 
															         self.aux_loss = aux_loss
														
 
															-        self.conf_thresh = conf_thresh
														
 
															-        self.no_multi_labels = no_multi_labels
														
 
															         self.deploy = deploy
														
 
															         # scale hidden channels by width_factor
														
 
															         cfg['hidden_dim'] = round(cfg['hidden_dim'] * cfg['width'])
														
 
															+        ## Post-process parameters
														
 
															+        self.use_nms = use_nms
														
 
															+        self.nms_thresh = nms_thresh
														
 
															+        self.conf_thresh = conf_thresh
														
 
															+        self.no_multi_labels = no_multi_labels
														
 
															+        self.nms_class_agnostic = nms_class_agnostic
														
 
															         # ----------- Network setting -----------
														
 
															         ## Image encoder
														
@@ -162,6 +169,15 @@ class RT_PDETR(nn.Module):
 
															             topk_labels = topk_idxs % self.num_classes
														
 
															             topk_bboxes = box_pred[topk_box_idxs]
														
 
															+        topk_scores = topk_scores.cpu().numpy()
														
 
															+        topk_labels = topk_labels.cpu().numpy()
														
 
															+        topk_bboxes = topk_bboxes.cpu().numpy()
														
 
															+
														
 
															+        # nms
														
 
															+        if self.use_nms:
														
 
															+            topk_scores, topk_labels, topk_bboxes = multiclass_nms(
														
 
															+                topk_scores, topk_labels, topk_bboxes, self.nms_thresh, self.num_classes, self.nms_class_agnostic)
														
 
															+
														
 
															         return topk_bboxes, topk_scores, topk_labels
														
 
															     @torch.jit.unused
														
@@ -225,9 +241,9 @@ class RT_PDETR(nn.Module):
 
															         bboxes, scores, labels = self.post_process(box_pred, cls_pred)
														
 
															         outputs = {
														
 
															-            "scores": scores.cpu().numpy(),
														
 
															-            "labels": labels.cpu().numpy(),
														
 
															-            "bboxes": bboxes.cpu().numpy(),
														
 
															+            "scores": scores,
														
 
															+            "labels": labels,
														
 
															+            "bboxes": bboxes,
														
 
															         }
														
 
															         return outputs