2 年之前 · 97d3d9874d
--- a/config/__init__.py
+++ b/config/__init__.py
@@ -22,7 +22,7 @@ from .yolov4_config import yolov4_cfg
 
															 from .yolov5_config import yolov5_cfg
														
 
															 from .yolov7_config import yolov7_cfg
														
 
															 from .yolox_config import yolox_cfg
														
 
															-from .yolox_plus_config import yolox_plus_cfg
														
 
															+from .artdet_config import artdet_cfg
														
 
															 def build_model_config(args):
														
@@ -49,9 +49,9 @@ def build_model_config(args):
 
															     # YOLOX
														
 
															     elif args.model in ['yolox_n', 'yolox_s', 'yolox_m', 'yolox_l', 'yolox_x']:
														
 
															         cfg = yolox_cfg[args.model]
														
 
															-    # YOLOX-Plus
														
 
															-    elif args.model in ['yolox_plus_n', 'yolox_plus_s', 'yolox_plus_m', 'yolox_plus_l', 'yolox_plus_x']:
														
 
															-        cfg = yolox_plus_cfg[args.model]
														
 
															+    # ARTDet
														
 
															+    elif args.model in ['artdet_n', 'artdet_s', 'artdet_m', 'artdet_l', 'artdet_x']:
														
 
															+        cfg = artdet_cfg[args.model]
														
 
															     return cfg
														
--- a/config/yolox_plus_config.py
+++ b/config/yolox_plus_config.py
@@ -1,8 +1,8 @@
 
															 # YOLOX-Plus Config
														
 
															-yolox_plus_cfg = {
														
 
															-    'yolox_plus_n':{
														
 
															+artdet_cfg = {
														
 
															+    'artdet_n':{
														
 
															         # ---------------- Model config ----------------
														
 
															         ## Backbone
														
 
															         'backbone': 'elannet',
														
--- a/models/detectors/__init__.py
+++ b/models/detectors/__init__.py
@@ -9,7 +9,7 @@ from .yolov4.build import build_yolov4
 
															 from .yolov5.build import build_yolov5
														
 
															 from .yolov7.build import build_yolov7
														
 
															 from .yolox.build import build_yolox
														
 
															-from .yolox_plus.build import build_yolox_plus
														
 
															+from .artdet.build import build_artdet
														
 
															 # build object detector
														
@@ -47,9 +47,9 @@ def build_model(args,
 
															     elif args.model in ['yolox_n', 'yolox_s', 'yolox_m', 'yolox_l', 'yolox_x']:
														
 
															         model, criterion = build_yolox(
														
 
															             args, model_cfg, device, num_classes, trainable, deploy)
														
 
															-    # YOLOX-Plus  
														
 
															-    elif args.model in ['yolox_plus_n', 'yolox_plus_s', 'yolox_plus_m', 'yolox_plus_l', 'yolox_plus_x']:
														
 
															-        model, criterion = build_yolox_plus(
														
 
															+    # ARTDet  
														
 
															+    elif args.model in ['artdet_n', 'artdet_s', 'artdet_m', 'artdet_l', 'artdet_x']:
														
 
															+        model, criterion = build_artdet(
														
 
															             args, model_cfg, device, num_classes, trainable, deploy)
														
 
															     if trainable:
														
--- a/models/detectors/yolox_plus/yolox_plus.py
+++ b/models/detectors/yolox_plus/yolox_plus.py
@@ -4,17 +4,17 @@ import torch.nn as nn
 
															 import torch.nn.functional as F
														
 
															 # --------------- Model components ---------------
														
 
															-from .yolox_plus_backbone import build_backbone
														
 
															-from .yolox_plus_neck import build_neck
														
 
															-from .yolox_plus_pafpn import build_fpn
														
 
															-from .yolox_plus_head import build_head
														
 
															+from .artdet_backbone import build_backbone
														
 
															+from .artdet_neck import build_neck
														
 
															+from .artdet_pafpn import build_fpn
														
 
															+from .artdet_head import build_head
														
 
															 # --------------- External components ---------------
														
 
															 from utils.misc import multiclass_nms
														
 
															-# YOLOX-Plus
														
 
															-class YoloxPlus(nn.Module):
														
 
															+# Anchor-free Real-Time Detection
														
 
															+class ARTDet(nn.Module):
														
 
															     def __init__(self, 
														
 
															                  cfg,
														
 
															                  device, 
														
@@ -24,7 +24,7 @@ class YoloxPlus(nn.Module):
 
															                  trainable = False, 
														
 
															                  topk = 1000,
														
 
															                  deploy = False):
														
 
															-        super(YoloxPlus, self).__init__()
														
 
															+        super(ARTDet, self).__init__()
														
 
															         # ---------------------- Basic Parameters ----------------------
														
 
															         self.cfg = cfg
														
 
															         self.device = device
														
@@ -38,11 +38,6 @@ class YoloxPlus(nn.Module):
 
															         self.deploy = deploy
														
 
															         # ---------------------- Network Parameters ----------------------
														
 
															-        ## ----------- proj_conv ------------
														
 
															-        self.proj = nn.Parameter(torch.linspace(0, cfg['reg_max'], cfg['reg_max']), requires_grad=False)
														
 
															-        self.proj_conv = nn.Conv2d(self.reg_max, 1, kernel_size=1, bias=False)
														
 
															-        self.proj_conv.weight = nn.Parameter(self.proj.view([1, cfg['reg_max'], 1, 1]).clone().detach(), requires_grad=False)
														
 
															-
														
 
															         ## ----------- Backbone -----------
														
 
															         self.backbone, feats_dim = build_backbone(cfg, trainable&cfg['pretrained'])
														
@@ -135,43 +130,19 @@ class YoloxPlus(nn.Module):
 
															     def inference_single_image(self, x):
														
 
															         # ---------------- Backbone ----------------
														
 
															         pyramid_feats = self.backbone(x)
														
 
															-
														
 
															-        # ---------------- Neck: SPP ----------------
														
 
															         pyramid_feats[-1] = self.neck(pyramid_feats[-1])
														
 
															-
														
 
															-        # ---------------- Neck: PaFPN ----------------
														
 
															         pyramid_feats = self.fpn(pyramid_feats)
														
 
															         # ---------------- Heads ----------------
														
 
															         all_cls_preds = []
														
 
															         all_box_preds = []
														
 
															         for level, (feat, head) in enumerate(zip(pyramid_feats, self.det_heads)):
														
 
															-            # ---------------- Pred ----------------
														
 
															-            cls_pred, reg_pred = head(feat)
														
 
															-
														
 
															             # anchors: [M, 2]
														
 
															-            B, _, H, W = reg_pred.size()
														
 
															-            fmp_size = [H, W]
														
 
															+            fmp_size = feat.shape[-2:]
														
 
															             anchors = self.generate_anchors(level, fmp_size)
														
 
															-            # process preds
														
 
															-            cls_pred = cls_pred.permute(0, 2, 3, 1).contiguous().view(B, -1, self.num_classes)
														
 
															-            reg_pred = reg_pred.permute(0, 2, 3, 1).contiguous().view(B, -1, 4*self.reg_max)
														
 
															-
														
 
															-            # ----------------------- Decode bbox -----------------------
														
 
															-            B, M = reg_pred.shape[:2]
														
 
															-            # [B, M, 4*(reg_max)] -> [B, M, 4, reg_max] -> [B, 4, M, reg_max]
														
 
															-            reg_pred = reg_pred.reshape([B, M, 4, self.reg_max])
														
 
															-            # [B, M, 4, reg_max] -> [B, reg_max, 4, M]
														
 
															-            reg_pred = reg_pred.permute(0, 3, 2, 1).contiguous()
														
 
															-            # [B, reg_max, 4, M] -> [B, 1, 4, M]
														
 
															-            reg_pred = self.proj_conv(F.softmax(reg_pred, dim=1))
														
 
															-            # [B, 1, 4, M] -> [B, 4, M] -> [B, M, 4]
														
 
															-            reg_pred = reg_pred.view(B, 4, M).permute(0, 2, 1).contiguous()
														
 
															-            ## tlbr -> xyxy
														
 
															-            x1y1_pred = anchors[None] - reg_pred[..., :2] * self.stride[level]
														
 
															-            x2y2_pred = anchors[None] + reg_pred[..., 2:] * self.stride[level]
														
 
															-            box_pred = torch.cat([x1y1_pred, x2y2_pred], dim=-1)
														
 
															+            # pred
														
 
															+            cls_pred, reg_pred, box_pred = head(feat, anchors, self.stride[level])
														
 
															             # collect preds
														
 
															             all_cls_preds.append(cls_pred[0])
														
@@ -200,11 +171,7 @@ class YoloxPlus(nn.Module):
 
															         else:
														
 
															             # ---------------- Backbone ----------------
														
 
															             pyramid_feats = self.backbone(x)
														
 
															-
														
 
															-            # ---------------- Neck: SPP ----------------
														
 
															             pyramid_feats[-1] = self.neck(pyramid_feats[-1])
														
 
															-
														
 
															-            # ---------------- Neck: PaFPN ----------------
														
 
															             pyramid_feats = self.fpn(pyramid_feats)
														
 
															             # ---------------- Heads ----------------
														
@@ -214,34 +181,14 @@ class YoloxPlus(nn.Module):
 
															             all_box_preds = []
														
 
															             all_strides = []
														
 
															             for level, (feat, head) in enumerate(zip(pyramid_feats, self.det_heads)):
														
 
															-                # ---------------- Pred ----------------
														
 
															-                cls_pred, reg_pred = head(feat)
														
 
															-
														
 
															-                B, _, H, W = cls_pred.size()
														
 
															-                fmp_size = [H, W]
														
 
															-                # generate anchor boxes: [M, 4]
														
 
															+                # anchors: [M, 2]
														
 
															+                fmp_size = feat.shape[-2:]
														
 
															                 anchors = self.generate_anchors(level, fmp_size)
														
 
															                 # stride tensor: [M, 1]
														
 
															                 stride_tensor = torch.ones_like(anchors[..., :1]) * self.stride[level]
														
 
															-                
														
 
															-                # process preds
														
 
															-                cls_pred = cls_pred.permute(0, 2, 3, 1).contiguous().view(B, -1, self.num_classes)
														
 
															-                reg_pred = reg_pred.permute(0, 2, 3, 1).contiguous().view(B, -1, 4*self.reg_max)
														
 
															-                # ----------------------- Decode bbox -----------------------
														
 
															-                B, M = reg_pred.shape[:2]
														
 
															-                # [B, M, 4*(reg_max)] -> [B, M, 4, reg_max] -> [B, 4, M, reg_max]
														
 
															-                reg_pred_ = reg_pred.reshape([B, M, 4, self.reg_max])
														
 
															-                # [B, M, 4, reg_max] -> [B, reg_max, 4, M]
														
 
															-                reg_pred_ = reg_pred_.permute(0, 3, 2, 1).contiguous()
														
 
															-                # [B, reg_max, 4, M] -> [B, 1, 4, M]
														
 
															-                reg_pred_ = self.proj_conv(F.softmax(reg_pred_, dim=1))
														
 
															-                # [B, 1, 4, M] -> [B, 4, M] -> [B, M, 4]
														
 
															-                reg_pred_ = reg_pred_.view(B, 4, M).permute(0, 2, 1).contiguous()
														
 
															-                ## tlbr -> xyxy
														
 
															-                x1y1_pred = anchors[None] - reg_pred_[..., :2] * self.stride[level]
														
 
															-                x2y2_pred = anchors[None] + reg_pred_[..., 2:] * self.stride[level]
														
 
															-                box_pred = torch.cat([x1y1_pred, x2y2_pred], dim=-1)
														
 
															+                # pred
														
 
															+                cls_pred, reg_pred, box_pred = head(feat, anchors, self.stride[level])
														
 
															                 # collect preds
														
 
															                 all_cls_preds.append(cls_pred)
														
--- a/models/detectors/yolox_plus/yolox_plus_backbone.py
+++ b/models/detectors/yolox_plus/yolox_plus_backbone.py
@@ -1,9 +1,9 @@
 
															 import torch
														
 
															 import torch.nn as nn
														
 
															 try:
														
 
															-    from .yolox_plus_basic import Conv, ELANBlock, DownSample
														
 
															+    from .artdet_basic import Conv, ELANBlock, DownSample
														
 
															 except:
														
 
															-    from yolox_plus_basic import Conv, ELANBlock, DownSample
														
 
															+    from artdet_basic import Conv, ELANBlock, DownSample
														
--- a/models/detectors/yolox_plus/yolox_plus_basic.py
+++ b/models/detectors/yolox_plus/yolox_plus_basic.py
--- a/models/detectors/yolox_plus/yolox_plus_head.py
+++ b/models/detectors/yolox_plus/yolox_plus_head.py
@@ -1,9 +1,11 @@
 
															 import torch
														
 
															 import torch.nn as nn
														
 
															+import torch.nn.functional as F
														
 
															+
														
 
															 try:
														
 
															-    from .yolox_plus_basic import Conv
														
 
															+    from .artdet_basic import Conv
														
 
															 except:
														
 
															-    from yolox_plus_basic import Conv
														
 
															+    from artdet_basic import Conv
														
 
															 class DecoupledHead(nn.Module):
														
@@ -14,6 +16,7 @@ class DecoupledHead(nn.Module):
 
															         # --------- Basic Parameters ----------
														
 
															         self.in_dim = in_dim
														
 
															         self.num_classes = num_classes
														
 
															+        self.reg_max = cfg['reg_max']
														
 
															         self.num_cls_head=cfg['num_cls_head']
														
 
															         self.num_reg_head=cfg['num_reg_head']
														
@@ -61,8 +64,13 @@ class DecoupledHead(nn.Module):
 
															         self.cls_pred = nn.Conv2d(self.cls_out_dim, num_classes, kernel_size=1) 
														
 
															         self.reg_pred = nn.Conv2d(self.reg_out_dim, 4*cfg['reg_max'], kernel_size=1) 
														
 
															+        ## ----------- proj_conv ------------
														
 
															+        self.proj = nn.Parameter(torch.linspace(0, cfg['reg_max'], cfg['reg_max']), requires_grad=False)
														
 
															+        self.proj_conv = nn.Conv2d(self.reg_max, 1, kernel_size=1, bias=False)
														
 
															+        self.proj_conv.weight = nn.Parameter(self.proj.view([1, cfg['reg_max'], 1, 1]).clone().detach(), requires_grad=False)
														
 
															+
														
 
															-    def forward(self, x):
														
 
															+    def forward(self, x, anchors, stride):
														
 
															         """
														
 
															             in_feats: (Tensor) [B, C, H, W]
														
 
															         """
														
@@ -72,7 +80,27 @@ class DecoupledHead(nn.Module):
 
															         cls_pred = self.cls_pred(cls_feats)
														
 
															         reg_pred = self.reg_pred(reg_feats)
														
 
															-        return cls_pred, reg_pred
														
 
															+        # process preds
														
 
															+        B = x.shape[0]
														
 
															+        cls_pred = cls_pred.permute(0, 2, 3, 1).contiguous().view(B, -1, self.num_classes)
														
 
															+        reg_pred = reg_pred.permute(0, 2, 3, 1).contiguous().view(B, -1, 4*self.reg_max)
														
 
															+
														
 
															+        # ----------------------- Decode bbox -----------------------
														
 
															+        M = reg_pred.shape[1]
														
 
															+        # [B, M, 4*(reg_max)] -> [B, M, 4, reg_max] -> [B, 4, M, reg_max]
														
 
															+        reg_pred_ = reg_pred.reshape([B, M, 4, self.reg_max])
														
 
															+        # [B, M, 4, reg_max] -> [B, reg_max, 4, M]
														
 
															+        reg_pred_ = reg_pred_.permute(0, 3, 2, 1).contiguous()
														
 
															+        # [B, reg_max, 4, M] -> [B, 1, 4, M]
														
 
															+        reg_pred_ = self.proj_conv(F.softmax(reg_pred_, dim=1))
														
 
															+        # [B, 1, 4, M] -> [B, 4, M] -> [B, M, 4]
														
 
															+        reg_pred_ = reg_pred_.view(B, 4, M).permute(0, 2, 1).contiguous()
														
 
															+        ## tlbr -> xyxy
														
 
															+        x1y1_pred = anchors[None] - reg_pred_[..., :2] * stride
														
 
															+        x2y2_pred = anchors[None] + reg_pred_[..., 2:] * stride
														
 
															+        box_pred = torch.cat([x1y1_pred, x2y2_pred], dim=-1)
														
 
															+
														
 
															+        return cls_pred, reg_pred, box_pred
														
 
															 # build detection head
														
--- a/models/detectors/yolox_plus/yolox_plus_neck.py
+++ b/models/detectors/yolox_plus/yolox_plus_neck.py
@@ -1,6 +1,6 @@
 
															 import torch
														
 
															 import torch.nn as nn
														
 
															-from .yolox_plus_basic import Conv
														
 
															+from .artdet_basic import Conv
														
 
															 # Spatial Pyramid Pooling - Fast (SPPF) layer for YOLOv5 by Glenn Jocher
														
--- a/models/detectors/yolox_plus/yolox_plus_pafpn.py
+++ b/models/detectors/yolox_plus/yolox_plus_pafpn.py
@@ -2,7 +2,7 @@ import torch
 
															 import torch.nn as nn
														
 
															 import torch.nn.functional as F
														
 
															-from .yolox_plus_basic import (Conv, build_reduce_layer, build_downsample_layer, build_fpn_block)
														
 
															+from .artdet_basic import (Conv, build_reduce_layer, build_downsample_layer, build_fpn_block)
														
 
															 # YOLO-Style PaFPN
														
--- a/models/detectors/yolox_plus/build.py
+++ b/models/detectors/yolox_plus/build.py
@@ -5,16 +5,16 @@ import torch
 
															 import torch.nn as nn
														
 
															 from .loss import build_criterion
														
 
															-from .yolox_plus import YoloxPlus
														
 
															+from .artdet import ARTDet
														
 
															 # build object detector
														
 
															-def build_yolox_plus(args, cfg, device, num_classes=80, trainable=False, deploy=False):
														
 
															+def build_artdet(args, cfg, device, num_classes=80, trainable=False, deploy=False):
														
 
															     print('==============================')
														
 
															     print('Build {} ...'.format(args.model.upper()))
														
 
															-    # -------------- Build YOLO --------------
														
 
															-    model = YoloxPlus(
														
 
															+    # -------------- Build ARTDet --------------
														
 
															+    model = ARTDet(
														
 
															         cfg=cfg,
														
 
															         device=device, 
														
 
															         num_classes=num_classes,
														
@@ -25,7 +25,7 @@ def build_yolox_plus(args, cfg, device, num_classes=80, trainable=False, deploy=
 
															         deploy=deploy
														
 
															         )
														
 
															-    # -------------- Initialize YOLO --------------
														
 
															+    # -------------- Initialize ARTDet --------------
														
 
															     for m in model.modules():
														
 
															         if isinstance(m, nn.BatchNorm2d):
														
 
															             m.eps = 1e-3
														
--- a/models/detectors/yolox_plus/loss.py
+++ b/models/detectors/yolox_plus/loss.py
--- a/models/detectors/yolox_plus/matcher.py
+++ b/models/detectors/yolox_plus/matcher.py