пре 1 година · 537eb86a8e
--- a/config/model_config/rtdetr_config.py
+++ b/config/model_config/rtdetr_config.py
@@ -75,7 +75,7 @@ rtdetr_cfg = {
 
				         'fpn_act': 'silu',
			
 
				         'fpn_norm': 'BN',
			
 
				         'fpn_depthwise': False,
			
 
				-        'hidden_dim': 320,
			
 
				+        'hidden_dim': 256,
			
 
				         'en_num_heads': 8,
			
 
				         'en_num_layers': 1,
			
 
				         'en_ffn_dim': 1024,
			
@@ -128,7 +128,7 @@ rtdetr_cfg = {
 
				         'max_stride': 32,
			
 
				         ## Image Encoder - FPN
			
 
				         'fpn': 'hybrid_encoder',
			
 
				-        'fpn_num_blocks': 3,
			
 
				+        'fpn_num_blocks': 4,
			
 
				         'fpn_act': 'silu',
			
 
				         'fpn_norm': 'BN',
			
 
				         'fpn_depthwise': False,
			
--- a/engine.py
+++ b/engine.py
@@ -17,7 +17,8 @@ from evaluator.build import build_evluator
 
				 
			
 
				 # ----------------- Optimizer & LrScheduler Components -----------------
			
 
				 from utils.solver.optimizer import build_yolo_optimizer, build_rtdetr_optimizer
			
 
				-from utils.solver.lr_scheduler import build_lr_scheduler
			
 
				+from utils.solver.lr_scheduler import build_lambda_lr_scheduler
			
 
				+from utils.solver.lr_scheduler import build_wp_lr_scheduler, build_lr_scheduler
			
 
				 
			
 
				 # ----------------- Dataset Components -----------------
			
 
				 from dataset.build import build_dataset, build_transform
			
@@ -80,7 +81,7 @@ class Yolov8Trainer(object):
 
				         self.optimizer, self.start_epoch = build_yolo_optimizer(self.optimizer_dict, model, self.args.resume)
			
 
				 
			
 
				         # ---------------------------- Build LR Scheduler ----------------------------
			
 
				-        self.lr_scheduler, self.lf = build_lr_scheduler(self.lr_schedule_dict, self.optimizer, self.args.max_epoch)
			
 
				+        self.lr_scheduler, self.lf = build_lambda_lr_scheduler(self.lr_schedule_dict, self.optimizer, self.args.max_epoch)
			
 
				         self.lr_scheduler.last_epoch = self.start_epoch - 1  # do not move
			
 
				         if self.args.resume and self.args.resume != 'None':
			
 
				             self.lr_scheduler.step()
			
@@ -449,7 +450,7 @@ class YoloxTrainer(object):
 
				         self.optimizer, self.start_epoch = build_yolo_optimizer(self.optimizer_dict, model, self.args.resume)
			
 
				 
			
 
				         # ---------------------------- Build LR Scheduler ----------------------------
			
 
				-        self.lr_scheduler, self.lf = build_lr_scheduler(self.lr_schedule_dict, self.optimizer, self.args.max_epoch - self.no_aug_epoch)
			
 
				+        self.lr_scheduler, self.lf = build_lambda_lr_scheduler(self.lr_schedule_dict, self.optimizer, self.args.max_epoch - self.no_aug_epoch)
			
 
				         self.lr_scheduler.last_epoch = self.start_epoch - 1  # do not move
			
 
				         if self.args.resume and self.args.resume != 'None':
			
 
				             self.lr_scheduler.step()
			
@@ -813,7 +814,7 @@ class RTCTrainer(object):
 
				         self.optimizer, self.start_epoch = build_yolo_optimizer(self.optimizer_dict, model, args.resume)
			
 
				 
			
 
				         # ---------------------------- Build LR Scheduler ----------------------------
			
 
				-        self.lr_scheduler, self.lf = build_lr_scheduler(self.lr_schedule_dict, self.optimizer, args.max_epoch)
			
 
				+        self.lr_scheduler, self.lf = build_lambda_lr_scheduler(self.lr_schedule_dict, self.optimizer, args.max_epoch)
			
 
				         self.lr_scheduler.last_epoch = self.start_epoch - 1  # do not move
			
 
				         if self.args.resume and self.args.resume != 'None':
			
 
				             self.lr_scheduler.step()
			
@@ -1147,7 +1148,8 @@ class RTDetrTrainer(object):
 
				 
			
 
				         # ---------------------------- Hyperparameters refer to RTMDet ----------------------------
			
 
				         self.optimizer_dict = {'optimizer': 'adamw', 'momentum': None, 'weight_decay': 0.0001, 'lr0': 0.0001, 'backbone_lr_ratio': 0.1}
			
 
				-        self.lr_schedule_dict = {'scheduler': 'cosine', 'lrf': 1.0, 'warmup_iters': 2000} # no lr decay (because lrf is set 1.0)
			
 
				+        self.warmup_dict = {'warmup': 'linear', 'warmup_iters': 2000, 'warmup_factor': 0.00066667}
			
 
				+        self.lr_schedule_dict = {'lr_scheduler': 'step', 'lr_epoch': [self.args.max_epoch // 12 * 11]}
			
 
				         self.ema_dict = {'ema_decay': 0.9999, 'ema_tau': 2000}
			
 
				 
			
 
				         # ---------------------------- Build Dataset & Model & Trans. Config ----------------------------
			
@@ -1178,10 +1180,8 @@ class RTDetrTrainer(object):
 
				         self.optimizer, self.start_epoch = build_rtdetr_optimizer(self.optimizer_dict, model, self.args.resume)
			
 
				 
			
 
				         # ---------------------------- Build LR Scheduler ----------------------------
			
 
				-        self.lr_scheduler, self.lf = build_lr_scheduler(self.lr_schedule_dict, self.optimizer, args.max_epoch)
			
 
				-        self.lr_scheduler.last_epoch = self.start_epoch - 1  # do not move
			
 
				-        if self.args.resume and self.args.resume != 'None':
			
 
				-            self.lr_scheduler.step()
			
 
				+        self.wp_lr_scheduler = build_wp_lr_scheduler(self.warmup_dict, self.optimizer_dict['lr0'])
			
 
				+        self.lr_scheduler    = build_lr_scheduler(self.lr_schedule_dict, self.optimizer, args.resume)
			
 
				 
			
 
				         # ---------------------------- Build Model-EMA ----------------------------
			
 
				         if self.args.ema and distributed_utils.get_rank() in [-1, 0]:
			
@@ -1287,17 +1287,20 @@ class RTDetrTrainer(object):
 
				         # basic parameters
			
 
				         epoch_size = len(self.train_loader)
			
 
				         img_size = self.args.img_size
			
 
				-        nw = self.lr_schedule_dict['warmup_iters']
			
 
				+        nw = self.warmup_dict['warmup_iters']
			
 
				+        lr_warmup_stage = True
			
 
				 
			
 
				         # Train one epoch
			
 
				         for iter_i, (images, targets) in enumerate(metric_logger.log_every(self.train_loader, print_freq, header)):
			
 
				             ni = iter_i + self.epoch * epoch_size
			
 
				-            # Warmup
			
 
				-            if ni <= nw:
			
 
				-                xi = [0, nw]  # x interp
			
 
				-                for x in self.optimizer.param_groups:
			
 
				-                    x['lr'] = np.interp(ni, xi, [0.0, x['initial_lr'] * self.lf(self.epoch)])
			
 
				-                                
			
 
				+            # WarmUp
			
 
				+            if ni < nw and lr_warmup_stage:
			
 
				+                self.wp_lr_scheduler(ni, self.optimizer)
			
 
				+            elif ni == nw and lr_warmup_stage:
			
 
				+                print('Warmup stage is over.')
			
 
				+                lr_warmup_stage = False
			
 
				+                self.wp_lr_scheduler.set_lr(self.optimizer, self.optimizer_dict['lr0'], self.optimizer_dict['lr0'])
			
 
				+                                            
			
 
				             # To device
			
 
				             images = images.to(self.device, non_blocking=True).float()
			
 
				             for tgt in targets:
			
@@ -1359,10 +1362,9 @@ class RTDetrTrainer(object):
 
				             if self.args.debug:
			
 
				                 print("For debug mode, we only train 1 iteration")
			
 
				                 break
			
 
				-
			
 
				-        # LR Schedule
			
 
				-        if not self.second_stage:
			
 
				-            self.lr_scheduler.step()
			
 
				+    
			
 
				+        # LR Scheduler
			
 
				+        self.lr_scheduler.step()
			
 
				         
			
 
				     def refine_targets(self, img_size, targets, min_box_size):
			
 
				         # rescale targets
			
@@ -1503,7 +1505,7 @@ class RTPDetrTrainer(RTDetrTrainer):
 
				 
			
 
				         # ---------------------------- Build LR Scheduler ----------------------------
			
 
				         print("- Re-build lr scheduler -")
			
 
				-        self.lr_scheduler, self.lf = build_lr_scheduler(self.lr_schedule_dict, self.optimizer, args.max_epoch)
			
 
				+        self.lr_scheduler, self.lf = build_lambda_lr_scheduler(self.lr_schedule_dict, self.optimizer, args.max_epoch)
			
 
				         self.lr_scheduler.last_epoch = self.start_epoch - 1  # do not move
			
 
				         if self.args.resume and self.args.resume != 'None':
			
 
				             self.lr_scheduler.step()
			
@@ -1651,7 +1653,7 @@ class RTCTrainerDS(object):
 
				         self.optimizer, self.start_epoch = build_yolo_optimizer(self.optimizer_dict, model, args.resume)
			
 
				 
			
 
				         # ---------------------------- Build LR Scheduler ----------------------------
			
 
				-        self.lr_scheduler, self.lf = build_lr_scheduler(self.lr_schedule_dict, self.optimizer, args.max_epoch - args.no_aug_epoch)
			
 
				+        self.lr_scheduler, self.lf = build_lambda_lr_scheduler(self.lr_schedule_dict, self.optimizer, args.max_epoch - args.no_aug_epoch)
			
 
				         self.lr_scheduler.last_epoch = self.start_epoch - 1  # do not move
			
 
				         if self.args.resume and self.args.resume != 'None':
			
 
				             self.lr_scheduler.step()
			
@@ -1994,7 +1996,7 @@ class RTCTrainerDSP(object):
 
				         self.optimizer, self.start_epoch = build_yolo_optimizer(self.optimizer_dict, model, args.resume)
			
 
				 
			
 
				         # ---------------------------- Build LR Scheduler ----------------------------
			
 
				-        self.lr_scheduler, self.lf = build_lr_scheduler(self.lr_schedule_dict, self.optimizer, args.max_epoch - args.no_aug_epoch)
			
 
				+        self.lr_scheduler, self.lf = build_lambda_lr_scheduler(self.lr_schedule_dict, self.optimizer, args.max_epoch - args.no_aug_epoch)
			
 
				         self.lr_scheduler.last_epoch = self.start_epoch - 1  # do not move
			
 
				         if self.args.resume and self.args.resume != 'None':
			
 
				             self.lr_scheduler.step()
			
--- a/models/detectors/rtdetr/basic_modules/basic.py
+++ b/models/detectors/rtdetr/basic_modules/basic.py
@@ -254,23 +254,17 @@ class RTCBlock(nn.Module):
 
				                  norm_type  = 'BN',
			
 
				                  depthwise  = False,):
			
 
				         super(RTCBlock, self).__init__()
			
 
				-        self.inter_dim = out_dim // 2
			
 
				-        self.input_proj = BasicConv(in_dim, self.inter_dim * 2, kernel_size=1, act_type=act_type, norm_type=norm_type)
			
 
				-        self.m = nn.Sequential(*(
			
 
				-            Bottleneck(self.inter_dim, self.inter_dim, 1.0, [3, 3], shortcut, act_type, norm_type, depthwise)
			
 
				-            for _ in range(num_blocks)))
			
 
				-        self.output_proj = BasicConv((2 + num_blocks) * self.inter_dim, out_dim, kernel_size=1, act_type=act_type, norm_type=norm_type)
			
 
				+        self.inter_dim = out_dim
			
 
				+        self.conv1 = BasicConv(in_dim, self.inter_dim, kernel_size=1, act_type=act_type, norm_type=norm_type)
			
 
				+        self.conv2 = BasicConv(in_dim, self.inter_dim, kernel_size=1, act_type=act_type, norm_type=norm_type)
			
 
				+        self.m = nn.Sequential(*[Bottleneck(self.inter_dim, self.inter_dim,
			
 
				+                                            1.0, [1, 3], shortcut,
			
 
				+                                            act_type, norm_type, depthwise)
			
 
				+                                            for _ in range(num_blocks)])
			
 
				+        self.conv3 = BasicConv(self.inter_dim, out_dim, kernel_size=1, act_type=act_type, norm_type=norm_type)
			
 
				 
			
 
				     def forward(self, x):
			
 
				-        # Input proj
			
 
				-        x1, x2 = torch.chunk(self.input_proj(x), 2, dim=1)
			
 
				-        out = list([x1, x2])
			
 
				-
			
 
				-        # Bottlenecl
			
 
				-        out.extend(m(out[-1]) for m in self.m)
			
 
				-
			
 
				-        # Output proj
			
 
				-        out = self.output_proj(torch.cat(out, dim=1))
			
 
				-
			
 
				-        return out
			
 
				+        x1 = self.conv1(x)
			
 
				+        x2 = self.m(self.conv2(x))
			
 
				+        return self.conv3(x1 + x2)
			
 
				     
			
--- a/utils/solver/lr_scheduler.py
+++ b/utils/solver/lr_scheduler.py
@@ -2,7 +2,66 @@ import math
 
				 import torch
			
 
				 
			
 
				 
			
 
				-def build_lr_scheduler(cfg, optimizer, epochs):
			
 
				+# ------------------------- WarmUp LR Scheduler -------------------------
			
 
				+## Warmup LR Scheduler
			
 
				+class LinearWarmUpScheduler(object):
			
 
				+    def __init__(self, base_lr=0.01, wp_iter=500, warmup_factor=0.00066667):
			
 
				+        self.base_lr = base_lr
			
 
				+        self.wp_iter = wp_iter
			
 
				+        self.warmup_factor = warmup_factor
			
 
				+
			
 
				+
			
 
				+    def set_lr(self, optimizer, lr, base_lr):
			
 
				+        for param_group in optimizer.param_groups:
			
 
				+            init_lr = param_group['initial_lr']
			
 
				+            ratio = init_lr / base_lr
			
 
				+            param_group['lr'] = lr * ratio
			
 
				+
			
 
				+
			
 
				+    def __call__(self, iter, optimizer):
			
 
				+        # warmup
			
 
				+        alpha = iter / self.wp_iter
			
 
				+        warmup_factor = self.warmup_factor * (1 - alpha) + alpha
			
 
				+        tmp_lr = self.base_lr * warmup_factor
			
 
				+        self.set_lr(optimizer, tmp_lr, self.base_lr)
			
 
				+        
			
 
				+## Build WP LR Scheduler
			
 
				+def build_wp_lr_scheduler(cfg, base_lr=0.01):
			
 
				+    print('==============================')
			
 
				+    print('WarmUpScheduler: {}'.format(cfg['warmup']))
			
 
				+    print('--base_lr: {}'.format(base_lr))
			
 
				+    print('--warmup_iters: {}'.format(cfg['warmup_iters']))
			
 
				+    print('--warmup_factor: {}'.format(cfg['warmup_factor']))
			
 
				+
			
 
				+    if cfg['warmup'] == 'linear':
			
 
				+        wp_lr_scheduler = LinearWarmUpScheduler(base_lr, cfg['warmup_iters'], cfg['warmup_factor'])
			
 
				+    
			
 
				+    return wp_lr_scheduler
			
 
				+
			
 
				+                           
			
 
				+# ------------------------- LR Scheduler -------------------------
			
 
				+def build_lr_scheduler(cfg, optimizer, resume=None):
			
 
				+    print('==============================')
			
 
				+    print('LR Scheduler: {}'.format(cfg['lr_scheduler']))
			
 
				+
			
 
				+    if cfg['lr_scheduler'] == 'step':
			
 
				+        assert 'lr_epoch' in cfg
			
 
				+        print('--lr_epoch: {}'.format(cfg['lr_epoch']))
			
 
				+        lr_scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer=optimizer, milestones=cfg['lr_epoch'])
			
 
				+    elif cfg['lr_scheduler'] == 'cosine':
			
 
				+        pass
			
 
				+        
			
 
				+    if resume is not None:
			
 
				+        print('keep training: ', resume)
			
 
				+        checkpoint = torch.load(resume)
			
 
				+        # checkpoint state dict
			
 
				+        checkpoint_state_dict = checkpoint.pop("lr_scheduler")
			
 
				+        lr_scheduler.load_state_dict(checkpoint_state_dict)
			
 
				+
			
 
				+    return lr_scheduler
			
 
				+
			
 
				+
			
 
				+def build_lambda_lr_scheduler(cfg, optimizer, epochs):
			
 
				     """Build learning rate scheduler from cfg file."""
			
 
				     print('==============================')
			
 
				     print('Lr Scheduler: {}'.format(cfg['scheduler']))