1 yıl önce · 2f1e472c24
--- a/yolo/config/yolov3_config.py
+++ b/yolo/config/yolov3_config.py
@@ -87,7 +87,7 @@ class Yolov3BaseConfig(object):
 
				 
			
 
				         # ---------------- Lr Scheduler config ----------------
			
 
				         self.warmup_epoch = 3
			
 
				-        self.lr_scheduler = "linear"
			
 
				+        self.lr_scheduler = "cosine"
			
 
				         self.max_epoch    = 300
			
 
				         self.eval_epoch   = 10
			
 
				         self.no_aug_epoch = 20
			
--- a/yolo/config/yolov5_af_config.py
+++ b/yolo/config/yolov5_af_config.py
@@ -85,7 +85,7 @@ class Yolov5AFBaseConfig(object):
 
				 
			
 
				         # ---------------- Lr Scheduler config ----------------
			
 
				         self.warmup_epoch = 3
			
 
				-        self.lr_scheduler = "linear"
			
 
				+        self.lr_scheduler = "cosine"
			
 
				         self.max_epoch    = 300
			
 
				         self.eval_epoch   = 10
			
 
				         self.no_aug_epoch = 20
			
--- a/yolo/config/yolov5_config.py
+++ b/yolo/config/yolov5_config.py
@@ -87,7 +87,7 @@ class Yolov5BaseConfig(object):
 
				 
			
 
				         # ---------------- Lr Scheduler config ----------------
			
 
				         self.warmup_epoch = 3
			
 
				-        self.lr_scheduler = "linear"
			
 
				+        self.lr_scheduler = "cosine"
			
 
				         self.max_epoch    = 300
			
 
				         self.eval_epoch   = 10
			
 
				         self.no_aug_epoch = 20
			
--- a/yolo/config/yolov7_af_config.py
+++ b/yolo/config/yolov7_af_config.py
@@ -81,7 +81,7 @@ class Yolov7AFBaseConfig(object):
 
				 
			
 
				         # ---------------- Lr Scheduler config ----------------
			
 
				         self.warmup_epoch = 3
			
 
				-        self.lr_scheduler = "linear"
			
 
				+        self.lr_scheduler = "cosine"
			
 
				         self.max_epoch    = 300
			
 
				         self.eval_epoch   = 10
			
 
				         self.no_aug_epoch = 20
			
--- a/yolo/engine.py
+++ b/yolo/engine.py
@@ -2,7 +2,6 @@ import torch
 
				 import torch.distributed as dist
			
 
				 
			
 
				 import os
			
 
				-import numpy as np
			
 
				 import random
			
 
				 
			
 
				 # ----------------- Extra Components -----------------
			
@@ -12,7 +11,7 @@ from utils.vis_tools import vis_data
 
				 
			
 
				 # ----------------- Optimizer & LrScheduler Components -----------------
			
 
				 from utils.solver.optimizer import build_yolo_optimizer, build_rtdetr_optimizer
			
 
				-from utils.solver.lr_scheduler import LinearWarmUpLrScheduler, build_lr_scheduler, build_lambda_lr_scheduler
			
 
				+from utils.solver.lr_scheduler import LinearWarmUpLrScheduler, build_lr_scheduler
			
 
				 
			
 
				 
			
 
				 class YoloTrainer(object):
			
@@ -63,15 +62,15 @@ class YoloTrainer(object):
 
				         self.scaler = torch.cuda.amp.GradScaler(enabled=args.fp16)
			
 
				 
			
 
				         # ---------------------------- Build Optimizer ----------------------------
			
 
				-        cfg.base_lr = cfg.per_image_lr * args.batch_size
			
 
				+        self.grad_accumulate = max(64 // args.batch_size, 1)
			
 
				+        cfg.base_lr = cfg.per_image_lr * args.batch_size * self.grad_accumulate
			
 
				         cfg.min_lr  = cfg.base_lr * cfg.min_lr_ratio
			
 
				         self.optimizer, self.start_epoch = build_yolo_optimizer(cfg, model, args.resume)
			
 
				 
			
 
				         # ---------------------------- Build LR Scheduler ----------------------------
			
 
				-        self.lr_scheduler, self.lf = build_lambda_lr_scheduler(cfg, self.optimizer, cfg.max_epoch)
			
 
				-        self.lr_scheduler.last_epoch = self.start_epoch - 1  # do not move
			
 
				-        if self.args.resume and self.args.resume != 'None':
			
 
				-            self.lr_scheduler.step()
			
 
				+        warmup_iters = cfg.warmup_epoch * len(self.train_loader)
			
 
				+        self.lr_scheduler_warmup = LinearWarmUpLrScheduler(warmup_iters, cfg.base_lr, cfg.warmup_bias_lr, cfg.warmup_momentum)
			
 
				+        self.lr_scheduler = build_lr_scheduler(cfg, self.optimizer, args.resume)
			
 
				 
			
 
				     def train(self, model):
			
 
				         for epoch in range(self.start_epoch, self.cfg.max_epoch):
			
@@ -97,7 +96,8 @@ class YoloTrainer(object):
 
				             self.train_one_epoch(model)
			
 
				 
			
 
				             # LR Schedule
			
 
				-            self.lr_scheduler.step()
			
 
				+            if (epoch + 1) > self.cfg.warmup_epoch:
			
 
				+                self.lr_scheduler.step()
			
 
				 
			
 
				             # eval one epoch
			
 
				             if self.heavy_eval:
			
@@ -146,6 +146,7 @@ class YoloTrainer(object):
 
				                     'model': model_eval.state_dict(),
			
 
				                     'mAP': round(cur_map*100, 1),
			
 
				                     'optimizer':  self.optimizer.state_dict(),
			
 
				+                    'lr_scheduler': self.lr_scheduler.state_dict(),
			
 
				                     'epoch': self.epoch,
			
 
				                     'args': self.args,
			
 
				                     }
			
@@ -177,14 +178,11 @@ class YoloTrainer(object):
 
				         for iter_i, (images, targets) in enumerate(metric_logger.log_every(self.train_loader, print_freq, header)):
			
 
				             ni = iter_i + self.epoch * epoch_size
			
 
				             # Warmup
			
 
				-            if ni <= nw:
			
 
				-                xi = [0, nw]  # x interp
			
 
				-                for j, x in enumerate(self.optimizer.param_groups):
			
 
				-                    # bias lr falls from 0.1 to lr0, all other lrs rise from 0.0 to lr0
			
 
				-                    x['lr'] = np.interp(
			
 
				-                        ni, xi, [self.cfg.warmup_bias_lr if j == 0 else 0.0, x['initial_lr'] * self.lf(self.epoch)])
			
 
				-                    if 'momentum' in x:
			
 
				-                        x['momentum'] = np.interp(ni, xi, [self.cfg.warmup_momentum, self.cfg.momentum])
			
 
				+            if nw > 0 and ni < nw:
			
 
				+                self.lr_scheduler_warmup(ni, self.optimizer)
			
 
				+            elif ni == nw:
			
 
				+                print("Warmup stage is over.")
			
 
				+                self.lr_scheduler_warmup.set_lr(self.optimizer, self.cfg.base_lr)
			
 
				                                 
			
 
				             # To device
			
 
				             images = images.to(self.device, non_blocking=True).float()
			
@@ -211,21 +209,23 @@ class YoloTrainer(object):
 
				                 loss_dict = self.criterion(outputs=outputs, targets=targets)
			
 
				                 losses = loss_dict['losses']
			
 
				                 loss_dict_reduced = distributed_utils.reduce_dict(loss_dict)
			
 
				+                losses /= self.grad_accumulate
			
 
				 
			
 
				             # Backward
			
 
				             self.scaler.scale(losses).backward()
			
 
				 
			
 
				             # Optimize
			
 
				-            if self.cfg.clip_max_norm > 0:
			
 
				-                self.scaler.unscale_(self.optimizer)
			
 
				-                torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=self.cfg.clip_max_norm)
			
 
				-            self.scaler.step(self.optimizer)
			
 
				-            self.scaler.update()
			
 
				-            self.optimizer.zero_grad()
			
 
				-
			
 
				-            # ModelEMA
			
 
				-            if self.model_ema is not None:
			
 
				-                self.model_ema.update(model)
			
 
				+            if (iter_i + 1) % self.grad_accumulate == 0:
			
 
				+                if self.cfg.clip_max_norm > 0:
			
 
				+                    self.scaler.unscale_(self.optimizer)
			
 
				+                    torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=self.cfg.clip_max_norm)
			
 
				+                self.scaler.step(self.optimizer)
			
 
				+                self.scaler.update()
			
 
				+                self.optimizer.zero_grad()
			
 
				+
			
 
				+                # ModelEMA
			
 
				+                if self.model_ema is not None:
			
 
				+                    self.model_ema.update(model)
			
 
				 
			
 
				             # Update log
			
 
				             metric_logger.update(**loss_dict_reduced)
			
@@ -272,7 +272,7 @@ class YoloTrainer(object):
 
				                 # refine tgt
			
 
				                 tgt_boxes_wh = boxes[..., 2:] - boxes[..., :2]
			
 
				                 min_tgt_size = torch.min(tgt_boxes_wh, dim=-1)[0]
			
 
				-                keep = (min_tgt_size >= 8)
			
 
				+                keep = (min_tgt_size >= 1)
			
 
				 
			
 
				                 tgt["boxes"] = boxes[keep]
			
 
				                 tgt["labels"] = labels[keep]
			
@@ -346,7 +346,8 @@ class RTDetrTrainer(object):
 
				         self.scaler = torch.cuda.amp.GradScaler(enabled=args.fp16)
			
 
				 
			
 
				         # ---------------------------- Build Optimizer ----------------------------
			
 
				-        cfg.base_lr = cfg.per_image_lr * args.batch_size
			
 
				+        self.grad_accumulate = max(16 // args.batch_size, 1)
			
 
				+        cfg.base_lr = cfg.per_image_lr * args.batch_size * self.grad_accumulate
			
 
				         cfg.min_lr  = cfg.base_lr * cfg.min_lr_ratio
			
 
				         self.optimizer, self.start_epoch = build_rtdetr_optimizer(cfg, model, args.resume)
			
 
				 
			
@@ -480,22 +481,24 @@ class RTDetrTrainer(object):
 
				                 outputs = model(images, targets)    
			
 
				                 loss_dict = self.criterion(outputs, targets)
			
 
				                 losses = sum(loss_dict.values())
			
 
				+                losses /= self.grad_accumulate
			
 
				                 loss_dict_reduced = distributed_utils.reduce_dict(loss_dict)
			
 
				 
			
 
				             # Backward
			
 
				             self.scaler.scale(losses).backward()
			
 
				 
			
 
				             # Optimize
			
 
				-            if self.cfg.clip_max_norm > 0:
			
 
				-                self.scaler.unscale_(self.optimizer)
			
 
				-                torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=self.cfg.clip_max_norm)
			
 
				-            self.scaler.step(self.optimizer)
			
 
				-            self.scaler.update()
			
 
				-            self.optimizer.zero_grad()
			
 
				-
			
 
				-            # ModelEMA
			
 
				-            if self.model_ema is not None:
			
 
				-                self.model_ema.update(model)
			
 
				+            if (iter_i + 1) % self.grad_accumulate == 0:
			
 
				+                if self.cfg.clip_max_norm > 0:
			
 
				+                    self.scaler.unscale_(self.optimizer)
			
 
				+                    torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=self.cfg.clip_max_norm)
			
 
				+                self.scaler.step(self.optimizer)
			
 
				+                self.scaler.update()
			
 
				+                self.optimizer.zero_grad()
			
 
				+
			
 
				+                # ModelEMA
			
 
				+                if self.model_ema is not None:
			
 
				+                    self.model_ema.update(model)
			
 
				 
			
 
				             # Update log
			
 
				             metric_logger.update(**loss_dict_reduced)
			
@@ -538,5 +541,4 @@ def build_trainer(args, cfg, device, model, model_ema, criterion, train_transfor
 
				     elif cfg.trainer == 'rtdetr':
			
 
				         return RTDetrTrainer(args, cfg, device, model, model_ema, criterion, train_transform, val_transform, dataset, train_loader, evaluator)
			
 
				     else:
			
 
				-        raise NotImplementedError(cfg.trainer)
			
 
				-    
			
 
				+        raise NotImplementedError(cfg.trainer)
			
--- a/yolo/utils/solver/lr_scheduler.py
+++ b/yolo/utils/solver/lr_scheduler.py
@@ -1,5 +1,4 @@
 
				 import numpy as np
			
 
				-import math
			
 
				 import torch
			
 
				 
			
 
				 
			
@@ -31,7 +30,8 @@ def build_lr_scheduler(cfg, optimizer, resume=None):
 
				     print('LR Scheduler: {}'.format(cfg.lr_scheduler))
			
 
				 
			
 
				     if cfg.lr_scheduler == "step":
			
 
				-        lr_scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer, milestones=cfg.lr_step, gamma=0.1)
			
 
				+        lr_step = [cfg.max_epoch // 3, cfg.max_epoch // 3 * 2]
			
 
				+        lr_scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer, milestones=lr_step, gamma=0.1)
			
 
				     elif cfg.lr_scheduler == "cosine":
			
 
				         lr_scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=cfg.max_epoch - cfg.warmup_epoch - 1, eta_min=cfg.min_lr)
			
 
				     else:
			
@@ -45,22 +45,4 @@ def build_lr_scheduler(cfg, optimizer, resume=None):
 
				             checkpoint_state_dict = checkpoint.pop("lr_scheduler")
			
 
				             lr_scheduler.load_state_dict(checkpoint_state_dict)
			
 
				 
			
 
				-    return lr_scheduler
			
 
				-
			
 
				-def build_lambda_lr_scheduler(cfg, optimizer, epochs):
			
 
				-    """Build learning rate scheduler from cfg file."""
			
 
				-    print('==============================')
			
 
				-    print('Lr Scheduler: {}'.format(cfg.lr_scheduler))
			
 
				-    # Cosine LR scheduler
			
 
				-    if cfg.lr_scheduler == 'cosine':
			
 
				-        lf = lambda x: ((1 - math.cos(x * math.pi / epochs)) / 2) * (cfg.min_lr_ratio - 1) + 1
			
 
				-    # Linear LR scheduler
			
 
				-    elif cfg.lr_scheduler == 'linear':
			
 
				-        lf = lambda x: (1 - x / epochs) * (1.0 - cfg.min_lr_ratio) + cfg.min_lr_ratio
			
 
				-
			
 
				-    else:
			
 
				-        print('unknown lr scheduler.')
			
 
				-        exit(0)
			
 
				-    scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda=lf)
			
 
				-
			
 
				-    return scheduler, lf
			
 
				+    return lr_scheduler