1 năm trước cách đây · 2f1e472c24
--- a/yolo/config/yolov3_config.py
+++ b/yolo/config/yolov3_config.py
@@ -87,7 +87,7 @@ class Yolov3BaseConfig(object):
 
															         # ---------------- Lr Scheduler config ----------------
														
 
															         self.warmup_epoch = 3
														
 
															-        self.lr_scheduler = "linear"
														
 
															+        self.lr_scheduler = "cosine"
														
 
															         self.max_epoch    = 300
														
 
															         self.eval_epoch   = 10
														
 
															         self.no_aug_epoch = 20
														
--- a/yolo/config/yolov5_af_config.py
+++ b/yolo/config/yolov5_af_config.py
@@ -85,7 +85,7 @@ class Yolov5AFBaseConfig(object):
 
															         # ---------------- Lr Scheduler config ----------------
														
 
															         self.warmup_epoch = 3
														
 
															-        self.lr_scheduler = "linear"
														
 
															+        self.lr_scheduler = "cosine"
														
 
															         self.max_epoch    = 300
														
 
															         self.eval_epoch   = 10
														
 
															         self.no_aug_epoch = 20
														
--- a/yolo/config/yolov5_config.py
+++ b/yolo/config/yolov5_config.py
@@ -87,7 +87,7 @@ class Yolov5BaseConfig(object):
 
															         # ---------------- Lr Scheduler config ----------------
														
 
															         self.warmup_epoch = 3
														
 
															-        self.lr_scheduler = "linear"
														
 
															+        self.lr_scheduler = "cosine"
														
 
															         self.max_epoch    = 300
														
 
															         self.eval_epoch   = 10
														
 
															         self.no_aug_epoch = 20
														
--- a/yolo/config/yolov7_af_config.py
+++ b/yolo/config/yolov7_af_config.py
@@ -81,7 +81,7 @@ class Yolov7AFBaseConfig(object):
 
															         # ---------------- Lr Scheduler config ----------------
														
 
															         self.warmup_epoch = 3
														
 
															-        self.lr_scheduler = "linear"
														
 
															+        self.lr_scheduler = "cosine"
														
 
															         self.max_epoch    = 300
														
 
															         self.eval_epoch   = 10
														
 
															         self.no_aug_epoch = 20
														
--- a/yolo/engine.py
+++ b/yolo/engine.py
@@ -2,7 +2,6 @@ import torch
 
															 import torch.distributed as dist
														
 
															 import os
														
 
															-import numpy as np
														
 
															 import random
														
 
															 # ----------------- Extra Components -----------------
														
@@ -12,7 +11,7 @@ from utils.vis_tools import vis_data
 
															 # ----------------- Optimizer & LrScheduler Components -----------------
														
 
															 from utils.solver.optimizer import build_yolo_optimizer, build_rtdetr_optimizer
														
 
															-from utils.solver.lr_scheduler import LinearWarmUpLrScheduler, build_lr_scheduler, build_lambda_lr_scheduler
														
 
															+from utils.solver.lr_scheduler import LinearWarmUpLrScheduler, build_lr_scheduler
														
 
															 class YoloTrainer(object):
														
@@ -63,15 +62,15 @@ class YoloTrainer(object):
 
															         self.scaler = torch.cuda.amp.GradScaler(enabled=args.fp16)
														
 
															         # ---------------------------- Build Optimizer ----------------------------
														
 
															-        cfg.base_lr = cfg.per_image_lr * args.batch_size
														
 
															+        self.grad_accumulate = max(64 // args.batch_size, 1)
														
 
															+        cfg.base_lr = cfg.per_image_lr * args.batch_size * self.grad_accumulate
														
 
															         cfg.min_lr  = cfg.base_lr * cfg.min_lr_ratio
														
 
															         self.optimizer, self.start_epoch = build_yolo_optimizer(cfg, model, args.resume)
														
 
															         # ---------------------------- Build LR Scheduler ----------------------------
														
 
															-        self.lr_scheduler, self.lf = build_lambda_lr_scheduler(cfg, self.optimizer, cfg.max_epoch)
														
 
															-        self.lr_scheduler.last_epoch = self.start_epoch - 1  # do not move
														
 
															-        if self.args.resume and self.args.resume != 'None':
														
 
															-            self.lr_scheduler.step()
														
 
															+        warmup_iters = cfg.warmup_epoch * len(self.train_loader)
														
 
															+        self.lr_scheduler_warmup = LinearWarmUpLrScheduler(warmup_iters, cfg.base_lr, cfg.warmup_bias_lr, cfg.warmup_momentum)
														
 
															+        self.lr_scheduler = build_lr_scheduler(cfg, self.optimizer, args.resume)
														
 
															     def train(self, model):
														
 
															         for epoch in range(self.start_epoch, self.cfg.max_epoch):
														
@@ -97,7 +96,8 @@ class YoloTrainer(object):
 
															             self.train_one_epoch(model)
														
 
															             # LR Schedule
														
 
															-            self.lr_scheduler.step()
														
 
															+            if (epoch + 1) > self.cfg.warmup_epoch:
														
 
															+                self.lr_scheduler.step()
														
 
															             # eval one epoch
														
 
															             if self.heavy_eval:
														
@@ -146,6 +146,7 @@ class YoloTrainer(object):
 
															                     'model': model_eval.state_dict(),
														
 
															                     'mAP': round(cur_map*100, 1),
														
 
															                     'optimizer':  self.optimizer.state_dict(),
														
 
															+                    'lr_scheduler': self.lr_scheduler.state_dict(),
														
 
															                     'epoch': self.epoch,
														
 
															                     'args': self.args,
														
 
															                     }
														
@@ -177,14 +178,11 @@ class YoloTrainer(object):
 
															         for iter_i, (images, targets) in enumerate(metric_logger.log_every(self.train_loader, print_freq, header)):
														
 
															             ni = iter_i + self.epoch * epoch_size
														
 
															             # Warmup
														
 
															-            if ni <= nw:
														
 
															-                xi = [0, nw]  # x interp
														
 
															-                for j, x in enumerate(self.optimizer.param_groups):
														
 
															-                    # bias lr falls from 0.1 to lr0, all other lrs rise from 0.0 to lr0
														
 
															-                    x['lr'] = np.interp(
														
 
															-                        ni, xi, [self.cfg.warmup_bias_lr if j == 0 else 0.0, x['initial_lr'] * self.lf(self.epoch)])
														
 
															-                    if 'momentum' in x:
														
 
															-                        x['momentum'] = np.interp(ni, xi, [self.cfg.warmup_momentum, self.cfg.momentum])
														
 
															+            if nw > 0 and ni < nw:
														
 
															+                self.lr_scheduler_warmup(ni, self.optimizer)
														
 
															+            elif ni == nw:
														
 
															+                print("Warmup stage is over.")
														
 
															+                self.lr_scheduler_warmup.set_lr(self.optimizer, self.cfg.base_lr)
														
 
															             # To device
														
 
															             images = images.to(self.device, non_blocking=True).float()
														
@@ -211,21 +209,23 @@ class YoloTrainer(object):
 
															                 loss_dict = self.criterion(outputs=outputs, targets=targets)
														
 
															                 losses = loss_dict['losses']
														
 
															                 loss_dict_reduced = distributed_utils.reduce_dict(loss_dict)
														
 
															+                losses /= self.grad_accumulate
														
 
															             # Backward
														
 
															             self.scaler.scale(losses).backward()
														
 
															             # Optimize
														
 
															-            if self.cfg.clip_max_norm > 0:
														
 
															-                self.scaler.unscale_(self.optimizer)
														
 
															-                torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=self.cfg.clip_max_norm)
														
 
															-            self.scaler.step(self.optimizer)
														
 
															-            self.scaler.update()
														
 
															-            self.optimizer.zero_grad()
														
 
															-
														
 
															-            # ModelEMA
														
 
															-            if self.model_ema is not None:
														
 
															-                self.model_ema.update(model)
														
 
															+            if (iter_i + 1) % self.grad_accumulate == 0:
														
 
															+                if self.cfg.clip_max_norm > 0:
														
 
															+                    self.scaler.unscale_(self.optimizer)
														
 
															+                    torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=self.cfg.clip_max_norm)
														
 
															+                self.scaler.step(self.optimizer)
														
 
															+                self.scaler.update()
														
 
															+                self.optimizer.zero_grad()
														
 
															+
														
 
															+                # ModelEMA
														
 
															+                if self.model_ema is not None:
														
 
															+                    self.model_ema.update(model)
														
 
															             # Update log
														
 
															             metric_logger.update(**loss_dict_reduced)
														
@@ -272,7 +272,7 @@ class YoloTrainer(object):
 
															                 # refine tgt
														
 
															                 tgt_boxes_wh = boxes[..., 2:] - boxes[..., :2]
														
 
															                 min_tgt_size = torch.min(tgt_boxes_wh, dim=-1)[0]
														
 
															-                keep = (min_tgt_size >= 8)
														
 
															+                keep = (min_tgt_size >= 1)
														
 
															                 tgt["boxes"] = boxes[keep]
														
 
															                 tgt["labels"] = labels[keep]
														
@@ -346,7 +346,8 @@ class RTDetrTrainer(object):
 
															         self.scaler = torch.cuda.amp.GradScaler(enabled=args.fp16)
														
 
															         # ---------------------------- Build Optimizer ----------------------------
														
 
															-        cfg.base_lr = cfg.per_image_lr * args.batch_size
														
 
															+        self.grad_accumulate = max(16 // args.batch_size, 1)
														
 
															+        cfg.base_lr = cfg.per_image_lr * args.batch_size * self.grad_accumulate
														
 
															         cfg.min_lr  = cfg.base_lr * cfg.min_lr_ratio
														
 
															         self.optimizer, self.start_epoch = build_rtdetr_optimizer(cfg, model, args.resume)
														
@@ -480,22 +481,24 @@ class RTDetrTrainer(object):
 
															                 outputs = model(images, targets)    
														
 
															                 loss_dict = self.criterion(outputs, targets)
														
 
															                 losses = sum(loss_dict.values())
														
 
															+                losses /= self.grad_accumulate
														
 
															                 loss_dict_reduced = distributed_utils.reduce_dict(loss_dict)
														
 
															             # Backward
														
 
															             self.scaler.scale(losses).backward()
														
 
															             # Optimize
														
 
															-            if self.cfg.clip_max_norm > 0:
														
 
															-                self.scaler.unscale_(self.optimizer)
														
 
															-                torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=self.cfg.clip_max_norm)
														
 
															-            self.scaler.step(self.optimizer)
														
 
															-            self.scaler.update()
														
 
															-            self.optimizer.zero_grad()
														
 
															-
														
 
															-            # ModelEMA
														
 
															-            if self.model_ema is not None:
														
 
															-                self.model_ema.update(model)
														
 
															+            if (iter_i + 1) % self.grad_accumulate == 0:
														
 
															+                if self.cfg.clip_max_norm > 0:
														
 
															+                    self.scaler.unscale_(self.optimizer)
														
 
															+                    torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=self.cfg.clip_max_norm)
														
 
															+                self.scaler.step(self.optimizer)
														
 
															+                self.scaler.update()
														
 
															+                self.optimizer.zero_grad()
														
 
															+
														
 
															+                # ModelEMA
														
 
															+                if self.model_ema is not None:
														
 
															+                    self.model_ema.update(model)
														
 
															             # Update log
														
 
															             metric_logger.update(**loss_dict_reduced)
														
@@ -538,5 +541,4 @@ def build_trainer(args, cfg, device, model, model_ema, criterion, train_transfor
 
															     elif cfg.trainer == 'rtdetr':
														
 
															         return RTDetrTrainer(args, cfg, device, model, model_ema, criterion, train_transform, val_transform, dataset, train_loader, evaluator)
														
 
															     else:
														
 
															-        raise NotImplementedError(cfg.trainer)
														
 
															-    
														
 
															+        raise NotImplementedError(cfg.trainer)
														
--- a/yolo/utils/solver/lr_scheduler.py
+++ b/yolo/utils/solver/lr_scheduler.py
@@ -1,5 +1,4 @@
 
															 import numpy as np
														
 
															-import math
														
 
															 import torch
														
@@ -31,7 +30,8 @@ def build_lr_scheduler(cfg, optimizer, resume=None):
 
															     print('LR Scheduler: {}'.format(cfg.lr_scheduler))
														
 
															     if cfg.lr_scheduler == "step":
														
 
															-        lr_scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer, milestones=cfg.lr_step, gamma=0.1)
														
 
															+        lr_step = [cfg.max_epoch // 3, cfg.max_epoch // 3 * 2]
														
 
															+        lr_scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer, milestones=lr_step, gamma=0.1)
														
 
															     elif cfg.lr_scheduler == "cosine":
														
 
															         lr_scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=cfg.max_epoch - cfg.warmup_epoch - 1, eta_min=cfg.min_lr)
														
 
															     else:
														
@@ -45,22 +45,4 @@ def build_lr_scheduler(cfg, optimizer, resume=None):
 
															             checkpoint_state_dict = checkpoint.pop("lr_scheduler")
														
 
															             lr_scheduler.load_state_dict(checkpoint_state_dict)
														
 
															-    return lr_scheduler
														
 
															-
														
 
															-def build_lambda_lr_scheduler(cfg, optimizer, epochs):
														
 
															-    """Build learning rate scheduler from cfg file."""
														
 
															-    print('==============================')
														
 
															-    print('Lr Scheduler: {}'.format(cfg.lr_scheduler))
														
 
															-    # Cosine LR scheduler
														
 
															-    if cfg.lr_scheduler == 'cosine':
														
 
															-        lf = lambda x: ((1 - math.cos(x * math.pi / epochs)) / 2) * (cfg.min_lr_ratio - 1) + 1
														
 
															-    # Linear LR scheduler
														
 
															-    elif cfg.lr_scheduler == 'linear':
														
 
															-        lf = lambda x: (1 - x / epochs) * (1.0 - cfg.min_lr_ratio) + cfg.min_lr_ratio
														
 
															-
														
 
															-    else:
														
 
															-        print('unknown lr scheduler.')
														
 
															-        exit(0)
														
 
															-    scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda=lf)
														
 
															-
														
 
															-    return scheduler, lf
														
 
															+    return lr_scheduler