Explorar o código

debug DDP train

yjh0410 %!s(int64=2) %!d(string=hai) anos
pai
achega
792375d99a
Modificáronse 1 ficheiros con 6 adicións e 6 borrados
  1. 6 6
      train_ddp.sh

+ 6 - 6
train_ddp.sh

@@ -1,14 +1,14 @@
 # train YOLO with 8 GPUs
-# 使用8张GPU来训练YOLO
-python -m torch.distributed.run --nproc_per_node=8 train.py \
+# 使用4张GPU来训练YOLO
+python -m torch.distributed.run --nproc_per_node=4 train.py \
                                                     --cuda \
                                                     -dist \
-                                                    -d coco \
+                                                    -d voc \
                                                     --root /data/datasets/ \
-                                                    -m yolov5_l \
-                                                    -bs 128 \
+                                                    -m yolovx_n \
+                                                    -bs 64 \
                                                     -size 640 \
-                                                    --wp_epoch 1 \
+                                                    --wp_epoch 3 \
                                                     --max_epoch 300 \
                                                     --eval_epoch 10 \
                                                     --ema \