python source code of train_gl

imgclsmob-master
- convert_models.py
- gluon
  - lr_scheduler.py
  - dataset_utils.py
  - datasets
    - coco_hpe2_dataset.py
    - cityscapes_seg_dataset.py
    - imagenet1k_rec_cls_dataset.py
    - hpatches_mch_dataset.py
    - coco_hpe1_dataset.py
    - svhn_cls_dataset.py
    - voc_seg_dataset.py
    - widerface_det_dataset.py
    - ade20k_seg_dataset.py
    - cifar10_cls_dataset.py
    - dataset_metainfo.py
    - coco_det_dataset.py
    - __init__.py
    - imagenet1k_cls_dataset.py
    - cifar100_cls_dataset.py
    - cub200_2011_cls_dataset.py
    - seg_dataset.py
    - coco_hpe3_dataset.py
    - coco_seg_dataset.py
  - weighted_random_sampler.py
  - losses.py
  - gluoncv2
    - models
      - pyramidnet_cifar.py
      - xdensenet.py
      - vgg.py
      - shakedropresnet_cifar.py
      - proxylessnas_cub.py
      - cbamresnet.py
      - spnasnet.py
      - irevnet.py
      - voca.py
      - seresnet_cub.py
      - crunet.py
      - sparsenet.py
      - alexnet.py
      - pnasnet.py
      - channelnet.py
      - shufflenet.py
      - simpleposemobile_coco.py
      - dpn.py
      - icnet.py
      - lffd.py
      - squeezenext.py
      - mobilenetv3.py
      - mobilenet_cub.py
      - efficientnetedge.py
      - mobilenet.py
      - fcn8sd.py
      - mnasnet.py
      - proxylessnas.py
      - hrnet.py
      - darts.py
      - sknet.py
      - ibndensenet.py
      - mobilenetv2.py
      - squeezenet.py
      - fdmobilenet.py
      - wrn_cifar.py
      - centernet.py
      - resattnet.py
      - xception.py
      - ror_cifar.py
      - octresnet_cifar.py
      - sepreresnet_cifar.py
      - lwopenpose_cmupan.py
      - seresnext.py
      - bninception.py
      - diaresnet_cifar.py
      - inceptionv3.py
      - res2net.py
      - pspnet.py
      - airnext.py
      - densenet_cifar.py
      - igcv3.py
      - resnet_cifar.py
      - bamresnet.py
      - shakeshakeresnet_cifar.py
      - pyramidnet.py
      - darknet.py
      - msdnet.py
      - preresnet_cifar.py
      - fractalnet_cifar.py
      - resnet.py
      - others
        oth_alpha_pose.py
        oth_simple_pose_resnet.py
        oth_icnet.py
        oth_centernet.py
        oth_mobile_pose.py
        __init__.py
        oth_centernet2.py
      - isqrtcovresnet.py
      - nasnet.py
      - octresnet.py
      - xdensenet_cifar.py
      - diracnetv2.py
      - airnet.py
      - sharesnet.py
      - crunetb.py
      - resnet_cub.py
      - diapreresnet_cifar.py
      - selecsls.py
      - resnext_cifar.py
      - superpointnet.py
      - shufflenetv2b.py
      - polynet.py
      - menet.py
      - peleenet.py
      - densenet.py
      - dla.py
      - fishnet.py
      - shufflenetv2.py
      - ghostnet.py
      - efficientnet.py
      - diapreresnet.py
      - common.py
      - ibnresnext.py
      - resnetd.py
      - __init__.py
      - resneta.py
      - espnetv2.py
      - preresnet.py
      - hardnet.py
      - resdropresnet_cifar.py
      - drn.py
      - ibnbresnet.py
      - zfnet.py
      - nin_cifar.py
      - model_store.py
      - fbnet.py
      - mixnet.py
      - darknet53.py
      - ibppose_coco.py
      - simplepose_coco.py
      - fastseresnet.py
      - wrn.py
      - alphapose_coco.py
      - wrn1bit_cifar.py
      - ibnresnet.py
      - seresnet_cifar.py
      - resnext.py
      - ntsnet_cub.py
      - diaresnet.py
      - seresnet.py
      - deeplabv3.py
      - condensenet.py
      - vovnet.py
      - bagnet.py
      - sepreresnet.py
      - inceptionresnetv2.py
      - inceptionv4.py
      - senet.py
      - bisenet.py
      - rir_cifar.py
      - sinet.py
    - model_provider.py
    - __init__.py
  - setup.py
  - setup.cfg
  - __init__.py
  - README.md
  - utils.py
  - metrics
    - hpe_metrics.py
    - seg_metrics_nd.py
    - det_metrics.py
    - __init__.py
    - seg_metrics.py
    - cls_metrics.py
    - seg_metrics_np.py
  - LICENSE.txt
  - model_stats.py
- eval_ch.py
- examples
  - convert_tf2_to_tfl.py
  - demo_gl.py
  - demo_tf2.py
  - demo_pt.py
- eval_ke.py
- train_tf.py
- LICENSE
- common
  - logger_utils.py
  - train_log_param_saver.py
  - __init__.py
  - env_stats.py
- deploy
  - bootstrap_eval.sh
  - bootstrap_train_gl.sh
  - Dockerfile
- tensorflow_
  - setup.py
  - tensorflowcv
    - models
      - vgg.py
      - alexnet.py
      - channelnet.py
      - shufflenet.py
      - squeezenext.py
      - mobilenetv3.py
      - mobilenet.py
      - mnasnet.py
      - mobilenetv2.py
      - squeezenet.py
      - seresnext.py
      - igcv3.py
      - darknet.py
      - resnet.py
      - others
        __init__.py
      - shufflenetv2b.py
      - menet.py
      - densenet.py
      - shufflenetv2.py
      - common.py
      - __init__.py
      - preresnet.py
      - zfnet.py
      - model_store.py
      - darknet53.py
      - resnext.py
      - seresnet.py
      - sepreresnet.py
      - senet.py
    - model_provider.py
    - __init__.py
  - setup.cfg
  - __init__.py
  - README.md
  - utils.py
  - LICENSE.txt
  - utils_tp.py
- sotabench.py
- eval_gl_det.py
- pytorch
  - dataset_utils.py
  - datasets
    - coco_hpe2_dataset.py
    - cityscapes_seg_dataset.py
    - mpii_hpe_dataset.py
    - hpatches_mch_dataset.py
    - coco_hpe1_dataset.py
    - svhn_cls_dataset.py
    - voc_seg_dataset.py
    - ade20k_seg_dataset.py
    - cifar10_cls_dataset.py
    - dataset_metainfo.py
    - coco_det_dataset.py
    - __init__.py
    - imagenet1k_cls_dataset.py
    - cifar100_cls_dataset.py
    - cub200_2011_cls_dataset.py
    - hpe_dataset.py
    - seg_dataset.py
    - coco_hpe3_dataset.py
    - coco_seg_dataset.py
  - setup.py
  - pytorchcv
    - models
      - pyramidnet_cifar.py
      - prnet.py
      - xdensenet.py
      - vgg.py
      - shakedropresnet_cifar.py
      - proxylessnas_cub.py
      - cbamresnet.py
      - spnasnet.py
      - irevnet.py
      - voca.py
      - seresnet_cub.py
      - sparsenet.py
      - alexnet.py
      - pnasnet.py
      - channelnet.py
      - shufflenet.py
      - simpleposemobile_coco.py
      - dpn.py
      - icnet.py
      - lffd.py
      - squeezenext.py
      - mobilenetv3.py
      - mobilenet_cub.py
      - efficientnetedge.py
      - mobilenet.py
      - fcn8sd.py
      - mnasnet.py
      - proxylessnas.py
      - hrnet.py
      - darts.py
      - sknet.py
      - ibndensenet.py
      - mobilenetv2.py
      - squeezenet.py
      - fdmobilenet.py
      - wrn_cifar.py
      - centernet.py
      - resattnet.py
      - xception.py
      - ror_cifar.py
      - msdnet_cifar10.py
      - sepreresnet_cifar.py
      - lwopenpose_cmupan.py
      - seresnext.py
      - bninception.py
      - diaresnet_cifar.py
      - inceptionv3.py
      - pspnet.py
      - airnext.py
      - densenet_cifar.py
      - igcv3.py
      - resnet_cifar.py
      - bamresnet.py
      - shakeshakeresnet_cifar.py
      - pyramidnet.py
      - darknet.py
      - msdnet.py
      - preresnet_cifar.py
      - fractalnet_cifar.py
      - resnet.py
      - others
        oth_lffd.py
        oth_sinet.py
        oth_ibppose.py
        oth_bisenet1.py
        oth_lwopenpose2d.py
        oth_naivenet.py
        oth_lwopenpose3d.py
        __init__.py
        oth_lffd25.py
        oth_pose_resnet.py
        oth_prnet.py
        oth_ibppose1.py
      - isqrtcovresnet.py
      - nasnet.py
      - octresnet.py
      - xdensenet_cifar.py
      - diracnetv2.py
      - airnet.py
      - sharesnet.py
      - resnet_cub.py
      - diapreresnet_cifar.py
      - selecsls.py
      - resnext_cifar.py
      - superpointnet.py
      - shufflenetv2b.py
      - polynet.py
      - menet.py
      - peleenet.py
      - densenet.py
      - dla.py
      - fishnet.py
      - shufflenetv2.py
      - ghostnet.py
      - efficientnet.py
      - diapreresnet.py
      - common.py
      - ibnresnext.py
      - resnetd.py
      - __init__.py
      - resneta.py
      - espnetv2.py
      - preresnet.py
      - hardnet.py
      - resdropresnet_cifar.py
      - drn.py
      - ibnbresnet.py
      - zfnet.py
      - nin_cifar.py
      - model_store.py
      - fbnet.py
      - mixnet.py
      - darknet53.py
      - ibppose_coco.py
      - simplepose_coco.py
      - fastseresnet.py
      - wrn.py
      - alphapose_coco.py
      - revnet.py
      - wrn1bit_cifar.py
      - ibnresnet.py
      - seresnet_cifar.py
      - resnext.py
      - ntsnet_cub.py
      - diaresnet.py
      - seresnet.py
      - deeplabv3.py
      - condensenet.py
      - vovnet.py
      - bagnet.py
      - sepreresnet.py
      - inceptionresnetv2.py
      - inceptionv4.py
      - senet.py
      - bisenet.py
      - rir_cifar.py
      - sinet.py
    - model_provider.py
    - __init__.py
  - setup.cfg
  - __init__.py
  - README.md
  - utils.py
  - metrics
    - hpe_metrics.py
    - metric.py
    - ret_metrics.py
    - det_metrics.py
    - __init__.py
    - seg_metrics.py
    - cls_metrics.py
    - seg_metrics_np.py
  - LICENSE.txt
  - model_stats.py
- eval_tf2.py
- train_tf2.py
- eval_gl.py
- train_ch.py
- train_pt.py
- train_gl.py
- chainer_
  - dataset_utils.py
  - chainercv2
    - models
      - pyramidnet_cifar.py
      - xdensenet.py
      - vgg.py
      - shakedropresnet_cifar.py
      - proxylessnas_cub.py
      - cbamresnet.py
      - spnasnet.py
      - irevnet.py
      - voca.py
      - seresnet_cub.py
      - sparsenet.py
      - alexnet.py
      - pnasnet.py
      - channelnet.py
      - shufflenet.py
      - simpleposemobile_coco.py
      - dpn.py
      - icnet.py
      - lffd.py
      - squeezenext.py
      - mobilenetv3.py
      - mobilenet_cub.py
      - efficientnetedge.py
      - mobilenet.py
      - fcn8sd.py
      - mnasnet.py
      - proxylessnas.py
      - hrnet.py
      - darts.py
      - sknet.py
      - mobilenetv2.py
      - squeezenet.py
      - fdmobilenet.py
      - wrn_cifar.py
      - centernet.py
      - resattnet.py
      - xception.py
      - ror_cifar.py
      - sepreresnet_cifar.py
      - lwopenpose_cmupan.py
      - seresnext.py
      - bninception.py
      - diaresnet_cifar.py
      - inceptionv3.py
      - pspnet.py
      - airnext.py
      - densenet_cifar.py
      - igcv3.py
      - resnet_cifar.py
      - bamresnet.py
      - shakeshakeresnet_cifar.py
      - pyramidnet.py
      - darknet.py
      - preresnet_cifar.py
      - resnet.py
      - others
        __init__.py
      - nasnet.py
      - octresnet.py
      - xdensenet_cifar.py
      - diracnetv2.py
      - airnet.py
      - sharesnet.py
      - resnet_cub.py
      - diapreresnet_cifar.py
      - selecsls.py
      - resnext_cifar.py
      - shufflenetv2b.py
      - polynet.py
      - menet.py
      - peleenet.py
      - densenet.py
      - dla.py
      - fishnet.py
      - shufflenetv2.py
      - ghostnet.py
      - efficientnet.py
      - diapreresnet.py
      - common.py
      - resnetd.py
      - __init__.py
      - resneta.py
      - espnetv2.py
      - preresnet.py
      - hardnet.py
      - resdropresnet_cifar.py
      - drn.py
      - zfnet.py
      - nin_cifar.py
      - model_store.py
      - fbnet.py
      - mixnet.py
      - darknet53.py
      - ibppose_coco.py
      - simplepose_coco.py
      - fastseresnet.py
      - wrn.py
      - alphapose_coco.py
      - wrn1bit_cifar.py
      - seresnet_cifar.py
      - resnext.py
      - ntsnet_cub.py
      - diaresnet.py
      - seresnet.py
      - deeplabv3.py
      - condensenet.py
      - vovnet.py
      - bagnet.py
      - sepreresnet.py
      - inceptionresnetv2.py
      - inceptionv4.py
      - senet.py
      - bisenet.py
      - rir_cifar.py
      - sinet.py
    - model_provider.py
    - __init__.py
  - datasets
    - coco_hpe2_dataset.py
    - cityscapes_seg_dataset.py
    - coco_hpe1_dataset.py
    - svhn_cls_dataset.py
    - voc_seg_dataset.py
    - ade20k_seg_dataset.py
    - cifar10_cls_dataset.py
    - dataset_metainfo.py
    - __init__.py
    - imagenet1k_cls_dataset.py
    - cifar100_cls_dataset.py
    - cub200_2011_cls_dataset.py
    - seg_dataset.py
    - coco_hpe3_dataset.py
    - coco_seg_dataset.py
  - setup.py
  - setup.cfg
  - __init__.py
  - README.md
  - utils.py
  - metrics
    - hpe_metrics.py
    - metric.py
    - det_metrics.py
    - __init__.py
    - seg_metrics.py
    - cls_metrics.py
    - seg_metrics_np.py
  - LICENSE.txt
- train_ke.py
- __init__.py
- eval_pt.py
- .travis.yml
- README.md
- tests
  - convert_gl2pt_dense.py
  - convert_gl2tf2_conv2d_b.py
  - convert_gl2tf2_conv2d.py
  - convert_gl2tf_conv2d.py
  - convert_gl2tf_batchnorm.py
  - convert_gl2tf_dwconv2d.py
  - convert_gl2tf_dense.py
  - convert_gl2tf_conv1x1.py
  - convert_gl2tf2_batchnorm.py
  - __init__.py
  - convert_gl2pt_batchnorm.py
  - convert_gl2tf_avgpool2d.py
  - convert_gl2tf2_dwconv2d.py
  - convert_gl2pt_conv2d.py
  - convert_gl2tf2_avgpool2d.py
  - convert_gl2tf_maxpool2d.py
  - convert_gl2tf_gconv2d.py
- requirements.txt
- keras_
  - setup.py
  - setup.cfg
  - __init__.py
  - README.md
  - utils.py
  - LICENSE.txt
  - kerascv
    - models
      - vgg.py
      - alexnet.py
      - shufflenet.py
      - squeezenext.py
      - mobilenetv3.py
      - mobilenet.py
      - mnasnet.py
      - mobilenetv2.py
      - squeezenet.py
      - seresnext.py
      - igcv3.py
      - darknet.py
      - resnet.py
      - others
        __init__.py
      - shufflenetv2b.py
      - menet.py
      - densenet.py
      - shufflenetv2.py
      - efficientnet.py
      - common.py
      - __init__.py
      - preresnet.py
      - zfnet.py
      - model_store.py
      - darknet53.py
      - resnext.py
      - seresnet.py
      - sepreresnet.py
      - senet.py
    - model_provider.py
    - __init__.py
- .gitignore
- tensorflow2
  - dataset_utils.py
  - datasets
    - coco_hpe2_dataset.py
    - cityscapes_seg_dataset.py
    - coco_hpe1_dataset.py
    - svhn_cls_dataset.py
    - voc_seg_dataset.py
    - ade20k_seg_dataset.py
    - cifar10_cls_dataset.py
    - cls_dataset.py
    - dataset_metainfo.py
    - __init__.py
    - imagenet1k_cls_dataset.py
    - cifar100_cls_dataset.py
    - cub200_2011_cls_dataset.py
    - seg_dataset.py
    - coco_hpe3_dataset.py
    - coco_seg_dataset.py
  - tf2cv
    - models
      - pyramidnet_cifar.py
      - vgg.py
      - proxylessnas_cub.py
      - cbamresnet.py
      - spnasnet.py
      - voca.py
      - seresnet_cub.py
      - alexnet.py
      - pnasnet.py
      - shufflenet.py
      - simpleposemobile_coco.py
      - dpn.py
      - icnet.py
      - lffd.py
      - squeezenext.py
      - mobilenetv3.py
      - mobilenet_cub.py
      - efficientnetedge.py
      - mobilenet.py
      - fcn8sd.py
      - mnasnet.py
      - proxylessnas.py
      - hrnet.py
      - sknet.py
      - ibndensenet.py
      - mobilenetv2.py
      - squeezenet.py
      - fdmobilenet.py
      - wrn_cifar.py
      - centernet.py
      - xception.py
      - sepreresnet_cifar.py
      - lwopenpose_cmupan.py
      - seresnext.py
      - bninception.py
      - inceptionv3.py
      - pspnet.py
      - airnext.py
      - densenet_cifar.py
      - igcv3.py
      - resnet_cifar.py
      - bamresnet.py
      - pyramidnet.py
      - darknet.py
      - preresnet_cifar.py
      - resnet.py
      - nasnet.py
      - diracnetv2.py
      - airnet.py
      - resnet_cub.py
      - selecsls.py
      - resnext_cifar.py
      - shufflenetv2b.py
      - polynet.py
      - menet.py
      - peleenet.py
      - densenet.py
      - dla.py
      - shufflenetv2.py
      - ghostnet.py
      - efficientnet.py
      - common.py
      - ibnresnext.py
      - resnetd.py
      - __init__.py
      - resneta.py
      - espnetv2.py
      - preresnet.py
      - hardnet.py
      - drn.py
      - ibnbresnet.py
      - zfnet.py
      - model_store.py
      - fbnet.py
      - mixnet.py
      - darknet53.py
      - ibppose_coco.py
      - simplepose_coco.py
      - fastseresnet.py
      - wrn.py
      - alphapose_coco.py
      - ibnresnet.py
      - seresnet_cifar.py
      - resnext.py
      - seresnet.py
      - grmiposelite_coco.py
      - deeplabv3.py
      - vovnet.py
      - bagnet.py
      - sepreresnet.py
      - inceptionresnetv2.py
      - inceptionv4.py
      - senet.py
      - bisenet.py
      - sinet.py
    - model_provider.py
    - __init__.py
  - setup.py
  - setup.cfg
  - __init__.py
  - README.md
  - utils.py
  - metrics
    - hpe_metrics.py
    - metric.py
    - det_metrics.py
    - __init__.py
    - seg_metrics.py
    - cls_metrics.py
    - seg_metrics_np.py
  - LICENSE.txt
- other
  - eval_pt_seg-.py
  - datasets
    - __init__.py
  - gluon
    - khpa
      - train_gl_khpa.py
      - khpa_utils.py
      - eval_gl_khpa.py
      - __init__.py
      - khpa_cls_dataset.py
    - __init__.py
    - seg_utils1.py
  - train_gl_cifar-.py
  - train_pt_cifar-.py
  - train_gl_seg.py
  - eval_gl_seg-.py
  - pytorch
    - cub200_2011_utils1.py
    - imagenet1k1.py
    - __init__.py
    - cifar1.py
    - seg_utils.py
  - eval_pt_mch.py
  - eval_ch_seg-.py
  - chainer_
    - imagenet1k1.py
    - train_ch_in1k.py
    - top_k_accuracy1.py
    - __init__.py
    - train_ch_cifar.py
    - cifar1.py
    - seg_utils1.py
  - __init__.py
  - eval_pt_cub-.py
  - eval_ch_cifar-.py
  - eval_gl_mch.py
  - eval_pt_cifar-.py
  - eval_ch_in1k-.py
- eval_tf.py

import os
import shutil
import argparse
from tqdm import tqdm

import mxnet as mx
from mxnet import gluon, autograd
from mxnet.gluon.data.vision import transforms

import gluoncv
from gluoncv.loss import MixSoftmaxCrossEntropyLoss
from gluoncv.utils import LRScheduler
from gluoncv.model_zoo.segbase import get_segmentation_model, SegEvalModel
from gluoncv.model_zoo import get_model
from gluoncv.utils.parallel import DataParallelModel, DataParallelCriterion
from gluoncv.data import get_segmentation_dataset


def parse_args():
    """Training Options for Segmentation Experiments"""
    parser = argparse.ArgumentParser(description='MXNet Gluon Segmentation')

    parser.add_argument('--model', type=str, default='fcn', help='model name (default: fcn)')
    parser.add_argument('--backbone', type=str, default='resnet50', help='backbone name (default: resnet50)')
    parser.add_argument('--dataset', type=str, default='pascalaug', help='dataset name (default: pascal)')
    parser.add_argument('--dataset-dir', type=str, default='../imgclsmob_data/voc', help='dataset path')
    parser.add_argument('--workers', type=int, default=16, metavar='N', help='dataloader threads')
    parser.add_argument('--base-size', type=int, default=520, help='base image size')
    parser.add_argument('--crop-size', type=int, default=480, help='crop image size')
    parser.add_argument('--train-split', type=str, default='train', help='dataset train split (default: train)')

    parser.add_argument('--aux', action='store_true', default=False, help='Auxiliary loss')
    parser.add_argument('--aux-weight', type=float, default=0.5, help='auxiliary loss weight')
    parser.add_argument('--epochs', type=int, default=50, metavar='N', help='number of epochs to train (default: 50)')
    parser.add_argument('--start_epoch', type=int, default=0, metavar='N', help='start epochs (default:0)')
    parser.add_argument('--batch-size', type=int, default=16, metavar='N',
                        help='input batch size for training (default: 16)')
    parser.add_argument('--test-batch-size', type=int, default=16, metavar='N',
                        help='input batch size for testing (default: 32)')
    parser.add_argument('--lr', type=float, default=1e-3, metavar='LR', help='learning rate (default: 1e-3)')
    parser.add_argument('--momentum', type=float, default=0.9, metavar='M', help='momentum (default: 0.9)')
    parser.add_argument('--weight-decay', type=float, default=1e-4, metavar='M', help='w-decay (default: 1e-4)')
    parser.add_argument('--no-wd', action='store_true',
                        help='whether to remove weight decay on bias, and beta/gamma for batchnorm layers.')

    parser.add_argument('--no-cuda', action='store_true', default=False, help='disables CUDA training')
    parser.add_argument('--ngpus', type=int, default=len(mx.test_utils.list_gpus()), help='number of GPUs (default: 4)')
    parser.add_argument('--kvstore', type=str, default='device', help='kvstore to use for trainer/module.')
    parser.add_argument('--dtype', type=str, default='float32', help='data type for training. default is float32')

    # checking point
    parser.add_argument('--resume', type=str, default=None, help='put the path to resuming file if needed')
    parser.add_argument('--checkname', type=str, default='default', help='set the checkpoint name')
    parser.add_argument('--model-zoo', type=str, default=None, help='evaluating on model zoo model')

    # evaluation only
    parser.add_argument('--eval', action='store_true', default=False, help='evaluation only')
    parser.add_argument('--no-val', action='store_true', default=False, help='skip validation during training')

    # synchronized Batch Normalization
    parser.add_argument('--syncbn', action='store_true', default=False, help='using Synchronized Cross-GPU BatchNorm')

    # the parser
    args = parser.parse_args()
    # handle contexts
    if args.no_cuda:
        print('Using CPU')
        args.kvstore = 'local'
        args.ctx = [mx.cpu(0)]
    else:
        print('Number of GPUs:', args.ngpus)
        args.ctx = [mx.gpu(i) for i in range(args.ngpus)]
    # Synchronized BatchNorm
    args.norm_layer = mx.gluon.contrib.nn.SyncBatchNorm if args.syncbn else mx.gluon.nn.BatchNorm
    args.norm_kwargs = {'num_devices': args.ngpus} if args.syncbn else {}
    print(args)
    return args


class Trainer(object):
    def __init__(self, args):
        self.args = args
        # image transform
        input_transform = transforms.Compose([
            transforms.ToTensor(),
            transforms.Normalize([.485, .456, .406], [.229, .224, .225]),
        ])
        # dataset and dataloader
        data_kwargs = {
            'transform': input_transform,
            'base_size': args.base_size,
            'crop_size': args.crop_size,
            'root': args.dataset_dir}
        trainset = get_segmentation_dataset(
            args.dataset,
            split=args.train_split,
            mode='train',
            **data_kwargs)
        valset = get_segmentation_dataset(
            args.dataset,
            split='val',
            mode='val',
            **data_kwargs)
        self.train_data = gluon.data.DataLoader(
            trainset,
            args.batch_size,
            shuffle=True,
            last_batch='rollover',
            num_workers=args.workers)
        self.eval_data = gluon.data.DataLoader(
            valset,
            args.test_batch_size,
            last_batch='rollover',
            num_workers=args.workers)
        # create network
        if args.model_zoo is not None:
            model = get_model(args.model_zoo, pretrained=True)
        else:
            model = get_segmentation_model(
                model=args.model,
                dataset=args.dataset,
                backbone=args.backbone,
                norm_layer=args.norm_layer,
                norm_kwargs=args.norm_kwargs,
                aux=args.aux,
                crop_size=args.crop_size)
        model.cast(args.dtype)
        print(model)
        self.net = DataParallelModel(model, args.ctx, args.syncbn)
        self.evaluator = DataParallelModel(SegEvalModel(model), args.ctx)
        # resume checkpoint if needed
        if args.resume is not None:
            if os.path.isfile(args.resume):
                model.load_parameters(args.resume, ctx=args.ctx)
            else:
                raise RuntimeError("=> no checkpoint found at '{}'".format(args.resume))
        # create criterion
        criterion = MixSoftmaxCrossEntropyLoss(args.aux, aux_weight=args.aux_weight)
        self.criterion = DataParallelCriterion(criterion, args.ctx, args.syncbn)
        # optimizer and lr scheduling
        self.lr_scheduler = LRScheduler(
            mode='poly',
            base_lr=args.lr,
            nepochs=args.epochs,
            iters_per_epoch=len(self.train_data),
            power=0.9)
        kv = mx.kv.create(args.kvstore)
        optimizer_params = {
            'lr_scheduler': self.lr_scheduler,
            'wd': args.weight_decay,
            'momentum': args.momentum}
        if args.dtype == 'float16':
            optimizer_params['multi_precision'] = True

        if args.no_wd:
            for k, v in self.net.module.collect_params('.*beta|.*gamma|.*bias').items():
                v.wd_mult = 0.0

        self.optimizer = gluon.Trainer(
            self.net.module.collect_params(),
            'sgd',
            optimizer_params,
            kvstore=kv)
        # evaluation metrics
        self.metric = gluoncv.utils.metrics.SegmentationMetric(trainset.num_class)

    def training(self, epoch):
        tbar = tqdm(self.train_data)
        train_loss = 0.0
        for i, (data, target) in enumerate(tbar):
            with autograd.record(True):
                outputs = self.net(data.astype(args.dtype, copy=False))
                losses = self.criterion(outputs, target)
                mx.nd.waitall()
                autograd.backward(losses)
            self.optimizer.step(self.args.batch_size)
            for loss in losses:
                train_loss += loss.asnumpy()[0] / len(losses)
            tbar.set_description('Epoch {}, training loss {}'.format(epoch, train_loss / (i + 1)))
            mx.nd.waitall()

        # save every epoch
        save_checkpoint(self.net.module, self.args, False)

    def validation(self, epoch):
        self.metric.reset()
        tbar = tqdm(self.eval_data)
        for i, (data, target) in enumerate(tbar):
            outputs = self.evaluator(data.astype(args.dtype, copy=False))
            outputs = [x[0] for x in outputs]
            targets = mx.gluon.utils.split_and_load(target, args.ctx, even_split=False)
            self.metric.update(targets, outputs)
            pixAcc, mIoU = self.metric.get()
            tbar.set_description('Epoch {}, validation pixAcc: {}, mIoU: {}'.format(epoch, pixAcc, mIoU))
            mx.nd.waitall()


def save_checkpoint(net, args, is_best=False):
    """Save Checkpoint"""
    directory = "../imgclsmob_data/{}/{}/{}/".format(args.dataset, args.model, args.checkname)
    if not os.path.exists(directory):
        os.makedirs(directory)
    filename = 'checkpoint.params'
    filename = directory + filename
    net.save_parameters(filename)
    if is_best:
        shutil.copyfile(filename, directory + 'model_best.params')


if __name__ == "__main__":
    args = parse_args()
    trainer = Trainer(args)
    if args.eval:
        print('Evaluating model: ', args.resume)
        trainer.validation(args.start_epoch)
    else:
        print('Starting Epoch:', args.start_epoch)
        print('Total Epochs:', args.epochs)
        for epoch in range(args.start_epoch, args.epochs):
            trainer.training(epoch)
            if not trainer.args.no_val:
                trainer.validation(epoch)