python source code of segmentation

gluon-cv-master
- Makefile
- .gitmodules
- LICENSE
- setup.py
- README.md
- tests
  - lint.py
  - unittests
    - test_data_dataloader.py
    - test_utils_bbox.py
    - test_utils_parallel.py
    - test_model_zoo.py
    - test_data_datasets.py
    - common.py
    - test_data_transforms.py
    - test_utils_segmentation.py
    - test_lr_scheduler.py
    - test_utils_block.py
    - test_nn.py
    - test_utils_export.py
    - test_utils_viz.py
    - test_utils_metric.py
  - py3.yml
  - pylint.yml
  - pylintrc
  - py2.yml
- scripts
  - action-recognition
    - train_recognizer.py
    - test_recognizer.py
    - README.md
    - inference.py
    - feat_extract.py
  - datasets
    - kinetics400.py
    - ade20k.py
    - hmdb51.py
    - lsun.py
    - mscoco.py
    - ucf101.py
    - ilsvrc_vid.py
    - coco_tracking.py
    - ilsvrc_det.py
    - cityscapes.py
    - README.md
    - somethingsomethingv2.py
    - pascal_voc.py
    - market1501.py
    - mhp_v1.py
    - imagenet.py
  - instance
    - mask_rcnn
      - train_mask_rcnn.py
      - demo_mask_rcnn.py
      - README.md
      - eval_mask_rcnn.py
      - benchmark
        README.md
        ompi_bind_DGX1.sh
    - README.md
  - segmentation
    - train.py
    - README.md
    - test.py
  - detection
    - center_net
      - demo_center_net.py
      - train_center_net.py
      - eval_center_net.py
    - faster_rcnn
      - eval_faster_rcnn.py
      - README.md
      - demo_faster_rcnn.py
      - train_faster_rcnn.py
    - yolo
      - eval_yolo.py
      - train_yolo3.py
      - README.md
      - demo_yolo.py
    - demo_webcam_run.py
    - README.md
    - ssd
      - demo_ssd.py
      - eval_ssd.py
      - README.md
      - train_ssd.py
  - classification
    - cifar
      - train_cifar10.py
      - demo_cifar10.py
      - train_mixup_cifar10.py
      - README.md
    - finetune
      - prepare_minc.py
      - finetune_minc.py
    - imagenet
      - train_imagenet.py
      - verify_pretrained.py
      - train_imagenet_nasnet.py
      - train_horovod.py
      - imagenet_labels.txt
      - README.md
      - demo_imagenet.py
  - re-id
    - baseline
      - networks
        resnet.py
        __init__.py
      - train.py
      - README.md
      - test.py
  - pose
    - simple_pose
      - coco.sh
      - validate.py
      - demo.py
      - validate.sh
      - cam_demo.py
      - README.md
      - train_simple_pose.py
    - alpha_pose
      - coco.sh
      - validate.py
      - demo.py
      - train_alpha_pose.py
      - validate.sh
      - validate_tools.py
      - cam_demo.py
      - coco_dpg.sh
  - deployment
    - cpp-inference
      - src
        detect.cpp
        common.hpp
      - CMakeLists.txt
      - README.md
      - .gitignore
    - export
      - README.md
      - export_pretrained.py
      - .gitignore
    - README.md
  - gan
    - srgan
      - demo_srgan.py
      - download_dataset.py
      - __init__.py
      - README.md
      - train_srgan.py
    - wgan
      - lsun.py
      - train_wgan.py
      - README.md
    - cycle_gan
      - train_cgan.py
      - download_dataset.py
      - README.md
      - demo_cycle_gan.py
  - README.md
  - tracking
    - demo.py
    - train.py
    - test.py
    - benchmark.py
- gluoncv
  - utils
    - lr_scheduler.py
    - viz
      - keypoints.py
      - image.py
      - mask.py
      - bbox.py
      - __init__.py
      - segmentation.py
      - network.py
    - download.py
    - filesystem.py
    - compress_json.py
    - version.py
    - random.py
    - block.py
    - bbox.py
    - data
      - tracking.py
    - export_helper.py
    - __init__.py
    - metrics
      - heatmap_accuracy.py
      - coco_keypoints.py
      - coco_detection.py
      - tracking.py
      - accuracy.py
      - voc_detection.py
      - __init__.py
      - rcnn.py
      - segmentation.py
      - coco_instance.py
    - plot_history.py
    - parallel.py
    - transforms.py
    - sync_loader_helper.py
  - loss.py
  - nn
    - predictor.py
    - dropblock.py
    - sampler.py
    - block.py
    - coder.py
    - cython_bbox.pyx
    - gn.py
    - bbox.py
    - matcher.py
    - __init__.py
    - splat.py
    - feature.py
  - data
    - market1501
      - data_read.py
      - label_read.py
      - __init__.py
    - mixup
      - detection.py
      - __init__.py
    - pascal_voc
      - detection.py
      - __init__.py
      - segmentation.py
    - sampler.py
    - mscoco
      - keypoints.py
      - detection.py
      - instance.py
      - __init__.py
      - utils.py
      - segmentation.py
    - visdrone
      - detection.py
      - __init__.py
    - segbase.py
    - pascal_aug
      - __init__.py
      - segmentation.py
    - video_custom
      - classification.py
      - __init__.py
    - recordio
      - detection.py
      - __init__.py
    - somethingsomethingv2
      - classification.py
      - __init__.py
    - dataloader.py
    - hmdb51
      - classification.py
      - __init__.py
    - mhp.py
    - batchify.py
    - cityscapes.py
    - otb
      - tracking.py
      - __init__.py
    - __init__.py
    - ade20k
      - __init__.py
      - segmentation.py
    - ucf101
      - classification.py
      - __init__.py
    - lst
      - detection.py
      - __init__.py
    - tracking_data
      - __init__.py
      - track.py
    - imagenet
      - classification.py
      - __init__.py
    - transforms
      - image.py
      - presets
        simple_pose.py
        yolo.py
        __init__.py
        rcnn.py
        center_net.py
        segmentation.py
        imagenet.py
        alpha_pose.py
        ssd.py
      - block.py
      - pose.py
      - mask.py
      - bbox.py
      - video.py
      - __init__.py
      - experimental
        image.py
        bbox.py
        __init__.py
      - track.py
    - base.py
    - kinetics400
      - classification.py
      - __init__.py
  - __init__.py
  - model_zoo
    - center_net
      - deconv_resnet.py
      - deconv_dla.py
      - duc_mobilenet.py
      - __init__.py
      - target_generator.py
      - center_net.py
    - vgg.py
    - quantized
      - ssd_512_vgg16_atrous_voc_int8-symbol.json
      - mobilenet1.0_int8-symbol.json
      - ssd_300_vgg16_atrous_voc_int8-symbol.json
      - __init__.py
    - resnetv1b.py
    - alexnet.py
    - icnet.py
    - rcnn
      - faster_rcnn
        predefined_models.py
        rcnn_target.py
        data_parallel.py
        faster_rcnn.py
        __init__.py
      - mask_rcnn
        predefined_models.py
        rcnn_target.py
        data_parallel.py
        __init__.py
        mask_rcnn.py
      - __init__.py
      - rcnn.py
      - rpn
        anchor.py
        rpn.py
        rpn_target.py
        bbox_clip.py
        proposal.py
        __init__.py
        cython_rpn_target.pyx
    - fastscnn.py
    - resnest.py
    - mobilenetv3.py
    - pruned_resnet
      - resnet50_v1d_8.8x.json
      - resnetv1b_pruned.py
      - resnet101_v1d_1.9x.json
      - resnet18_v1b_2.6x.json
      - resnet50_v1d_5.9x.json
      - resnet50_v1d_3.6x.json
      - __init__.py
      - resnet50_v1d_1.8x.json
      - resnet101_v1d_2.2x.json
    - mobilenet.py
    - segbase.py
    - fcn.py
    - hrnet.py
    - cifarresnext.py
    - squeezenet.py
    - residual_attentionnet.py
    - deeplabv3_plus.py
    - xception.py
    - se_resnet.py
    - yolo
      - yolo3.py
      - yolo_target.py
      - darknet.py
      - __init__.py
    - pspnet.py
    - attention.py
    - cifarresnet.py
    - resnet.py
    - nasnet.py
    - wideresnet.py
    - siamrpn
      - siam_net.py
      - siam_alexnet.py
      - siamrpn_tracker.py
      - siam_rpn.py
      - __init__.py
    - simple_pose
      - pose_target.py
      - simple_pose_resnet.py
      - __init__.py
      - mobile_pose.py
    - googlenet.py
    - model_zoo.py
    - densenet.py
    - deeplabv3b_plus.py
    - dla.py
    - action_recognition
      - actionrec_inceptionv1.py
      - i3d_inceptionv3.py
      - actionrec_vgg16.py
      - p3d.py
      - i3d_resnet.py
      - c3d.py
      - slowfast.py
      - actionrec_resnetv1b.py
      - i3d_inceptionv1.py
      - __init__.py
      - actionrec_inceptionv3.py
      - r2plus1d.py
      - non_local.py
    - __init__.py
    - model_store.py
    - cifarwideresnet.py
    - danet.py
    - resnext.py
    - deeplabv3.py
    - inception.py
    - alpha_pose
      - __init__.py
      - utils.py
      - fast_pose.py
    - ssd
      - anchor.py
      - resnet_v1b_ssd.py
      - target.py
      - vgg_atrous.py
      - __init__.py
      - presets.py
      - ssd.py
    - senet.py
- .gitignore
- Jenkinsfile
- docs
  - install.rst
  - Makefile
  - slides.md
  - .nojekyll
  - Doxyfile
  - api
    - nn.rst
    - data.transforms.rst
    - data.datasets.rst
    - utils.rst
    - model_zoo.rst
    - loss.rst
    - data.batchify.rst
    - index.rst
  - how_to
    - support.rst
    - contribute.md
    - index.rst
  - build.yml
  - README.txt
  - tutorials
    - datasets
      - kinetics400.py
      - ade20k.py
      - hmdb51.py
      - mscoco.py
      - ucf101.py
      - README.txt
      - detection_custom.py
      - cityscapes.py
      - somethingsomethingv2.py
      - pascal_voc.py
      - mhp_v1.py
      - imagenet.py
      - .gitignore
      - recordio.py
    - instance
      - demo_mask_rcnn.py
      - train_mask_rcnn_coco.py
      - README.txt
      - .gitignore
    - distributed
      - README.txt
      - distributed_slowfast.py
    - segmentation
      - demo_deeplab.py
      - train_fcn.py
      - demo_icnet.py
      - demo_psp.py
      - README.txt
      - demo_fcn.py
      - train_psp.py
      - .gitignore
      - voc_sota.py
    - detection
      - demo_ssd.py
      - skip_fintune.py
      - demo_webcam.py
      - train_yolo_v3.py
      - demo_jetson.py
      - train_ssd_voc.py
      - README.txt
      - demo_center_net.py
      - train_ssd_advanced.py
      - finetune_detection.py
      - demo_faster_rcnn.py
      - demo_yolo.py
      - .gitignore
      - train_faster_rcnn_voc.py
    - classification
      - dive_deep_cifar10.py
      - dive_deep_imagenet.py
      - demo_cifar10.py
      - transfer_learning_minc.py
      - README.txt
      - demo_imagenet.py
    - pose
      - demo_alpha_pose.py
      - dive_deep_simple_pose.py
      - demo_simple_pose.py
      - README.txt
      - cam_demo.py
    - deployment
      - cpp_inference.py
      - export_network.py
      - README.txt
      - int8_inference.py
      - .gitignore
    - action_recognition
      - demo_slowfast_kinetics400.py
      - feat_custom.py
      - demo_i3d_kinetics400.py
      - dive_deep_i3d_kinetics400.py
      - decord_loader.py
      - README.txt
      - dive_deep_slowfast_kinetics400.py
      - finetune_custom.py
      - demo_tsn_ucf101.py
      - dive_deep_tsn_ucf101.py
      - demo_custom.py
    - index.rst
    - tracking
      - demo_SiamRPN.py
      - README.txt
  - contents.rst
  - install
    - install-include.rst
    - install-more.rst
  - conf.py
  - model_zoo
    - pose.rst
    - detection.rst
    - classification.rst
    - action_recognition.rst
    - index.rst
    - segmentation.rst
  - .gitignore
  - _templates
    - layout.html
    - index.html
  - _static
    - install-options.js
    - logos
      - embed.html
    - applications.html
    - gluon-logo.svg
    - hidebib.js
    - apache2.svg
    - google_analytics.js
    - imagenet_banner.jpeg
    - js
      - jquery.min.js
      - slides.min.js
    - gluon.ico
    - css
      - material_icon.css
      - slides.min.css
      - custom.css
    - pose-estimation.svg
    - assets
      - svg
        video-icon.svg
        icons.svg
        video-icon-dark.svg
        play.svg
      - img
        background
- MANIFEST.in

"""MSCOCO Semantic Segmentation pretraining for VOC."""
import os
import pickle
from tqdm import trange
from PIL import Image
import numpy as np

from .utils import try_import_pycocotools
from ..segbase import SegmentationDataset

class COCOSegmentation(SegmentationDataset):
    """COCO Semantic Segmentation Dataset for VOC Pre-training.

    Parameters
    ----------
    root : string
        Path to COCO folder. Default is '$(HOME)/mxnet/datasets/coco'
    split: string
        'train', 'val' or 'test'
    transform : callable, optional
        A function that transforms the image

    Examples
    --------
    >>> from mxnet.gluon.data.vision import transforms
    >>> # Transforms for Normalization
    >>> input_transform = transforms.Compose([
    >>>     transforms.ToTensor(),
    >>>     transforms.Normalize([.485, .456, .406], [.229, .224, .225]),
    >>> ])
    >>> # Create Dataset
    >>> trainset = gluoncv.data.COCOSegmentation(split='train', transform=input_transform)
    >>> # Create Training Loader
    >>> train_data = gluon.data.DataLoader(
    >>>     trainset, 4, shuffle=True, last_batch='rollover',
    >>>     num_workers=4)
    """
    CAT_LIST = [0, 5, 2, 16, 9, 44, 6, 3, 17, 62, 21, 67, 18, 19, 4,
                1, 64, 20, 63, 7, 72]
    NUM_CLASS = 21
    CLASSES = ("background", "airplane", "bicycle", "bird", "boat", "bottle",
               "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse",
               "motorcycle", "person", "potted-plant", "sheep", "sofa", "train",
               "tv")

    def __init__(self, root=os.path.expanduser('~/.mxnet/datasets/coco'),
                 split='train', mode=None, transform=None, **kwargs):
        super(COCOSegmentation, self).__init__(root, split, mode, transform, **kwargs)
        # lazy import pycocotools
        try_import_pycocotools()
        from pycocotools.coco import COCO
        from pycocotools import mask
        if split == 'train':
            print('train set')
            ann_file = os.path.join(root, 'annotations/instances_train2017.json')
            ids_file = os.path.join(root, 'annotations/train_ids.mx')
            self.root = os.path.join(root, 'train2017')
        else:
            print('val set')
            ann_file = os.path.join(root, 'annotations/instances_val2017.json')
            ids_file = os.path.join(root, 'annotations/val_ids.mx')
            self.root = os.path.join(root, 'val2017')
        self.coco = COCO(ann_file)
        self.coco_mask = mask
        if os.path.exists(ids_file):
            with open(ids_file, 'rb') as f:
                self.ids = pickle.load(f)
        else:
            ids = list(self.coco.imgs.keys())
            self.ids = self._preprocess(ids, ids_file)
        self.transform = transform

    def __getitem__(self, index):
        coco = self.coco
        img_id = self.ids[index]
        img_metadata = coco.loadImgs(img_id)[0]
        path = img_metadata['file_name']
        img = Image.open(os.path.join(self.root, path)).convert('RGB')
        cocotarget = coco.loadAnns(coco.getAnnIds(imgIds=img_id))
        mask = Image.fromarray(self._gen_seg_mask(
            cocotarget, img_metadata['height'], img_metadata['width']))
        # synchrosized transform
        if self.mode == 'train':
            img, mask = self._sync_transform(img, mask)
        elif self.mode == 'val':
            img, mask = self._val_sync_transform(img, mask)
        else:
            assert self.mode == 'testval'
            img, mask = self._img_transform(img), self._mask_transform(mask)
        # general resize, normalize and toTensor
        if self.transform is not None:
            img = self.transform(img)
        return img, mask

    def __len__(self):
        return len(self.ids)

    def _gen_seg_mask(self, target, h, w):
        mask = np.zeros((h, w), dtype=np.uint8)
        coco_mask = self.coco_mask
        for instance in target:
            rle = coco_mask.frPyObjects(instance['segmentation'], h, w)
            m = coco_mask.decode(rle)
            cat = instance['category_id']
            if cat in self.CAT_LIST:
                c = self.CAT_LIST.index(cat)
            else:
                continue
            if len(m.shape) < 3:
                mask[:, :] += (mask == 0) * (m * c)
            else:
                mask[:, :] += (mask == 0) * (((np.sum(m, axis=2)) > 0) * c).astype(np.uint8)
        return mask

    def _preprocess(self, ids, ids_file):
        print("Preprocessing mask, this will take a while." + \
              "But don't worry, it only run once for each split.")
        tbar = trange(len(ids))
        new_ids = []
        for i in tbar:
            img_id = ids[i]
            cocotarget = self.coco.loadAnns(self.coco.getAnnIds(imgIds=img_id))
            img_metadata = self.coco.loadImgs(img_id)[0]
            mask = self._gen_seg_mask(cocotarget, img_metadata['height'],
                                      img_metadata['width'])
            # more than 1k pixels
            if (mask > 0).sum() > 1000:
                new_ids.append(img_id)
            tbar.set_description('Doing: {}/{}, got {} qualified images'.\
                format(i, len(ids), len(new_ids)))
        print('Found number of qualified images: ', len(new_ids))
        with open(ids_file, 'wb') as f:
            pickle.dump(new_ids, f)
        return new_ids

    @property
    def classes(self):
        """Category names."""
        return type(self).CLASSES