python source code of pascal

mmdetection-annotated-master
- hook.py
- LICENSE
- demo.py
- CONTRIBUTING.md
- setup.py
- TECHNICAL_DETAILS.md
- GETTING_STARTED.md
- configs
  - mask_rcnn_r50_caffe_c4_1x.py
  - pascal_voc
    - faster_rcnn_r50_fpn_1x_voc0712.py
    - ssd512_voc.py
    - ssd300_voc.py
  - cascade_mask_rcnn_x101_64x4d_fpn_1x.py
  - grid_rcnn
    - grid_rcnn_gn_head_r50_fpn_2x.py
    - grid_rcnn_gn_head_x101_32x4d_fpn_2x.py
    - README.md
  - gn+ws
    - faster_rcnn_r50_fpn_gn_ws_1x.py
    - mask_rcnn_x101_32x4d_fpn_gn_ws_2x.py
    - mask_rcnn_r50_fpn_gn_ws_2x.py
    - mask_rcnn_r50_fpn_gn_ws_20_23_24e.py
    - README.md
  - hrnet
    - mask_rcnn_hrnetv2p_w18_1x.py
    - cascade_rcnn_hrnetv2p_w32_20e.py
    - faster_rcnn_hrnetv2p_w40_1x.py
    - mask_rcnn_hrnetv2p_w32_1x.py
    - README.md
    - faster_rcnn_hrnetv2p_w18_1x.py
    - faster_rcnn_hrnetv2p_w32_1x.py
  - fcos
    - fcos_r50_caffe_fpn_gn_1x_4gpu.py
    - fcos_mstrain_640_800_x101_64x4d_fpn_gn_2x.py
    - README.md
    - fcos_mstrain_640_800_r101_caffe_fpn_gn_2x_4gpu.py
  - rpn_r101_fpn_1x.py
  - faster_rcnn_x101_64x4d_fpn_1x.py
  - cascade_rcnn_r50_caffe_c4_1x.py
  - gn
    - mask_rcnn_r50_fpn_gn_2x.py
    - mask_rcnn_r50_fpn_gn_contrib_2x.py
    - README.md
    - mask_rcnn_r101_fpn_gn_2x.py
  - cascade_mask_rcnn_r50_fpn_1x.py
  - fast_mask_rcnn_r50_caffe_c4_1x.py
  - cascade_rcnn_x101_32x4d_fpn_1x.py
  - ghm
    - README.md
    - retinanet_ghm_r50_fpn_1x.py
  - cascade_rcnn_r50_fpn_1x.py
  - ssd512_coco.py
  - rpn_r50_caffe_c4_1x.py
  - mask_rcnn_r101_fpn_1x.py
  - cascade_rcnn_x101_64x4d_fpn_1x.py
  - ms_rcnn
    - ms_rcnn_r101_caffe_fpn_1x.py
    - ms_rcnn_r50_caffe_fpn_1x.py
    - README.md
    - ms_rcnn_x101_64x4d_fpn_1x.py
  - fp16
    - faster_rcnn_r50_fpn_fp16_1x.py
    - mask_rcnn_r50_fpn_fp16_1x.py
    - retinanet_r50_fpn_fp16_1x.py
  - empirical_attention
    - faster_rcnn_r50_fpn_attention_0010_1x.py
    - faster_rcnn_r50_fpn_attention_0010_dcn_1x.py
    - faster_rcnn_r50_fpn_attention_1111_dcn_1x.py
    - README.md
    - faster_rcnn_r50_fpn_attention_1111_1x.py
  - scratch
    - scratch_faster_rcnn_r50_fpn_gn_6x.py
    - scratch_mask_rcnn_r50_fpn_gn_6x.py
    - README.md
  - rpn_x101_32x4d_fpn_1x.py
  - fast_mask_rcnn_r50_fpn_1x.py
  - retinanet_r50_fpn_1x.py
  - faster_rcnn_r101_fpn_1x.py
  - dcn
    - cascade_mask_rcnn_dconv_c3-c5_r50_fpn_1x.py
    - faster_rcnn_dconv_c3-c5_r50_fpn_1x.py
    - faster_rcnn_mdconv_c3-c5_r50_fpn_1x.py
    - cascade_rcnn_dconv_c3-c5_r50_fpn_1x.py
    - mask_rcnn_dconv_c3-c5_r50_fpn_1x.py
    - faster_rcnn_mdpool_r50_fpn_1x.py
    - faster_rcnn_dpool_r50_fpn_1x.py
    - README.md
    - faster_rcnn_dconv_c3-c5_x101_32x4d_fpn_1x.py
  - ssd300_coco.py
  - retinanet_r101_fpn_1x.py
  - cascade_rcnn_r101_fpn_1x.py
  - rpn_x101_64x4d_fpn_1x.py
  - fast_rcnn_r101_fpn_1x.py
  - mask_rcnn_x101_32x4d_fpn_1x.py
  - faster_rcnn_r50_fpn_1x.py
  - retinanet_x101_64x4d_fpn_1x.py
  - fast_rcnn_r50_fpn_1x.py
  - retinanet_x101_32x4d_fpn_1x.py
  - mask_rcnn_x101_64x4d_fpn_1x.py
  - gcnet
    - mask_rcnn_r4_gcb_c3-c5_r50_fpn_syncbn_1x.py
    - mask_rcnn_r16_gcb_c3-c5_r50_fpn_1x.py
    - mask_rcnn_r4_gcb_c3-c5_r50_fpn_1x.py
    - mask_rcnn_r50_fpn_sbn_1x.py
    - README.md
    - mask_rcnn_r16_gcb_c3-c5_r50_fpn_syncbn_1x.py
  - cascade_mask_rcnn_x101_32x4d_fpn_1x.py
  - mask_r101_(test).py
  - libra_rcnn
    - libra_faster_rcnn_x101_64x4d_fpn_1x.py
    - libra_fast_rcnn_r50_fpn_1x.py
    - libra_faster_rcnn_r101_fpn_1x.py
    - libra_retinanet_r50_fpn_1x.py
    - README.md
    - libra_faster_rcnn_r50_fpn_1x.py
  - fast_mask_rcnn_r101_fpn_1x.py
  - cascade_mask_rcnn_r50_caffe_c4_1x.py
  - mask_rcnn_r50_fpn_1x.py
  - faster_rcnn_x101_32x4d_fpn_1x.py
  - htc
    - htc_without_semantic_r50_fpn_1x.py
    - htc_r50_fpn_20e.py
    - htc_r50_fpn_1x.py
    - README.md
    - htc_x101_32x4d_fpn_20e_16gpu.py
    - htc_r101_fpn_20e.py
    - htc_dconv_c3-c5_mstrain_400_1400_x101_64x4d_fpn_20e.py
    - htc_x101_64x4d_fpn_20e_16gpu.py
  - faster_rcnn_r50_caffe_c4_1x.py
  - fast_rcnn_r50_caffe_c4_1x.py
  - faster_rcnn_ohem_r50_fpn_1x.py
  - wider_face
    - ssd300_wider_face.py
    - README.md
  - rpn_r50_fpn_1x.py
  - guided_anchoring
    - ga_rpn_r101_caffe_rpn_1x.py
    - ga_fast_r50_caffe_fpn_1x.py
    - ga_rpn_x101_32x4d_fpn_1x.py
    - ga_retinanet_r50_caffe_fpn_1x.py
    - ga_rpn_r50_caffe_fpn_1x.py
    - README.md
    - ga_faster_x101_32x4d_fpn_1x.py
    - ga_faster_r50_caffe_fpn_1x.py
    - ga_retinanet_x101_32x4d_fpn_1x.py
  - cascade_mask_rcnn_r101_fpn_1x.py
- mmdet
  - datasets
    - coco.py
    - extra_aug.py
    - xml_style.py
    - wider_face.py
    - dataset_wrappers.py
    - registry.py
    - my_dataset.py
    - loader
      - sampler.py
      - __pycache__
        __init__.cpython-37.pyc
        build_loader.cpython-37.pyc
        sampler.cpython-37.pyc
      - build_loader.py
      - __init__.py
    - __init__.py
    - utils.py
    - voc.py
    - builder.py
    - transforms.py
    - custom.py
  - utils
    - registry.py
    - __init__.py
  - apis
    - env.py
    - train.py
    - __init__.py
    - inference.py
  - version.py
  - models
    - mask_heads
      - htc_mask_head.py
      - maskiou_head.py
      - grid_head.py
      - fcn_mask_head.py
      - __init__.py
      - fused_semantic_head.py
    - utils
      - conv_ws.py
      - scale.py
      - conv_module.py
      - norm.py
      - __init__.py
      - weight_init.py
    - anchor_heads
      - fcos_head.py
      - retina_head.py
      - guided_anchor_head.py
      - ga_rpn_head.py
      - ga_retina_head.py
      - anchor_head.py
      - rpn_head.py
      - __init__.py
      - ssd_head.py
    - bbox_heads
      - convfc_bbox_head.py
      - __init__.py
      - bbox_head.py
    - losses
      - focal_loss.py
      - cross_entropy_loss.py
      - ghm_loss.py
      - accuracy.py
      - smooth_l1_loss.py
      - mse_loss.py
      - __init__.py
      - balanced_l1_loss.py
      - utils.py
      - iou_loss.py
    - plugins
      - generalized_attention.py
      - __init__.py
      - non_local.py
    - detectors
      - test_mixins.py
      - single_stage.py
      - two_stage.py
      - fast_rcnn.py
      - rpn.py
      - faster_rcnn.py
      - cascade_rcnn.py
      - mask_scoring_rcnn.py
      - retinanet.py
      - __init__.py
      - fcos.py
      - grid_rcnn.py
      - htc.py
      - mask_rcnn.py
      - base.py
    - registry.py
    - roi_extractors
      - __init__.py
      - single_level.py
    - __init__.py
    - backbones
      - ssd_vgg.py
      - hrnet.py
      - resnet.py
      - __init__.py
      - resnext.py
    - builder.py
    - necks
      - fpn.py
      - __init__.py
      - hrfpn.py
      - bfp.py
    - shared_heads
      - res_layer.py
      - __init__.py
  - __init__.py
  - core
    - utils
      - misc.py
      - dist_utils.py
      - __init__.py
    - fp16
      - decorators.py
      - hooks.py
      - __init__.py
      - utils.py
    - anchor
      - anchor_target.py
      - guided_anchor_target.py
      - __init__.py
      - anchor_generator.py
    - bbox
      - geometry.py
      - bbox_target.py
      - __init__.py
      - transforms.py
      - samplers
        __pycache__
        base_sampler.cpython-37.pyc
        __init__.cpython-37.pyc
        pseudo_sampler.cpython-37.pyc
        random_sampler.cpython-37.pyc
        sampling_result.cpython-37.pyc
        iou_balanced_neg_sampler.cpython-37.pyc
        ohem_sampler.cpython-37.pyc
        instance_balanced_pos_sampler.cpython-37.pyc
        combined_sampler.cpython-37.pyc
        sampling_result.py
        pseudo_sampler.py
        __init__.py
        instance_balanced_pos_sampler.py
        random_sampler.py
        iou_balanced_neg_sampler.py
        ohem_sampler.py
        base_sampler.py
        combined_sampler.py
      - assigners
        approx_max_iou_assigner.py
        base_assigner.py
        assign_result.py
        __pycache__
        base_assigner.cpython-37.pyc
        __init__.cpython-37.pyc
        max_iou_assigner.cpython-37.pyc
        approx_max_iou_assigner.cpython-37.pyc
        assign_result.cpython-37.pyc
        max_iou_assigner.py
        __init__.py
      - assign_sampling.py
    - evaluation
      - recall.py
      - mean_ap.py
      - eval_hooks.py
      - coco_utils.py
      - class_names.py
      - bbox_overlaps.py
      - __init__.py
    - mask
      - mask_target.py
      - __init__.py
      - utils.py
    - __init__.py
    - post_processing
      - merge_augs.py
      - __init__.py
      - bbox_nms.py
- outputs
- README.md
- annotation
  - demo
  - mask_rcnn_r101_fpn_1x.py
  - dataset_example
    - train.json
    - train.xml
    - image
  - mmcv
    - config
    - checkpoint
    - runner
      - utils
      - hooks
    - parallel
    - io
  - model_vis
  - faster_rcnn_r50_fpn_1x.py
  - mmdet
    - datasets
      - datasets
      - loader
    - registry
    - apis
      - __init__
      - inference
      - train
    - models
      - utils
      - anchor_heads
      - bbox_heads
      - builder
      - resnet
        identity_block
        resnet-101(这个是maskrcnn-tf的，m2det只输出这里的C2-C5，而且两处block数目也不同)
        conv_block
      - losses
      - backbones
      - necks
- MODEL_ZOO.md
- CODE_OF_CONDUCT.md
- tools
  - coco_eval.py
  - slurm_train.sh
  - slurm_test.sh
  - voc_eval.py
  - dist_test.sh
  - detectron2pytorch.py
  - upgrade_model_version.py
  - train.py
  - dist_train.sh
  - test.py
  - analyze_logs.py
  - convert_datasets
    - pascal_voc.py
  - publish_model.py
- INSTALL.md

import argparse
import os.path as osp
import xml.etree.ElementTree as ET

import mmcv
import numpy as np

from mmdet.core import voc_classes

label_ids = {name: i + 1 for i, name in enumerate(voc_classes())}


def parse_xml(args):
    xml_path, img_path = args
    tree = ET.parse(xml_path)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    bboxes = []
    labels = []
    bboxes_ignore = []
    labels_ignore = []
    for obj in root.findall('object'):
        name = obj.find('name').text
        label = label_ids[name]
        difficult = int(obj.find('difficult').text)
        bnd_box = obj.find('bndbox')
        bbox = [
            int(bnd_box.find('xmin').text),
            int(bnd_box.find('ymin').text),
            int(bnd_box.find('xmax').text),
            int(bnd_box.find('ymax').text)
        ]
        if difficult:
            bboxes_ignore.append(bbox)
            labels_ignore.append(label)
        else:
            bboxes.append(bbox)
            labels.append(label)
    if not bboxes:
        bboxes = np.zeros((0, 4))
        labels = np.zeros((0, ))
    else:
        bboxes = np.array(bboxes, ndmin=2) - 1
        labels = np.array(labels)
    if not bboxes_ignore:
        bboxes_ignore = np.zeros((0, 4))
        labels_ignore = np.zeros((0, ))
    else:
        bboxes_ignore = np.array(bboxes_ignore, ndmin=2) - 1
        labels_ignore = np.array(labels_ignore)
    annotation = {
        'filename': img_path,
        'width': w,
        'height': h,
        'ann': {
            'bboxes': bboxes.astype(np.float32),
            'labels': labels.astype(np.int64),
            'bboxes_ignore': bboxes_ignore.astype(np.float32),
            'labels_ignore': labels_ignore.astype(np.int64)
        }
    }
    return annotation


def cvt_annotations(devkit_path, years, split, out_file):
    if not isinstance(years, list):
        years = [years]
    annotations = []
    for year in years:
        filelist = osp.join(devkit_path, 'VOC{}/ImageSets/Main/{}.txt'.format(
            year, split))
        if not osp.isfile(filelist):
            print('filelist does not exist: {}, skip voc{} {}'.format(
                filelist, year, split))
            return
        img_names = mmcv.list_from_file(filelist)
        xml_paths = [
            osp.join(devkit_path, 'VOC{}/Annotations/{}.xml'.format(
                year, img_name)) for img_name in img_names
        ]
        img_paths = [
            'VOC{}/JPEGImages/{}.jpg'.format(year, img_name)
            for img_name in img_names
        ]
        part_annotations = mmcv.track_progress(parse_xml,
                                               list(zip(xml_paths, img_paths)))
        annotations.extend(part_annotations)
    mmcv.dump(annotations, out_file)
    return annotations


def parse_args():
    parser = argparse.ArgumentParser(
        description='Convert PASCAL VOC annotations to mmdetection format')
    parser.add_argument('devkit_path', help='pascal voc devkit path')
    parser.add_argument('-o', '--out-dir', help='output path')
    args = parser.parse_args()
    return args


def main():
    args = parse_args()
    devkit_path = args.devkit_path
    out_dir = args.out_dir if args.out_dir else devkit_path
    mmcv.mkdir_or_exist(out_dir)

    years = []
    if osp.isdir(osp.join(devkit_path, 'VOC2007')):
        years.append('2007')
    if osp.isdir(osp.join(devkit_path, 'VOC2012')):
        years.append('2012')
    if '2007' in years and '2012' in years:
        years.append(['2007', '2012'])
    if not years:
        raise IOError('The devkit path {} contains neither "VOC2007" nor '
                      '"VOC2012" subfolder'.format(devkit_path))
    for year in years:
        if year == '2007':
            prefix = 'voc07'
        elif year == '2012':
            prefix = 'voc12'
        elif year == ['2007', '2012']:
            prefix = 'voc0712'
        for split in ['train', 'val', 'trainval']:
            dataset_name = prefix + '_' + split
            print('processing {} ...'.format(dataset_name))
            cvt_annotations(devkit_path, year, split,
                            osp.join(out_dir, dataset_name + '.pkl'))
        if not isinstance(year, list):
            dataset_name = prefix + '_test'
            print('processing {} ...'.format(dataset_name))
            cvt_annotations(devkit_path, year, 'test',
                            osp.join(out_dir, dataset_name + '.pkl'))
    print('Done!')


if __name__ == '__main__':
    main()