python source code of pytorch_cnn_features

Project: DetectAndTrack (GitHub Link)

DetectAndTrack-master
- LICENSE
- lib
  - cmake
    - Utils.cmake
    - Cuda.cmake
    - Modules
      - FindCuDNN.cmake
    - Dependencies.cmake
    - Summary.cmake
  - datasets
    - lists
      - PoseTrack
        v1.0
    - json_dataset.py
    - json_dataset_evaluator.py
    - roidb.py
    - data
      - README.md
    - __init__.py
    - posetrack
      - __init__.py
      - poseval
        license.txt
        py-motmetrics
        environment.yml
        TARGETS
        Readme.md
        LICENSE
        motmetrics
        mot.py
        metrics.py
        distances.py
        apps
        example.py
        eval_motchallenge.py
        __init__.py
        list_metrics.py
        io.py
        __init__.py
        utils.py
        tests
        test_distances.py
        test_io.py
        test_mot.py
        __init__.py
        test_metrics.py
        Release.md
        setup.py
        .travis.yml
        requirements.txt
        etc
        data
        TUD-Stadtmitte
        test.txt
        gt.txt
        iotest
        motchallenge.txt
        vatic.txt
        TUD-Campus
        test.txt
        gt.txt
        __init__.py
        README.md
        py
        evaluateTracking.py
        evaluate_simple.py
        evaluate.py
        evaluateAP.py
        eval_helpers.py
        __init__.py
        evaluatePCKh.py
  - utils
    - keypoints.py
    - env.py
    - general.py
    - pytorch_cnn_features.py
    - blob.py
    - image.py
    - cython_nms.pyx
    - vis.py
    - segms.py
    - collections.py
    - model_convert_utils.py
    - cython_bbox.pyx
    - training_stats.py
    - lr_policy.py
    - logger.py
    - net.py
    - boxes.py
    - colormap.py
    - file_sys.py
    - io.py
    - video.py
    - subprocess.py
    - __init__.py
    - video_io.py
    - coordinator.py
    - logging.py
    - timer.py
    - c2.py
  - Makefile
  - modeling
    - FPN3D.py
    - optimizer.py
    - ResNet.py
    - ResNet3D.py
    - mask_rcnn_heads.py
    - VGG16.py
    - detector.py
    - VGG_CNN_M_1024.py
    - fast_rcnn_heads.py
    - generate_anchors.py
    - FPN.py
    - head_builder.py
    - common.py
    - __init__.py
    - keypoint_rcnn_heads.py
    - rpn_heads.py
    - model_builder.py
  - nms
    - gpu_nms.pyx
    - gpu_nms.hpp
    - py_cpu_nms_tubes.py
    - cpu_nms.pyx
    - nms_kernel.cu
    - __init__.py
    - py_cpu_nms.py
  - setup.py
  - roi_data
    - fast_rcnn.py
    - rpn.py
    - __init__.py
    - keypoint_rcnn.py
    - loader.py
    - minibatch.py
    - data_utils.py
    - mask_rcnn.py
  - convert
    - data.py
    - box.py
    - __init__.py
    - loader.py
  - CMakeLists.txt
  - ops
    - roi_blob_transforms.py
    - collect_and_distribute_fpn_rpn_proposals.py
    - affine_channel_nd_op.cc
    - debug_ops.py
    - affine_channel_nd_op.h
    - generate_proposal_labels.py
    - affine_channel_nd_op.cu
    - zero_even_op.h
    - zero_even_op.cu
    - generate_proposals.py
    - __init__.py
    - zero_even_op.cc
  - core
    - mpii_eval_engine.py
    - config.py
    - tracking_engine.py
    - rpn_generator.py
    - test_engine.py
    - __init__.py
    - test.py
    - nms_wrapper.py
- CONTRIBUTING.md
- docker
  - Dockerfile
- FAQ.md
- launch.py
- configs
  - video
    - 3d
      - 03_R-18-3D_PTFromCOCO.yaml
      - 03_R-18-3D_PTFromCOCO-4GPU-BATCH1.yaml
      - 01_R-18_PTFromCOCO-4GPU.yaml
      - 04_R-18-3D_PTFromImNet-8GPU-BATCH1.yaml
      - 02_R-18_PTFromImNet.yaml
      - 02_R-18_PTFromImNet-4GPU.yaml
      - 04_R-18-3D_PTFromImNet-4GPU-BATCH1.yaml
      - 03_R-18-3D_PTFromCOCO-8GPU-BATCH1.yaml
      - 01_R-18_PTFromCOCO.yaml
      - 04_R-18-3D_PTFromImNet.yaml
    - 2d_best
      - 01_R101_best_hungarian-4GPU.yaml
      - 01_R101_best_hungarian.yaml
- README.md
- tests
  - test_spatial_narrow_as_op.py
  - test_loader.py
  - data_loader_benchmark.py
  - test_zero_even_op.py
  - test_smooth_l1_loss_op.py
  - test_cfg.py
  - test_batch_permutation_op.py
  - test_bbox_transform.py
- CODE_OF_CONDUCT.md
- tools
  - test_net.py
  - eval_mpii.py
  - train_net.py
  - gen_posetrack_json.py
  - visualize_results_v2.py
  - test_on_single_video.py
  - compute_tracks.py
- requirements.txt
- all_pkg_versions.txt
- NOTICE
- .gitignore

##############################################################
# Copyright (c) 2018-present, Facebook, Inc.
# All rights reserved.
#
# This source code is licensed under the license found in the
# LICENSE file in the root directory of this source tree.
##############################################################

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
from __future__ import unicode_literals

import os
import cv2
import numpy as np
import logging
import sys

import torch
from torchvision import models
os.environ['TORCH_MODEL_ZOO'] = \
    '/mnt/vol/gfsai-east/ai-group/users/rgirdhar/StandardModels/PyTorch/ImNet'

FORMAT = '%(levelname)s %(filename)s:%(lineno)4d: %(message)s'
logging.basicConfig(level=logging.INFO, format=FORMAT, stream=sys.stdout)
logger = logging.getLogger(__name__)


default_model = models.resnet18(pretrained=True)


def prepare_image(im):
    im = im[..., (2, 1, 0)]  # convert to rgb
    try:
        im = cv2.resize(im, (224, 224))
    except cv2.error:
        im = np.zeros((224, 224, 3))  # dummy image
        logger.warning('Invalid patch, replaced with 0 image.')
    im = im.transpose(2, 0, 1)
    mean = np.array([0.485, 0.456, 0.406]).reshape(1, 3, 1, 1)
    std = np.array([0.229, 0.224, 0.224]).reshape(1, 3, 1, 1)
    im = (im / 255.0 - mean) / std
    im = torch.FloatTensor(im).cuda()
    im = torch.autograd.Variable(im, volatile=True)
    return im


def extract_features(im, test_model=None, layers=('layer3',)):
    """
    Args:
        im (np.ndarray): Image, read using cv2.imread so is in BGR format.
    Returns:
        features (list): List of features from each layer in the list layers.
    """
    model = test_model or default_model
    model.eval()
    # Preprocess the image
    im = prepare_image(im)

    # Extract the features
    x = im
    outputs = []
    layers = list(layers)
    for name, module in model._modules.items():
        if len(layers) == 0:
            break
        if name == 'fc':
            # Not sure why I need to do this...
            x = torch.squeeze(x)
        x = module.cuda()(x)
        if name in layers:
            outputs += [x.data.cpu().clone().numpy()]
            del layers[layers.index(name)]
    return outputs