python source code of engineer

Project: youtube-8m (GitHub Link)

youtube-8m-master
- .gitmodules
- LICENSE
- youtube-8m-wangheda
  - inference-pre-ensemble-with-predictions.py
  - inference-layer.py
  - training_scripts
    - run-cascade-76-multiscale-cnn-lstm.sh
    - run-chaining-multi-resolution-lstm.sh
    - run-multiple-attention-pooling-positional-embedding.sh
    - run-parallel-lstm-memory.sh
    - run-cascade-75-chaining-cnn.sh
    - run-chaining-shared-lstm.sh
    - run-cascade-76-parallel-lstm.sh
    - run-cascade-76-chaining-lstm-cnn.sh
    - run-cascade-75-chaining-video.sh
    - run-cascade-76-chaining-video.sh
    - run-cascade-75-chaining-lstm.sh
    - run-chaining-deep-cnn.sh
    - run-multiscale-cnn-lstm-model.sh
    - run-chaining-lstm-cnn.sh
    - run-cnn-lstm.sh
    - run-cnn-model.sh
    - run-parallel-lstm-output.sh
    - run-cascade-76-chaining-cnn.sh
    - run-lstm-memory-cell1024.sh
    - run-cascade-75-chaining-parallel-lstm.sh
    - run-lstm-memory-cell2048.sh
    - run-cascade-76-multiple-attention-pooling.sh
    - run-chaining-cnn.sh
    - run-cascade-76-parallel-lstm-boosting.sh
    - run-cascade-75-multiple-attention-pooling.sh
    - run-chaining-lstm.sh
    - run-temporal-pooling-lstm.sh
    - run-cascade-76-chaining-lstm.sh
    - run-chaining-video.sh
    - run-cascade-75-chaining-lstm-cnn.sh
  - all_frame_models
    - progressive_attention_lstm_model.py
    - framehop_lstm_memory_deep_combine_chain_model.py
    - lstm_advanced_model.py
    - lstm_positional_attention_max_pooling_model.py
    - framehop_lstm_memory_model.py
    - lstm_model.py
    - mm_lstm_memory_model.py
    - wide_and_deep_model.py
    - gru_pooling_model.py
    - lstm_multi_attention_model.py
    - lstm_memory_input_chain_model.py
    - lstm_attention_model.py
    - lstm_attention_lstm_model.py
    - lstm_parallel_memory_model.py
    - logistic_model.py
    - lstm_auxloss_deep_combine_chain_model.py
    - cnn_lstm_memory_multitask_model.py
    - multiscale_cnn_lstm_model.py
    - dbof_model.py
    - lstm_memory_parallel_chain_model.py
    - lstm_multi_pooling_model.py
    - cnn_lstm_memory_model.py
    - lstm_with_pooling_model.py
    - bilstm_model.py
    - cnn_lstm_memory_normalization_model.py
    - lstm_divided_model.py
    - lstm_attention_max_pooling_model.py
    - frame_seg_model.py
    - distillchain_multiscale_cnn_lstm_model.py
    - lstm_memory_deep_chain_model.py
    - gru_with_pooling_model.py
    - lstm_parallel_model.py
    - lstm_pooling_model.py
    - .vimrc
    - positional_cnn_deep_combine_chain_model.py
    - lstm_memory_normalization_model.py
    - distillchain_lstm_parallel_finaloutput_model.py
    - multi_view_cnn_deep_combine_chain_model.py
    - distillchain_lstm_memory_deep_combine_chain_model.py
    - __init__.py
    - distillchain_lstm_cnn_deep_combine_chain_model.py
    - deep_lstm_model.py
    - distillchain_cnn_deep_combine_chain_model.py
    - cnn_model.py
    - biunilstm_model.py
    - distillchain_lstm_attention_max_pooling_model.py
    - multires_lstm_memory_deep_combine_chain_model.py
    - lstm_memory_model.py
    - lstm_cnn_deep_combine_chain_model.py
    - lstm_with_mean_input_model.py
    - lstm_look_back_model.py
    - cnn_deep_combine_chain_model.py
    - lstm_memory_multitask_model.py
    - layernorm_lstm_memory_model.py
    - cnn_kmax_model.py
    - lstm_memory_chain_model.py
    - deep_cnn_deep_combine_chain_model.py
    - lstm_parallel_finaloutput_model.py
  - eval.py
  - training_utils
    - human_readable_error_analysis.py
    - del.py
    - reweight_sample_freq.py
    - select.py
    - sample_freq.py
    - video_original_boosting_error_analysis.py
  - all_feature_transform
    - engineer_transformer.py
    - avg_transformer.py
    - resolution_transformer.py
    - __init__.py
    - default_transformer.py
    - identical_transformer.py
  - train-with-rebuild.py
  - inference-sample-error.py
  - data_augmentation_scripts
    - run-multiple-attention-pooling-positional-embedding.sh
    - run-parallel-lstm-memory.sh
    - eval-chaining-video.sh
    - run-multiscale-cnn-lstm-model.sh
    - run-chaining-cnn.sh
    - run-chaining-lstm.sh
    - run-chaining-video.sh
  - feature_transform.py
  - eval_scripts
    - eval-moe-baseline.sh
    - eval-chain-moe.sh
    - eval-video-verydeep-combine-chain.sh
    - eval-lstmmemory.sh
    - eval-moe-model.sh
    - eval-lstmmemory-audio.sh
    - eval-distillchain-cnn-dcc.sh
    - eval-lstmmem-augmenter.sh
    - eval-video-distillchain-video-dcc.sh
    - eval-video-deep-combine-chain-noise.sh
    - eval-video-deep-chain.sh
    - eval-distillchain-v2-video-dcc.sh
    - eval-multi-view-cnn-deep-combine-chain.sh
    - eval-chain-moe-suprelu-vert+freq.sh
    - eval-distillchain-lstmparalleloutput.sh
    - eval-lstm-attention-8max.sh
    - eval-multitask-ce.sh
    - eval-att-lstm.sh
    - eval-video-moe.sh
    - eval-lstmmem-chain-freq.sh
    - eval-distillchain-lstmcnn.sh
    - eval-moe-topk-batchagreement3.sh
    - eval-lstm-positional-attention-8max.sh
    - eval-mem.sh
    - eval-lstmmem-deep-combine-chain-length.sh
    - eval-lstmmem-shortcut-chain-freq.sh
    - eval-dbof.sh
    - eval-video-hidden-combine-chain.sh
    - eval-distillchain-v2-lstmattention8max.sh
    - eval-video-divergence-chain-model.sh
    - eval-multires-lstm-deep-combine-chain.sh
    - eval-lstmmem-deep-chain.sh
    - eval-lstmmem-parallel.sh
    - eval-video-deep-combine-chain.sh
    - eval-lstm-cnn-deep-combine-chain.sh
    - eval-video-divergence-moe-model.sh
    - eval-chain-model-relu.sh
    - eval-lstmoutput-parallel.sh
    - eval-moe-topk-batchagreement2.sh
    - eval-lstmmem-l2norm.sh
    - eval-lstm-look-back.sh
    - eval-chain-model-suprelu.sh
    - eval-lstmmem-no-transform.sh
    - eval-moe-topk-batchagreement1.sh
    - eval-video-deep-combine-addnoise.sh
    - eval-distill-video-dcc-noise-scene2.sh
    - eval-cnn-deep-combine-chain.sh
    - eval-bi-uni-lstm.sh
    - eval-distillchain-v2-multilstm.sh
    - eval-positional-cnn-dcc.sh
    - eval-frame-seg.sh
    - eval-chain-moe-0.4.sh
    - eval-att.sh
    - eval-stage2-moe.sh
    - eval-lstmmem-input-chain.sh
    - eval-lstmmem-noise.sh
    - eval-video-logistic.sh
    - eval-mm-lstm.sh
    - eval-multitask.sh
    - eval-lstmmem-chain.sh
    - eval-lstmmemory-layer1.sh
    - eval-distill-video-dcc-noise-scene1.sh
    - eval-video-deep-combine-chain-dropout.sh
    - eval-lstmmem-layernorm.sh
    - eval-distillchain-multilstm.sh
    - eval-distillchain-video-dcc.sh
    - eval-lstmmem-feature.sh
    - eval-lstmmem2048.sh
    - eval-distillchain-v2-lstmcnn.sh
    - eval-lstmmem-lowres.sh
    - eval-moe-batchagreement2.sh
    - eval-lstmmem-cnnlstm.sh
    - eval-layer-moe-vert.sh
    - eval-lstmmem-dropout.sh
    - eval-multi-lstmmem-deep-chain.sh
    - eval-lstmmem-input-noise.sh
    - eval-framehop-lstmmem.sh
    - eval-stage2-logistic.sh
    - eval-layer-chain-moe8-freq.sh
    - eval-cnn-model.sh
    - eval-video-hidden-chain.sh
    - eval-distillchain-v2-multiscale-cnnlstm.sh
    - eval-deep-cnn-deep-combine-chain.sh
    - eval-distillchain-v2-boostinglstmparalleloutput.sh
    - eval-distillchain-v2-lstmparalleloutput.sh
    - eval-moe-batchagreement1.sh
    - eval-chain-moe-freq.sh
    - eval-video-pairwise.sh
    - eval-video-deep-combine-chain-labelsmoothing.sh
    - eval-moe-batchagreement3.sh
  - inference-sample-error-analysis.py
  - LICENSE
  - infer_scripts
    - infer-distillchain-cnn-dcc.sh
    - infer-distillchain-v2-multiscal-cnnlstm.sh
    - infer-video_logistic.sh
    - infer-distill_video_dcc.sh
    - infer-lstm_attention8_max.sh
    - infer-lstmparallelmemory1024_moe8.sh
    - infer-model_input.sh
    - infer-distillation-lstmgate.sh
    - infer-lstmmemory1024_deep_combine_chain_add_length.sh
    - infer-video-distillchain-video-dcc.sh
    - infer-video_very_deep_combine_chain.sh
    - infer-distillation-video-dcc.sh
    - infer-lstmmemory-audio.sh
    - infer-distillation.sh
    - infer-dbof.sh
    - infer-framehop_lstm.sh
    - infer-video_moe16_model.sh
    - infer-distillchain-v2-lstmparalleloutput.sh
    - infer-frame_seg.sh
    - infer-cnn_model.sh
    - infer-distillchain-lstmcnn.sh
    - infer-lstm_cnn_deep_combine_chain.sh
    - infer-cnn_lstmmemory1024_moe8.sh
    - infer-multilstmmemory1024_moe4_deep_chain.sh
    - infer-distillchain-v2-boost-lstmparalleloutput.sh
    - infer-deep_cnn_deep_combine.sh
    - infer-biunilstm1024_moe8.sh
    - infer-distillchain-v2-video-dcc.sh
    - infer-distillation-lstmattention8max.sh
    - infer-deeplstm1024_layer6_moe4.sh
    - infer-cnn_deep_combine_chain.sh
    - infer-distillchain-v2-multilstm.sh
    - infer-video_group_moe4_noise0.2_layer4_elu.sh
    - infer-positional-lstmattention8max.sh
    - infer-multires_lstm_deep_combine_chain.sh
    - infer-lstmmemory2048_moe4.sh
    - infer-distillchain-v2-lstmcnn.sh
    - infer-distillchain-v2-lstmattention8max.sh
    - infer-distillchain-lstmparalleloutput.sh
    - infer-lstmattlstm1024_moe8.sh
    - infer-lstmparalleloutput1024_moe8.sh
    - infer-attentionlstm_moe4.sh
    - infer-lstmmemory1024_moe8.sh
    - infer-lstmmemory-layer1.sh
    - infer-distillation-cnn-dcc.sh
  - losses.py
  - all_data_augmentation
    - clipping_augmenter.py
    - noise_augmenter.py
    - half_augmenter.py
    - default_augmenter.py
    - __init__.py
    - half_video_augmenter.py
  - CONTRIBUTING.md
  - frame_level_models.py
  - models.py
  - all_video_models
    - deep_chain_model.py
    - shortcut_chain_support_relu_moe_model.py
    - distillchain_deep_combine_chain_model.py
    - multitask_divergence_deep_combine_chain_model.py
    - logistic_model.py
    - stage2_logistic_model.py
    - multitask_divergence_moe_model.py
    - chain_support_relu_moe_model.py
    - mlp_moe_model.py
    - hidden_chain_model.py
    - .vimrc
    - chain_moe_model.py
    - __init__.py
    - chain_main_relu_moe_model.py
    - moe_model.py
    - multitask_moe_model.py
    - deep_combine_chain_model.py
    - hidden_combine_chain_model.py
  - inference-pre-ensemble-get-input.py
  - readers.py
  - .vimrc
  - inference-stage1.py
  - train.py
  - cloudml-gpu-distributed.yaml
  - inference-pre-ensemble.py
  - __init__.py
  - eval_util.py
  - README.md
  - utils.py
  - mean_average_precision_calculator.py
  - inference.py
  - train-with-predictions.py
  - data_augmentation.py
  - video_level_models.py
  - cloudml-gpu.yaml
  - bagging_scripts
    - lstmparalleloutput-bagging.sh
    - lstmattention8max-bagging.sh
    - video-deep-combine-chain-bagging.sh
    - distillation-video-dcc-bagging.sh
    - cnn-deep-combine-chain-bagging.sh
  - boosting_scripts
    - cnn-deep-combine-chain-boosting.sh
    - lstmparalleloutput-boosting-weightclip.sh
    - video-deep-combine-chain-boosting-weightclip.sh
    - distillation-lstmparalleloutput-boosting.sh
    - distillation-video-dcc-boosting.sh
    - distillation-cnn-dcc-boosting.sh
    - video-deep-combine-chain-boosting.sh
    - distillation-lstmcnn-dcc-boosting.sh
    - lstmattention8max-boosting-weightclip.sh
    - distillation-multiscale-cnn-lstm-boosting.sh
    - distillation-multilstm-dcc-boosting.sh
    - video-deep-combine-chain-boosting-discardhopeless.sh
    - distillation-positional-lstmattention8max-boosting.sh
  - model_utils.py
  - average_precision_calculator.py
  - eval.sh
  - cascade_scripts
    - distillchain-v2-videochain.sh
    - distillchain-v2-hybridchain2.sh
    - distillchain-v2-hybridchain.sh
- youtube-8m-zhangteng
  - labels_autoencoder.py
  - eval.py
  - training_utils
    - del.py
    - select.py
  - writers.py
  - inference_autoencoder.py
  - train-with-rebuild.py
  - inference_with_rebuild.py
  - labels_rbm.py
  - YM_readframefeature.py
  - eval_scripts
    - eval-distillchain_lstm_glu2_moe8_v2.sh
    - eval-lstm_attention8_max.sh
    - eval-lstm2_attention8_max.sh
    - eval-distillchain_lstm_extend_moe8.sh
    - eval-lstm_gate_multiscale4_moe4.sh
    - eval-distillchain_lstm_gate_moe8_v2.sh
    - eval-video_notzero_combine_chain.sh
    - eval-distillsplit_lstm_gate_moe8.sh
    - eval-lstmglu2_1024_moe8.sh
    - eval-distillchain_lstm_gate_moe8.sh
    - eval-distillchain_cnndcc_layer2moe4.sh
    - eval-distillchain_lstm_moe8_v2.sh
    - eval-lstm_multiscale4_moe4.sh
    - eval-lstm_random_moe8.sh
    - eval-lstmgate1024_moe8.sh
    - eval-distillchain_lstm_moe8.sh
    - eval-video_softmax_combine_chain.sh
    - eval-distillchain_lstm_multiscale4layer_moe8.sh
    - eval-lstmbiglu_1024_moe8.sh
    - eval-lstm_shortlayers_moe8.sh
    - eval-distillchain_lstm_multiscale2layer_moe8.sh
    - eval-video_knowledge_combine_chain.sh
    - eval-distillchain_video_norm_moe8_local.sh
    - eval-video_relabel_combine_chain.sh
  - LICENSE
  - infer_scripts
    - infer-lstm_multiscale4_moe4.sh
    - infer-lstm2_attention8_max.sh
    - infer-video_relabel_combine_chain.sh
    - infer-distillchain_lstm_moe8.sh
    - infer-lstm_attention8_max.sh
    - infer-lstmgate1024_moe8.sh
    - infer-distillchain_video_norm_moe8.sh
    - infer-distillchain_lstm_gate_moe8.sh
    - infer-lstm_shortlayers_moe8.sh
    - infer-distillchain_cnndcc_layer2moe4_ensemble.sh
    - infer-distillchain_lstm_extend_moe8.sh
    - infer-distillchain_cnndcc_layer2moe4.sh
    - infer-lstm_random_mean_moe8.sh
    - infer-distillchain_lstm_multiscale2layer_moe8.sh
    - infer-video_notzero_combine_chain.sh
    - infer-distillchain_lstm_moe8_v2.sh
    - infer-distillchain_lstm_gate_moe8_v2.sh
    - infer-distillchain_lstm_glu2_moe8_v2.sh
    - infer-lstm_attention_max_mean.sh
    - infer-lstmbiglu_1024_moe8.sh
    - infer-distillchain_lstm_multiscale4layer_moe8.sh
    - infer-lstm_gate_multiscale4_moe4.sh
    - infer-distillchain_video_norm_moe8_local.sh
    - infer-lstmglu2_1024_moe8.sh
    - infer-distillsplit_lstm_gate_moe8.sh
  - losses.py
  - labels_embedding.py
  - CONTRIBUTING.md
  - inference_test.py
  - train_autoencoder.py
  - models.py
  - YM_labels_vocab.py
  - readers.py
  - inference-pre-ensemble-distill.py
  - YM_labels_matrix.py
  - train_scripts
    - run-cascade-lstm-s-split.sh
    - run-cascade-76-lstm-a.sh
    - run-temporal-segment-lstm.sh
    - run-attention-pooling-lstm2lstm.sh
    - run-chaining-video-infrequent-softmax.sh
    - run-cascade-multiscale-cnn-lstm-laery4.sh
    - run-cascade-lstm.sh
    - run-cascade-chaining-video-normalize.sh
    - run-attention-pooling-lstm-s.sh
    - run-chaining-video-vertical.sh
    - run-chaining-video-add-confident.sh
    - run-cascade-chaining-cnn-layer2.sh
    - run-lstm-s.sh
    - run-cascade-76-lstm-s.sh
    - run-cascade-lstm-s.sh
    - run-cascade-multiscale-cnn-lstm-layer2.sh
    - run-cascade-attention-pooling.sh
    - run-bilstm-a.sh
    - run-chaining-video-normal.sh
    - run-cascade-76-lstm.sh
    - run-lstm-random-augmentation.sh
    - run-attention-pooling.sh
    - run-multiscale-cnn-lstm.sh
    - run-attention-pooling-lstm-a.sh
  - train.py
  - cloudml-gpu-distributed.yaml
  - inference-pre-ensemble.py
  - inference_embedding.py
  - __init__.py
  - eval_util.py
  - README.md
  - utils.py
  - mean_average_precision_calculator.py
  - inference.py
  - eval_embedding.py
  - video_level_models.py
  - YM_framemean.py
  - rnn_residual.py
  - losses_embedding.py
  - train_embedding.py
  - eval_autoencoder.py
  - cloudml-gpu.yaml
  - train_ensemble.py
  - YM_labels_model.py
  - eval_distill.py
  - model_utils.py
  - average_precision_calculator.py
- youtube-8m-ensemble
  - check_video_id.py
  - eval.py
  - training_utils
    - del.py
    - select.py
    - sample_conf.py
    - sample_freq.py
  - check_distillation.py
  - inference-combine-tfrecords-video.py
  - feature_transform.py
  - LICENSE
  - losses.py
  - CONTRIBUTING.md
  - ensemble_command.example
  - models.py
  - ensemble_level_models.py
  - readers.py
  - .vimrc
  - top_k_scripts
    - train-attention_matrix_model.sh
    - preensemble-attention_matrix_model.sh
    - infer-attention_matrix_model.sh
    - run_top_k.sh
    - eval-attention_matrix_model.sh
  - check_video_id_match.py
  - model_selection_scripts
    - get_patterns.py
    - get_top_k.py
    - greedy-selection-mean_model.sh
    - extend-step-mean_model.sh
    - .vimrc
    - get_extend_candidates.py
  - train.py
  - cloudml-gpu-distributed.yaml
  - inference-pre-ensemble.py
  - all_ensemble_models
    - mean_model.py
    - input_moe_model.py
    - matrix_regression_model.py
    - attention_linmatrix_model.py
    - logistic_model.py
    - linear_regression_model.py
    - .vimrc
    - __init__.py
    - attention_moe_matrix_model.py
    - attention_matrix_model.py
    - nonunit_matrix_regression_model.py
    - moe_model.py
    - attention_rectified_linear_model.py
    - deep_combine_chain_model.py
    - attention_linear_model.py
    - attention_moe_model.py
  - __init__.py
  - eval_util.py
  - README.md
  - utils.py
  - mean_average_precision_calculator.py
  - inference.py
  - data_augmentation.py
  - ensemble_scripts
    - train-attention_linmatrix_model.sh
    - infer-linear_model.sh
    - after_submission_no3.conf
    - eval-deep_combine_chain_model.sh
    - train-mean_model.sh
    - train-input_moe_model.sh
    - ensemble_no21.conf
    - infer-attention_moe_model.sh
    - eval-attention_linear_model.sh
    - train-linear_model.sh
    - eval-attention_moe_matrix_model.sh
    - combine-tfrecords-video-v2.sh
    - combine-tfrecords-frame.sh
    - check-video_id.sh
    - train-attention_moe_model.sh
    - eval-mean_model.sh
    - after_submission_no1.conf
    - train-matrix_model.sh
    - train-deep_combine_chain_model.sh
    - after_submission_no2.conf
    - eval-attention_linmatrix_model.sh
    - ensemble_no7.conf
    - ensemble_no14.conf
    - infer-attention_moe_matrix_model.sh
    - train-attention_matrix_model.sh
    - infer-attention_rectified_linear_model.sh
    - ensemble_no8.conf
    - eval-matrix_model.sh
    - eval-moe_model.sh
    - ensemble_no19.conf
    - auto-preensemble-deep_combine_chain_model.sh
    - train-attention_linear_model.sh
    - combine-tfrecords-video.sh
    - ensemble_no15.conf
    - infer-moe_model.sh
    - ensemble_no4.conf
    - preensemble-attention_matrix_model.sh
    - ensemble_no12.conf
    - combine-tfrecords-frame-v2.sh
    - .vimrc
    - ensemble_no10.conf
    - train-attention_moe_matrix_model.sh
    - ensemble_no20.conf
    - eval-nonunit_matrix_model.sh
    - final_submission.conf
    - ensemble_no6.conf
    - ensemble_no1.conf
    - explore-mean_model.log
    - infer-attention_matrix_model.sh
    - explore-mean_model.sh
    - make-virtual-groups.sh
    - preensemble-matrix_model.sh
    - ensemble_no9.conf
    - make-bagging-of-ensembles.sh
    - auto-preensemble-matrix_model.sh
    - check-video_id_match.sh
    - infer-mean_model.sh
    - ensemble_no5.conf
    - eval-attention_rectified_linear_model.sh
    - ensemble_no11.conf
    - infer-attention_linmatrix_model.sh
    - infer-attention_linear_model.sh
    - ensemble_no16.conf
    - after_submission_no4.conf
    - eval-input_moe_model.sh
    - train-nonunit_matrix_model.sh
    - train-attention_rectified_linear_model.sh
    - train-matrix_model_lr.sh
    - ensemble_no3.conf
    - ensemble_no17.conf
    - preensemble-mean_model.sh
    - ensemble_no18.conf
    - eval-attention_matrix_model.sh
    - infer-matrix_model.sh
    - ensemble_no2.conf
    - ensemble_no13.conf
    - eval-attention_moe_model.sh
    - train-moe_model.sh
    - eval-linear_model.sh
  - cloudml-gpu.yaml
  - model_utils.py
  - average_precision_calculator.py
  - inference-combine-tfrecords-frame.py
- README.md
- model
  - virtual_grouping
    - virtual_group_lstm.conf
    - virtual_group_video.conf
    - virtual_group_attention.conf
    - ensemble.conf
    - virtual_group_dcc.conf
    - virtual_group_mean.conf
  - model_selection
    - top_16_model.conf
    - top_12_model.conf
    - top_20_model.conf
    - top_8_model.conf
- eda
  - vertical.tsv
- .gitignore

import tensorflow as tf
import numpy as np
from tensorflow import flags
FLAGS = flags.FLAGS

class EngineerTransformer:
  """feature transform by feature engineering"""
  def transform(self, model_input_raw, num_frames, **unused_params):
    feature_dim = len(model_input_raw.get_shape()) - 1
    engineer_types = map(lambda x: x.strip(), FLAGS.engineer_types.split(","))
    feature_list = []
    mask = self.mask(model_input_raw, num_frames)
    for etype in engineer_types:
      if etype == "avg":
        feature_list.append(self.avg(model_input_raw, num_frames, mask))
      elif etype == "std":
        feature_list.append(self.std(model_input_raw, num_frames, mask))
      elif etype == "diff":
        feature_list.append(self.diff(model_input_raw, num_frames, mask))
      else:
        feature_list.append(model_input_raw)
    model_input = tf.nn.l2_normalize(tf.concat(model_input_raw, axis=feature_dim), feature_dim)
    return model_input, num_frames

  def mask(self, model_input_raw, num_frames):
    max_frames = model_input_raw.get_shape().as_list()[1]
    mask_array = []
    for i in xrange(max_frames + 1):
      tmp = [0.0] * max_frames 
      for j in xrange(i):
        tmp[j] = 1.0
      mask_array.append(tmp)
    mask_array = np.array(mask_array)
    mask_init = tf.constant_initializer(mask_array)
    mask_emb = tf.get_variable("mask_emb", shape = [max_frames + 1, max_frames], 
            dtype = tf.float32, trainable = False, initializer = mask_init)
    mask = tf.nn.embedding_lookup(mask_emb, num_frames)
    return mask

  def avg(self, model_input_raw, num_frames, mask):
    max_frames = model_input_raw.get_shape().as_list()[1]
    num_frames_matrix = tf.maximum(tf.cast(
          tf.expand_dims(num_frames, axis=1), 
          dtype=tf.float32), 1.0)
    mean_matrix = mask / num_frames_matrix
    mean_input = tf.einsum("ijk,ij->ik", model_input_raw, mean_matrix)
    mean_input_tile = tf.tile(tf.expand_dims(mean_input, axis=1), multiples=[1,max_frames,1])
    return mean_input_tile

  def std(self, model_input_raw, num_frames, mask):
    mean_input = self.avg(model_input_raw, num_frames, mask)
    error = tf.einsum("ijk,ij->ijk", model_input_raw - mean_input, mask)
    return error 

  def diff(self, model_input_raw, num_frames, mask):
    max_frames = model_input_raw.get_shape().as_list()[1]
    shift_input1 = tf.pad(model_input_raw, paddings=[[0,0], [0,1], [0,0]])
    shift_input2 = tf.pad(model_input_raw, paddings=[[0,0], [1,0], [0,0]])
    diff_input = shift_input1 - shift_input2
    difference = tf.einsum("ijk,ij->ijk", diff_input[:,:max_frames,:], mask)
    return difference