python source code of utils

fastNLP-master
- .github
  - PULL_REQUEST_TEMPLATE.md
  - ISSUE_TEMPLATE
    - feature-request------.md
    - bug-report-bug--.md
    - custom.md
    - feature_request.md
    - custom-issue-template-------.md
    - bug_report.md
  - CODE_OF_CONDUCT.md
- fastNLP
  - doc_utils.py
  - embeddings
    - stack_embedding.py
    - contextual_embedding.py
    - embedding.py
    - elmo_embedding.py
    - char_embedding.py
    - bert_embedding.py
    - gpt2_embedding.py
    - static_embedding.py
    - __init__.py
    - utils.py
    - roberta_embedding.py
  - models
    - snli.py
    - star_transformer.py
    - seq2seq_model.py
    - base_model.py
    - bert.py
    - seq2seq_generator.py
    - biaffine_parser.py
    - __init__.py
    - sequence_labeling.py
    - cnn_text_classification.py
  - io
    - model_io.py
    - file_utils.py
    - data_bundle.py
    - file_reader.py
    - embed_loader.py
    - loader
      - qa.py
      - classification.py
      - summarization.py
      - matching.py
      - conll.py
      - cws.py
      - __init__.py
      - loader.py
      - csv.py
      - coreference.py
      - json.py
    - __init__.py
    - utils.py
    - pipe
      - qa.py
      - classification.py
      - summarization.py
      - matching.py
      - conll.py
      - pipe.py
      - cws.py
      - __init__.py
      - utils.py
      - coreference.py
  - __init__.py
  - core
    - predictor.py
    - optimizer.py
    - tester.py
    - collate_fn.py
    - sampler.py
    - metrics.py
    - losses.py
    - dist_trainer.py
    - _logger.py
    - callback.py
    - instance.py
    - batch.py
    - __init__.py
    - _parallel_utils.py
    - utils.py
    - dataset.py
    - const.py
    - field.py
    - trainer.py
    - vocabulary.py
  - modules
    - tokenizer
      - bert_tokenizer.py
      - __init__.py
      - roberta_tokenizer.py
      - gpt2_tokenizer.py
    - decoder
      - crf.py
      - seq2seq_state.py
      - seq2seq_decoder.py
      - __init__.py
      - utils.py
      - mlp.py
    - attention.py
    - dropout.py
    - encoder
      - _elmo.py
      - conv_maxpool.py
      - transformer.py
      - seq2seq_encoder.py
      - star_transformer.py
      - char_encoder.py
      - bert.py
      - pooling.py
      - gpt2.py
      - lstm.py
      - __init__.py
      - roberta.py
      - variational_rnn.py
    - __init__.py
    - utils.py
    - generator
      - seq2seq_generator.py
      - __init__.py
- readthedocs.yml
- codecov.yml
- LICENSE
- test
  - data_for_tests
    - zh_sample.conllx
    - cws_test
    - conll_2003_example.txt
    - people_daily_raw.txt
    - cws_train
    - sample_mnli.tsv
    - people.txt
    - conll_example.txt
    - config
    - io
      - dbpedia
        train.csv
        test.csv
      - ag
        train.csv
        test.csv
      - Quora
        train.tsv
        test.tsv
        dev.tsv
      - WeiboSenti100k
        test.txt
        dev.txt
        train.txt
      - OntoNotes
        test.txt
        dev.txt
        train.txt
      - ChnSentiCorp
        test.txt
        dev.txt
        train.txt
      - peopledaily
        test.txt
        dev.txt
        train.txt
      - XNLI
        test.txt
        dev.txt
        train.txt
      - MSRA_NER
        dev.conll
        train.conll
        test.conll
      - SST-2
        train.tsv
        test.tsv
        dev.tsv
      - cws_as
        test.txt
        dev.txt
        train.txt
      - QNLI
        train.tsv
        test.tsv
        dev.tsv
      - MNLI
        dev_matched.tsv
        train.tsv
        test_mismatched.tsv
        test_matched.tsv
        dev_mismatched.tsv
      - cmrc
        train.json
        dev.json
      - BQCorpus
        test.txt
        dev.txt
        train.txt
      - conll2003
        test.txt
        dev.txt
        train.txt
      - THUCNews
        test.txt
        dev.txt
        train.txt
      - cws_cityu
        test.txt
        dev.txt
        train.txt
      - cws_msra
        test.txt
        dev.txt
        train.txt
      - yelp_review_full
        dev.csv
        train.csv
        test.csv
      - weibo_NER
        dev.conll
        train.conll
        test.conll
      - LCQMC
        test.txt
        dev.txt
        train.txt
      - RTE
        train.tsv
        test.tsv
        dev.tsv
      - SNLI
        snli_1.0_dev.jsonl
        snli_1.0_test.jsonl
        snli_1.0_train.jsonl
      - yelp_review_polarity
        dev.csv
        train.csv
        test.csv
      - cnndm
        train.cnndm.jsonl
        dev.label.jsonl
        test.label.jsonl
        vocab
      - cws_pku
        test.txt
        dev.txt
        train.txt
      - coreference
        coreference_train.json
        coreference_test.json
        coreference_dev.json
      - SST
        test.txt
        dev.txt
        train.txt
      - imdb
        test.txt
        dev.txt
        train.txt
    - tutorial_sample_dataset.csv
    - cws_pku_utf_8
    - embedding
      - small_elmo
        elmo_mini_for_testing.pkl
        char.dic
        elmo_1x16_16_32cnn_1xhighway_options.json
      - small_bert
        vocab.txt
        config.json
      - small_roberta
        config.json
        vocab.json
        merges.txt
      - small_static_embedding
        word2vec_test.txt
        glove.6B.50d_test.txt
      - small_gpt2
        config.json
        vocab.json
        merges.txt
    - text_classify.txt
    - sample_snli.jsonl
  - embeddings
    - test_bert_embedding.py
    - test_stack_embeddings.py
    - test_roberta_embedding.py
    - test_static_embedding.py
    - __init__.py
    - test_char_embedding.py
    - test_elmo_embedding.py
    - test_gpt2_embedding.py
  - models
    - test_star_trans.py
    - test_seq2seq_model.py
    - test_seq2seq_generator.py
    - test_biaffine_parser.py
    - model_runner.py
    - test_sequence_labeling.py
    - __init__.py
    - test_cnn_text_classification.py
    - test_bert.py
    - test_snli.py
  - io
    - test_embed_loader.py
    - test_model_io.py
    - loader
      - test_qa_loader.py
      - test_conll_loader.py
      - test_matching_loader.py
      - test_cws_loader.py
      - test_classification_loader.py
      - test_coreference_loader.py
    - __init__.py
    - pipe
      - test_cws.py
      - test_qa.py
      - test_classification.py
      - test_coreference.py
      - test_conll.py
      - test_summary.py
      - test_matching.py
  - __init__.py
  - core
    - test_predictor.py
    - test_optimizer.py
    - test_utils.py
    - test_callbacks.py
    - test_dataset.py
    - test_loss.py
    - test_batch.py
    - test_trainer.py
    - test_dist_trainer.py
    - test_logger.py
    - test_tester.py
    - test_vocabulary.py
    - test_field.py
    - test_instance.py
    - __init__.py
    - test_metrics.py
    - test_sampler.py
  - test_tutorials.py
  - modules
    - tokenizer
      - test_bert_tokenizer.py
    - test_utils.py
    - decoder
      - test_seq2seq_decoder.py
      - test_CRF.py
      - __init__.py
      - test_bert.py
    - encoder
      - test_pooling.py
      - __init__.py
      - test_seq2seq_encoder.py
    - test_other_modules.py
    - test_char_encoder.py
    - test_variational_rnn.py
    - __init__.py
    - generator
      - test_seq2seq_generator.py
      - __init__.py
- setup.py
- .coverage
- tutorials
  - tutorial_5_loss_optimizer.ipynb
  - tutorial_4_load_dataset.ipynb
  - tutorial_2_vocabulary.ipynb
  - 序列标注.ipynb
  - tutorial_9_callback.ipynb
  - 文本分类.ipynb
  - tutorial_8_modules_models.ipynb
  - tutorial_6_datasetiter.ipynb
  - README.md
  - tutorial_7_metrics.ipynb
  - tutorial_1_data_preprocess.ipynb
  - tutorial_3_embedding.ipynb
  - extend_1_bert_embedding.ipynb
- .travis.yml
- README.md
- requirements.txt
- reproduction
  - Star_transformer
    - util.py
    - modules.py
    - run.sh
    - datasets.py
    - train.py
    - README.md
  - text_classification
    - utils
      - util_init.py
      - place_holder.txt
    - train_awdlstm.py
    - train_HAN.py
    - train_char_cnn.py
    - test
      - test_MTL16Loader.py
      - test_yelp.py
      - sample_yelp.json
      - sample_MTL16.txt
      - TODO.txt
    - train_lstm.py
    - train_bert.py
    - data
      - sstloader.py
      - IMDBLoader.py
      - MTL16Loader.py
      - TODO.txt
      - yelpLoader.py
    - README.md
    - train_dpcnn.py
    - train_lstm_att.py
    - model
      - dpcnn.py
      - BertTC.py
      - awd_lstm.py
      - bert.py
      - lstm.py
      - char_cnn.py
      - HAN.py
      - lstm_self_attention.py
      - weight_drop.py
      - awdlstm_module.py
  - sequence_labelling
    - cws
      - train_shift_relay.py
      - data
        cws_shift_pipe.py
      - readme.md
      - model
        module.py
        metric.py
        bilstm_shift_relay.py
        bilstm_crf_cws.py
      - train_bilstm_crf.py
    - ner
      - train_ontonote.py
      - train_bert.py
      - __init__.py
      - README.md
      - train_idcnn.py
      - model
        dilated_cnn.py
        bert_crf.py
        lstm_cnn_crf.py
      - train_cnn_lstm_crf_conll2003.py
    - chinese_ner
      - LatticeLSTM
        utils_.py
        modules.py
        load_data.py
        small.py
        models.py
        main.py
        README.md
        utils.py
        pathes.py
      - train_cn_ner.py
      - train_bert.py
      - readme.md
  - coreference_resolution
    - train.py
    - __init__.py
    - README.md
    - model
      - preprocess.py
      - metric.py
      - util.py
      - config.py
      - softmax_loss.py
      - __init__.py
      - model_re.py
    - valid.py
  - multi-criteria-cws
    - transformer.py
    - train.sh
    - data-prepare.py
    - optm.py
    - models.py
    - model.py
    - data-process.py
    - train.py
    - main.py
    - README.md
    - utils.py
    - make_data.sh
  - joint_cws_parse
    - models
      - metrics.py
      - __init__.py
      - callbacks.py
      - CharParser.py
    - data
      - data_loader.py
      - __init__.py
    - train.py
    - __init__.py
    - README.md
  - __init__.py
  - README.md
  - utils.py
  - legacy
    - Biaffine_parser
      - util.py
      - infer.py
      - run.py
      - main.py
      - cfg.cfg
    - Chinese_word_segmentation
      - cws_io
        cws_reader.py
        __init__.py
      - models
        cws_transformer.py
        __init__.py
        cws_model.py
      - cws.cfg
      - process
        span_converter.py
        __init__.py
        cws_processor.py
      - __init__.py
      - utils.py
    - POS_tagging
      - pos_reader.py
      - train_pos_tag.py
      - pos_tag.cfg
      - utils.py
      - pos_processor.py
    - LSTM+self_attention_sentiment_analysis
      - Word2Idx.py
      - prepare.py
      - dataloader.py
      - predict.py
      - example.py
      - main.py
      - README.md
      - config.cfg
  - Summarization
    - README.md
    - BertSum
      - train_BertSum.py
      - metrics.py
      - dataloader.py
      - model.py
      - callback.py
      - utils.py
    - Baseline
      - train_origin.py
      - train_transformer.py
      - test
        test_dataLoader.py
        testdata
        test_dataloader.py
        __init__.py
      - transformer
        Modules.py
        SubLayers.py
        Translator.py
        Beam.py
        Layers.py
        __init__.py
        Optim.py
        Constants.py
        Models.py
      - test_data.py
      - config
        deeplstm.config
        seqlab.config
        transformer.config
      - train.py
      - tools
        PositionEmbedding.py
        data.py
        logger.py
        __init__.py
        Callback.py
        utils.py
      - model
        LSTMModel.py
        Metric.py
        Encoder.py
        TForiginal.py
        DeepLSTM.py
        __init__.py
        Loss.py
        TransformerModel.py
  - matching
    - matching_cntn.py
    - matching_mwan.py
    - README.md
    - matching_bert.py
    - model
      - cntn.py
      - bert.py
      - esim.py
      - mwan.py
    - matching_esim.py
- .gitignore
- docs
  - Makefile
  - source
    - fastNLP.embeddings.embedding.rst
    - fastNLP.embeddings.utils.rst
    - fastNLP.models.cnn_text_classification.rst
    - fastNLP.rst
    - fastNLP.embeddings.char_embedding.rst
    - fastNLP.modules.decoder.rst
    - fastNLP.models.biaffine_parser.rst
    - fastNLP.modules.utils.rst
    - fastNLP.io.file_utils.rst
    - figures
      - procedures.PNG
      - sequence_labeling.PNG
    - user
      - api_update.rst
      - tutorials.rst
      - quickstart.rst
      - installation.rst
      - example.rst
    - fastNLP.models.star_transformer.rst
    - fastNLP.io.model_io.rst
    - fastNLP.core.sampler.rst
    - fastNLP.embeddings.stack_embedding.rst
    - fastNLP.embeddings.elmo_embedding.rst
    - fastNLP.core.optimizer.rst
    - fastNLP.core.metrics.rst
    - fastNLP.io.embed_loader.rst
    - fastNLP.io.utils.rst
    - fastNLP.models.snli.rst
    - fastNLP.core.const.rst
    - fastNLP.io.data_bundle.rst
    - fastNLP.core.field.rst
    - fastNLP.core.tester.rst
    - fastNLP.core.callback.rst
    - fastNLP.io.pipe.rst
    - fastNLP.core.rst
    - tutorials
      - tutorial_8_modules_models.rst
      - tutorial_5_loss_optimizer.rst
      - extend_3_fitlog.rst
      - tutorial_2_vocabulary.rst
      - tutorial_4_load_dataset.rst
      - 序列标注.rst
      - tutorial_9_callback.rst
      - extend_2_dist.rst
      - 文本分类.rst
      - tutorial_1_data_preprocess.rst
      - extend_1_bert_embedding.rst
      - tutorial_3_embedding.rst
      - tutorial_6_datasetiter.rst
      - tutorial_7_metrics.rst
    - fastNLP.io.loader.rst
    - fastNLP.embeddings.rst
    - fastNLP.core.trainer.rst
    - fastNLP.embeddings.contextual_embedding.rst
    - fastNLP.models.sequence_labeling.rst
    - fastNLP.modules.rst
    - modules.rst
    - fastNLP.core.batch.rst
    - fastNLP.io.rst
    - fastNLP.core.dataset.rst
    - index.rst
    - conf.py
    - fastNLP.embeddings.static_embedding.rst
    - fastNLP.embeddings.bert_embedding.rst
    - fastNLP.core.instance.rst
    - fastNLP.models.bert.rst
    - fastNLP.core.losses.rst
    - fastNLP.models.rst
    - _static
      - notebooks
        tutorial_5_loss_optimizer.ipynb
        tutorial_4_load_dataset.ipynb
        tutorial_2_vocabulary.ipynb
        序列标注.ipynb
        tutorial_9_callback.ipynb
        文本分类.ipynb
        tutorial_8_modules_models.ipynb
        tutorial_6_datasetiter.ipynb
        tutorial_7_metrics.ipynb
        tutorial_1_data_preprocess.ipynb
        tutorial_3_embedding.ipynb
        extend_1_bert_embedding.ipynb
    - fastNLP.modules.encoder.rst
    - fastNLP.core.vocabulary.rst
    - fastNLP.core.utils.rst
  - check_tools.py
  - README.md
  - requirements.txt
- MANIFEST.in

import torch.nn.functional as F
import torch
import random
import numpy as np
from fastNLP import Const
from fastNLP import CrossEntropyLoss
from fastNLP import AccuracyMetric
from fastNLP import Tester
import os
from fastNLP import logger
def should_mask(name, t=''):
    if 'bias' in name:
        return False
    if 'embedding' in name:
        splited = name.split('.')
        if splited[-1]!='weight':
            return False
        if 'embedding' in splited[-2]:
            return False
    if 'c0' in name:
        return False
    if 'h0' in name:
        return False

    if 'output' in name and t not in name:
        return False

    return True
def get_init_mask(model):
    init_masks = {}
    for name, param in model.named_parameters():
        if should_mask(name):
            init_masks[name+'.mask'] = torch.ones_like(param)
            # logger.info(init_masks[name+'.mask'].requires_grad)

    return init_masks

def set_seed(seed):
    random.seed(seed)
    np.random.seed(seed+100)
    torch.manual_seed(seed+200)
    torch.cuda.manual_seed_all(seed+300)

def get_parameters_size(model):
    result = {}
    for name,p in model.state_dict().items():
        result[name] = p.size()

    return result

def prune_by_proportion_model(model,proportion,task):
    # print('this time prune to ',proportion*100,'%')
    for name, p in model.named_parameters():
        # print(name)
        if not should_mask(name,task):
            continue

        tensor = p.data.cpu().numpy()
        index = np.nonzero(model.mask[task][name+'.mask'].data.cpu().numpy())
        # print(name,'alive count',len(index[0]))
        alive = tensor[index]
        # print('p and mask size:',p.size(),print(model.mask[task][name+'.mask'].size()))
        percentile_value = np.percentile(abs(alive), (1 - proportion) * 100)
        # tensor = p
        # index = torch.nonzero(model.mask[task][name+'.mask'])
        # # print('nonzero len',index)
        # alive = tensor[index]
        # print('alive size:',alive.shape)
        # prune_by_proportion_model()

        # percentile_value = torch.topk(abs(alive), int((1-proportion)*len(index[0]))).values
        # print('the',(1-proportion)*len(index[0]),'th big')
        # print('threshold:',percentile_value)

        prune_by_threshold_parameter(p, model.mask[task][name+'.mask'],percentile_value)
        # for

def prune_by_proportion_model_global(model,proportion,task):
    # print('this time prune to ',proportion*100,'%')
    alive = None
    for name, p in model.named_parameters():
        # print(name)
        if not should_mask(name,task):
            continue

        tensor = p.data.cpu().numpy()
        index = np.nonzero(model.mask[task][name+'.mask'].data.cpu().numpy())
        # print(name,'alive count',len(index[0]))
        if alive is None:
            alive = tensor[index]
        else:
            alive = np.concatenate([alive,tensor[index]],axis=0)

    percentile_value = np.percentile(abs(alive), (1 - proportion) * 100)

    for name, p in model.named_parameters():
        if should_mask(name,task):
            prune_by_threshold_parameter(p, model.mask[task][name+'.mask'],percentile_value)


def prune_by_threshold_parameter(p, mask, threshold):
    p_abs = torch.abs(p)

    new_mask = (p_abs > threshold).float()
    # print(mask)
    mask[:]*=new_mask


def one_time_train_and_prune_single_task(trainer,PRUNE_PER,
                                         optimizer_init_state_dict=None,
                                         model_init_state_dict=None,
                                         is_global=None,
                                         ):


    from fastNLP import Trainer


    trainer.optimizer.load_state_dict(optimizer_init_state_dict)
    trainer.model.load_state_dict(model_init_state_dict)
    # print('metrics:',metrics.__dict__)
    # print('loss:',loss.__dict__)
    # print('trainer input:',task.train_set.get_input_name())
    # trainer = Trainer(model=model, train_data=task.train_set, dev_data=task.dev_set, loss=loss, metrics=metrics,
    #                   optimizer=optimizer, n_epochs=EPOCH, batch_size=BATCH, device=device,callbacks=callbacks)


    trainer.train(load_best_model=True)
    # tester = Tester(task.train_set, model, metrics, BATCH, device=device, verbose=1,use_tqdm=False)
    # print('FOR DEBUG: test train_set:',tester.test())
    # print('**'*20)
    # if task.test_set:
    #     tester = Tester(task.test_set, model, metrics, BATCH, device=device, verbose=1)
    #     tester.test()
    if is_global:

        prune_by_proportion_model_global(trainer.model, PRUNE_PER, trainer.model.now_task)

    else:
        prune_by_proportion_model(trainer.model, PRUNE_PER, trainer.model.now_task)



# def iterative_train_and_prune_single_task(get_trainer,ITER,PRUNE,is_global=False,save_path=None):
def iterative_train_and_prune_single_task(get_trainer,args,model,train_set,dev_set,test_set,device,save_path=None):

    '''

    :param trainer:
    :param ITER:
    :param PRUNE:
    :param is_global:
    :param save_path: should be a dictionary which will be filled with mask and state dict
    :return:
    '''



    from fastNLP import Trainer
    import torch
    import math
    import copy
    PRUNE = args.prune
    ITER = args.iter
    trainer = get_trainer(args,model,train_set,dev_set,test_set,device)
    optimizer_init_state_dict = copy.deepcopy(trainer.optimizer.state_dict())
    model_init_state_dict = copy.deepcopy(trainer.model.state_dict())
    if save_path is not None:
        if not os.path.exists(save_path):
            os.makedirs(save_path)
        # if not os.path.exists(os.path.join(save_path, 'model_init.pkl')):
        #     f = open(os.path.join(save_path, 'model_init.pkl'), 'wb')
        #     torch.save(trainer.model.state_dict(),f)


    mask_count = 0
    model = trainer.model
    task = trainer.model.now_task
    for name, p in model.mask[task].items():
        mask_count += torch.sum(p).item()
    init_mask_count = mask_count
    logger.info('init mask count:{}'.format(mask_count))
    # logger.info('{}th traning mask count: {} / {} = {}%'.format(i, mask_count, init_mask_count,
    #                                                             mask_count / init_mask_count * 100))

    prune_per_iter = math.pow(PRUNE, 1 / ITER)


    for i in range(ITER):
        trainer = get_trainer(args,model,train_set,dev_set,test_set,device)
        one_time_train_and_prune_single_task(trainer,prune_per_iter,optimizer_init_state_dict,model_init_state_dict)
        if save_path is not None:
            f = open(os.path.join(save_path,task+'_mask_'+str(i)+'.pkl'),'wb')
            torch.save(model.mask[task],f)

        mask_count = 0
        for name, p in model.mask[task].items():
            mask_count += torch.sum(p).item()
        logger.info('{}th traning mask count: {} / {} = {}%'.format(i,mask_count,init_mask_count,mask_count/init_mask_count*100))


def get_appropriate_cuda(task_scale='s'):
    if task_scale not in {'s','m','l'}:
        logger.info('task scale wrong!')
        exit(2)
    import pynvml
    pynvml.nvmlInit()
    total_cuda_num = pynvml.nvmlDeviceGetCount()
    for i in range(total_cuda_num):
        logger.info(i)
        handle = pynvml.nvmlDeviceGetHandleByIndex(i)  # 这里的0是GPU id
        memInfo = pynvml.nvmlDeviceGetMemoryInfo(handle)
        utilizationInfo = pynvml.nvmlDeviceGetUtilizationRates(handle)
        logger.info(i, 'mem:', memInfo.used / memInfo.total, 'util:',utilizationInfo.gpu)
        if memInfo.used / memInfo.total < 0.15 and utilizationInfo.gpu <0.2:
            logger.info(i,memInfo.used / memInfo.total)
            return 'cuda:'+str(i)

    if task_scale=='s':
        max_memory=2000
    elif task_scale=='m':
        max_memory=6000
    else:
        max_memory = 9000

    max_id = -1
    for i in range(total_cuda_num):
        handle = pynvml.nvmlDeviceGetHandleByIndex(0)  # 这里的0是GPU id
        memInfo = pynvml.nvmlDeviceGetMemoryInfo(handle)
        utilizationInfo = pynvml.nvmlDeviceGetUtilizationRates(handle)
        if max_memory < memInfo.free:
            max_memory = memInfo.free
            max_id = i

    if id == -1:
        logger.info('no appropriate gpu, wait!')
        exit(2)

    return 'cuda:'+str(max_id)

        # if memInfo.used / memInfo.total < 0.5:
        #     return

def print_mask(mask_dict):
    def seq_mul(*X):
        res = 1
        for x in X:
            res*=x
        return res

    for name,p in mask_dict.items():
        total_size = seq_mul(*p.size())
        unmasked_size = len(np.nonzero(p))

        print(name,':',unmasked_size,'/',total_size,'=',unmasked_size/total_size*100,'%')


    print()


def check_words_same(dataset_1,dataset_2,field_1,field_2):
    if len(dataset_1[field_1]) != len(dataset_2[field_2]):
        logger.info('CHECK: example num not same!')
        return False

    for i, words in enumerate(dataset_1[field_1]):
        if len(dataset_1[field_1][i]) != len(dataset_2[field_2][i]):
            logger.info('CHECK {} th example length not same'.format(i))
            logger.info('1:{}'.format(dataset_1[field_1][i]))
            logger.info('2:'.format(dataset_2[field_2][i]))
            return False

        # for j,w in enumerate(words):
        #     if dataset_1[field_1][i][j] != dataset_2[field_2][i][j]:
        #         print('CHECK', i, 'th example has words different!')
        #         print('1:',dataset_1[field_1][i])
        #         print('2:',dataset_2[field_2][i])
        #         return False

    logger.info('CHECK: totally same!')

    return True

def get_now_time():
    import time
    from datetime import datetime, timezone, timedelta
    dt = datetime.utcnow()
    # print(dt)
    tzutc_8 = timezone(timedelta(hours=8))
    local_dt = dt.astimezone(tzutc_8)
    result = ("_{}_{}_{}__{}_{}_{}".format(local_dt.year, local_dt.month, local_dt.day, local_dt.hour, local_dt.minute,
                                      local_dt.second))

    return result


def get_bigrams(words):
    result = []
    for i,w in enumerate(words):
        if i!=len(words)-1:
            result.append(words[i]+words[i+1])
        else:
            result.append(words[i]+'<end>')

    return result

def print_info(*inp,islog=False,sep=' '):
    from fastNLP import logger
    if islog:
        print(*inp,sep=sep)
    else:
        inp = sep.join(map(str,inp))
        logger.info(inp)

def better_init_rnn(rnn,coupled=False):
    import torch.nn as nn
    if coupled:
        repeat_size = 3
    else:
        repeat_size = 4
    # print(list(rnn.named_parameters()))
    if hasattr(rnn,'num_layers'):
        for i in range(rnn.num_layers):
            nn.init.orthogonal(getattr(rnn,'weight_ih_l'+str(i)).data)
            weight_hh_data = torch.eye(rnn.hidden_size)
            weight_hh_data = weight_hh_data.repeat(1, repeat_size)
            with torch.no_grad():
                getattr(rnn,'weight_hh_l'+str(i)).set_(weight_hh_data)
            nn.init.constant(getattr(rnn,'bias_ih_l'+str(i)).data, val=0)
            nn.init.constant(getattr(rnn,'bias_hh_l'+str(i)).data, val=0)

        if rnn.bidirectional:
            for i in range(rnn.num_layers):
                nn.init.orthogonal(getattr(rnn, 'weight_ih_l' + str(i)+'_reverse').data)
                weight_hh_data = torch.eye(rnn.hidden_size)
                weight_hh_data = weight_hh_data.repeat(1, repeat_size)
                with torch.no_grad():
                    getattr(rnn, 'weight_hh_l' + str(i)+'_reverse').set_(weight_hh_data)
                nn.init.constant(getattr(rnn, 'bias_ih_l' + str(i)+'_reverse').data, val=0)
                nn.init.constant(getattr(rnn, 'bias_hh_l' + str(i)+'_reverse').data, val=0)


    else:
        nn.init.orthogonal(rnn.weight_ih.data)
        weight_hh_data = torch.eye(rnn.hidden_size)
        weight_hh_data = weight_hh_data.repeat(repeat_size,1)
        with torch.no_grad():
            rnn.weight_hh.set_(weight_hh_data)
        # The bias is just set to zero vectors.
        print('rnn param size:{},{}'.format(rnn.weight_hh.size(),type(rnn)))
        if rnn.bias:
            nn.init.constant(rnn.bias_ih.data, val=0)
            nn.init.constant(rnn.bias_hh.data, val=0)

    # print(list(rnn.named_parameters()))