java source code of DistributeMiniBatchLearner

amr-master
- build.xml
- sentences.txt
- utils
  - config.sh
  - prepdata-ldc.sh
  - extendvocab.py
  - smatch
    - bug-gold.txt
    - sample_file_list
    - smatch-table.py
    - amr.py
    - test_input1.txt
    - README.txt
    - update_log
    - bug-candidate.txt
    - esem-format-check.pl
    - smatch.py
    - test_input2.txt
  - giza
    - giza_config
    - getAllGizaFiles.sh
    - giza-pp
      - Makefile
      - GIZA++-v2
        myassert.h
        model1.h
        transpair_modelhmm.h
        snt2cooc.cpp
        TTables.cpp
        transpair_model4.cpp
        trainGIZA++.sh
        Pointer.h
        model3_viterbi_with_tricks.cpp
        logprob.h
        Globals.h
        MoveSwapMatrix.h
        main.cpp
        plain2snt.cpp
        Makefile
        utility.cpp
        transpair_model2.h
        model345-peg.cpp
        model3.cpp
        model3_viterbi.cpp
        model2.cpp
        Dictionary.h
        D4Tables.h
        Makefile.definitions
        HMMTables.cpp
        transpair_model5.h
        D5Tables.h
        Array2.h
        myassert.cpp
        mystl.h
        transpair_model1.h
        Array4.h
        alignment.cpp
        LICENSE
        dependencies
        README
        transpair_model4.h
        model3.h
        hmm.h
        Dictionary.cpp
        mymath.h
        NTables.h
        defs.h
        Parameter.h
        logprob.cpp
        Parameter.cpp
        Perplexity.cpp
        GNU.GPL
        AlignTables.h
        transpair_model3.h
        MoveSwapMatrix.cpp
        collCounts.cpp
        Perplexity.h
        utility.h
        small_snt2cooc.cpp
        ForwardBackward.cpp
        NTables.cpp
        Makefile.src
        ATables.h
        transpair_model5.cpp
        reports.cpp
        getSentence.cpp
        model2to3.cpp
        snt2plain.cpp
        Array.h
        model1.cpp
        vocab.h
        AlignTables.cpp
        FlexArray.h
        transpair_model3.cpp
        ATables.cpp
        model2.h
        file_spec.h
        alignment.h
        vocab.cpp
        .gitignore
        HMMTables.h
        WordClasses.h
        hmm.cpp
        collCounts.h
        parse.cpp
        getSentence.h
        ForwardBackward.h
        TTables.h
        Vector.h
      - README
      - mkcls-v2
        myassert.h
        general.cpp
        general.h
        ProblemTest.cpp
        PopOptimization.h
        MSBOptimization.cpp
        HCOptimization.cpp
        MYOptimization.cpp
        Makefile
        StatVar.h
        TAOptimization.h
        KategProblem.cpp
        myleda.h
        KategProblemWBC.h
        IterOptimization.cpp
        Optimization.h
        GDAOptimization.cpp
        KategProblemTest.h
        Problem.h
        mystl.h
        KategProblemWBC.cpp
        GDAOptimization.h
        RRTOptimization.cpp
        KategProblemTest.cpp
        LICENSE
        README
        MSBOptimization.h
        SAOptimization.h
        KategProblemKBC.cpp
        TAOptimization.cpp
        FixedArray.h
        my.h
        Optimization.cpp
        Problem.cpp
        GNU.GPL
        KategProblem.h
        KategProblemKBC.h
        mkcls.cpp
        makePackage.sh
        Array.h
        MYOptimization.h
        StatVar.cpp
        FlexArray.h
        .gitignore
        PopOptimization.cpp
        HCOptimization.h
        IterOptimization.h
        ProblemTest.h
        RRTOptimization.h
        SAOptimization.cpp
    - translate_ids_to_words.py
    - getGizaInputs.py
  - pysrc
    - expand_shifts.py
    - augment_jamr.py
    - strip_hyphens.py
    - txt2amr.py
    - split_to_folds.py
  - jamr
    - compile
    - src
      - CorpusTool.scala
      - ConceptInvoke
        Decoder.scala
        Decoder1.scala
        Concepts.scala
        package.scala
        PhraseConceptPair.scala
        TrainObj.scala
        PhraseFeatures.scala
        Features.scala
        Input.scal
        Oracle.scala
      - AlignSpans.scala
      - TestAMRDisplayCode.scala
      - LazyArray.sh
      - Train
        MiniBatch.scala
        Optimizer.scala
        TrainObj.scala
        AbstractFeatureVector.scala
      - Corpus.scala
      - Graph.scala
      - Aligner_orig.scal
      - GraphDecoder
        Decoder.scala
        Alg1.scala
        Alg2.scala
        package.scala
        TrainObj.scala
        Test.scala
        GraphObj.scala
        CostAugmented.scala
        DualDecomposition.scala
        Features.scala
        LagrangianRelaxation.scala
        Oracle.scala
      - FString.scala
      - JointDecoder
        Decoder.scala
        package.scala
        Oracle.scala
      - AMRTrainingData.scala
      - package.scala
      - AlignSpans3.scala
      - IllinoisNERConvert
      - EvalSpans.scala
      - Input.scala
      - StanfordProcessor.scala
      - Wordnet.scala
      - FastFeatureVector
        package.scala
        Adagrad.scala
        FeatureVector.scala
        DecoderResult.scala
        SSGD.scala
      - PrintSpans.scala
      - CycleTester.scala
      - AlignWords.scala
      - Dependency.scala
      - BasicFeatureVector
        package.scala
        Perceptron.scala
        Adagrad.scala
        FeatureVector.scala
        DecoderResult.scala
        SSGD.scala
      - Entity.scala
      - AMRParser.scala
      - mkConceptTable
      - AlignSpans2.scala
      - CheckAMR.scala
      - Aligner.scala
      - TestAMRCode.scala
      - LazyArray.scala
      - Annotation.scala
      - Span.scala
      - AlignerTool.scal
      - Node.scala
      - SpanLoader.scala
    - resources
      - labelset-r4
      - labelset-r3
    - setup
    - project
      - plugins.sbt
    - lib
    - sbt
    - README.md
    - scripts
      - smatch_v1_0
        sample_file_list
        smatch-table.py
        amr.py
        smatch_orig.py
        test_input1.txt
        README.txt
        update_log
        esem-format-check.pl
        test_input2.txt
        smatch_modified.py
      - train_LDC2014E41.sh
      - config.sh
      - ALIGN.sh
      - train_LDC2013E117.sh
      - training
        cmd.stage2-weights
        cmd.test.decode.allstages
        cmd.stage1-weights
        cmd.conceptTable.train
        cmd.test.decode.stage2only
      - config_ACL2014_LDC2014T12-proxy.sh
      - config_ACL2014_LDC2014T12.sh
      - EVAL.sh
      - TRAIN.sh
      - train_LDC2014T12-proxy.sh
      - config_ACL2014_LDC2014E41.sh
      - PARSE_IT.sh
      - train_LDC2014T12.sh
      - preprocessing
        cmd.aligned.no_opN
        nltot
        ttonl
        cmd.snt.tok
        cmd.aligned.concepts_no_opN
        LDC2014E41
        README.md
        make_splits.sh
        PREPROCESS.sh
        IllinoisNER.config
        cmd.snt
        cmd.aligned.log
        LDC2013E117
        README.md
        make_splits.sh
        cmd.snt.tok.deps
        cmd.tok
        cmd.snt.IllinoisNER
        cmd.aligned
        LDC2014T12
        README.md
        make_splits.sh
      - config_Little_Prince.sh
      - hand_alignments
        LDC2013E117
        patch.hand_align
        cmd.hand_align.txt
        snt.ids
      - train_Little_Prince.sh
      - PARSE.sh
      - config_ACL2014_LDC2013E117.sh
    - build.sbt
    - run
    - .gitignore
    - docs
      - Parser_Performance.md
      - Nodes_and_Edges_Format.md
      - Hand_Alignments.md
      - Alignment_Format.md
      - Config_File.md
      - Alignment_Evaluation.md
      - README.md
      - Step_by_Step_Training.md
    - LICENSE.txt
    - run-scala-script
- resources
  - parseutil.exp
  - amr.specmap
  - amr.shifts
  - amr.specmap.org
  - amr.types
  - amr.shifts.org
  - amr.ner.limited
  - latex.mapping
  - amr.ner
  - amr.ner.extended
  - IllinoisNER.config
  - seed.lex
  - generic.lex
  - data
    - seed.lamlex
    - seed
      - amr-release-1.0-training.proxy.seed.50.lamlex
      - amr-release-1.0-training.proxy.seed.27.lamlex
      - amr-release-1.0-training.proxy.seed.18.fail.lamlex
      - amr-release-1.0-training.proxy.seed.22.fail.lamlex
      - amr-release-1.0-training.proxy.seed.26.lamlex
      - amr-release-1.0-training.proxy.seed.37.lamlex
      - amr-release-1.0-training.proxy.seed.30.lamlex
      - amr-release-1.0-training.proxy.seed.04.fail.lamlex
      - amr-release-1.0-training.proxy.seed.07.tagfail.lamlex
      - amr-release-1.0-training.proxy.seed.17.tagfail.lamlex
      - amr-release-1.0-training.proxy.seed.12.lamlex
      - amr-release-1.0-training.proxy.seed.32.lamlex
      - amr-release-1.0-training.proxy.seed.36.lamlex
      - amr-release-1.0-training.proxy.seed.44.lamlex
      - amr-release-1.0-training.proxy.seed.48.lamlex
      - amr-release-1.0-training.proxy.seed.06.tagfail.lamlex
      - amr-release-1.0-training.proxy.seed.14.lamlex
      - amr-release-1.0-training.proxy.seed.19.lamlex
      - amr-release-1.0-training.proxy.seed.33.lamlex
      - amr-release-1.0-training.proxy.seed.13.tagfail.lamlex
      - amr-release-1.0-training.proxy.seed.20.lamlex
      - amr-release-1.0-training.proxy.seed.51.lamlex
      - amr-release-1.0-training.proxy.seed.08.lamlex
      - amr-release-1.0-training.proxy.seed.01.fail.lamlex
      - amr-release-1.0-training.proxy.seed.25.lamlex
      - amr-release-1.0-training.proxy.seed.39.lamlex
      - amr-release-1.0-training.proxy.seed.45.lamlex
      - amr-release-1.0-training.proxy.seed.21.lamlex
      - amr-release-1.0-training.proxy.seed.03.lamlex
      - amr-release-1.0-training.proxy.seed.34.lamlex
      - preV1seed
        deft-amr-release-r3-proxy.seed.6.yoav.lamlex
        deft-amr-release-r3-proxy.seed.3-1.yoav.lamlex
        deft-amr-release-r3-proxy.seed.8.yoav.lamlex
        deft-amr-release-r3-proxy.seed.14.yoav.lamlex
        deft-amr-release-r3-proxy.seed.7-2.yoav.lamlex
        deft-amr-release-r3-proxy.seed.10.yoav.lamlex
        deft-amr-release-r3-proxy.seed.11.yoav.lamlex
        deft-amr-release-r3-proxy.seed.5.yoav.lamlex
        deft-amr-release-r3-proxy.seed.4.yoav.lamlex.fail
        test
        deft-amr-release-r3-proxy.seed.9.yoav.lamlex
        deft-amr-release-r3-proxy.seed.17.yoav.lamlex
        deft-amr-release-r3-proxy.seed.12.yoav.lamlex
        deft-amr-release-r3-proxy.seed.18.yoav.lamlex
        deft-amr-release-r3-proxy.seed.13.yoav.lamlex
        deft-amr-release-r3-proxy.seed.15.yoav.lamlex
        deft-amr-release-r3-proxy.seed.9.yoav.lamlex
        deft-amr-release-r3-proxy.seed.16.yoav.lamlex
        deft-amr-release-r3-proxy.seed.1-1.yoav.lamlex
        deft-amr-release-r3-proxy.seed.2.yoav.lamlex
      - amr-release-1.0-training.proxy.seed.41.fail.lamlex
      - amr-release-1.0-training.proxy.seed.46.fail.lamlex
      - amr-release-1.0-training.proxy.seed.05.lamlex
      - amr-release-1.0-training.proxy.seed.28.lamlex
      - amr-release-1.0-training.proxy.seed.10.lamlex
      - amr-release-1.0-training.proxy.seed.09.tagfail.lamlex
      - amr-release-1.0-training.proxy.seed.11.lamlex
      - amr-release-1.0-training.proxy.seed.40.lamlex
      - amr-release-1.0-training.proxy.seed.24.tagfail.lamlex
      - amr-release-1.0-training.proxy.seed.49.lamlex
      - amr-release-1.0-training.proxy.seed.43.lamlex
      - amr-release-1.0-training.proxy.seed.47.lamlex
      - amr-release-1.0-training.proxy.seed.16.fail.lamlex
      - amr-release-1.0-training.proxy.seed.52.lamlex
      - deploy.sh
      - amr-release-1.0-training.proxy.seed.38.fail.lamlex
      - amr-release-1.0-training.proxy.seed.31.lamlex
      - amr-release-1.0-training.proxy.seed.35.fail.lamlex
      - amr-release-1.0-training.proxy.seed.29.lamlex
      - amr-release-1.0-training.proxy.seed.02.lamlex
      - amr-release-1.0-training.proxy.seed.23.lamlex
      - amr-release-1.0-training.proxy.seed.42.lamlex
      - amr-release-1.0-training.proxy.seed.15.tagfail.lamlex
    - .gitignore
  - init.weights
  - amr.ontology
  - parser.inc
  - vocab
- build.properties
- LICENSE
- amr
  - src
    - edu
      - uw
        cs
        lil
        amr
        exp
        AmrExp.java
        AmrResourceRepo.java
        ParseJob.java
        AmrGenericExperiment.java
        test
        AmrExecTester.java
        SmatchStats.java
        AmrDistributedExecTester.java
        util
        mapping
        SpecifierMapper.java
        dataprep
        SplitFolds.java
        RefreshSeed.java
        giza
        CreateGizaInputFile.java
        lexicalgen
        NamedEntitiesCandidates.java
        LemmatizeCandidates.java
        convert
        LambdaToAMR.java
        AMRToLambda.java
        parseutil
        AMRTestParseUtil.java
        propbank
        PropBank.java
        PropBankPredicate.java
        PropBankFrame.java
        PropBankReader.java
        PropBankRole.java
        ner
        IllinoisNERWrapper.java
        RecognizedNamedEntity.java
        Main.java
        lambda
        SortConjunctions.java
        Underspecify.java
        GetAllSkolemTerms.java
        GetAmrSubExpressions.java
        InstanceClone.java
        AMRServices.java
        IsUnderspecifiedAndStripped.java
        OverloadedLogicalConstant.java
        StripOverload.java
        convert
        LogicalExpressionToAmr.java
        AmrToLogicalExpressionConverter.java
        SpecificationMapping.java
        learn
        postprocessing
        AddAllAlignments.java
        online
        AbstractGradLearner.java
        AbstractOnlineLearner.java
        OnlineLearner.java
        estimators
        ScalingEstimator.java
        DecayingEstimator.java
        AdaGradEstimator.java
        IWeightUpdateProcedure.java
        AbstractAdaGradEstimator.java
        gradient
        SimpleGradient.java
        StatUpdates.java
        GradientComputation.java
        GradientChecker.java
        IGradientFunction.java
        AbstractLearner.java
        LearningServices.java
        tasks
        TestLearningTask.java
        LoggingLearningTask.java
        SaveLearningTask.java
        LearningStateSnapshotTask.java
        genlex
        AmrLexicalGenerationFilter.java
        SplittingGenlex.java
        TextEntitiesGenlex.java
        AlignmentGenlex.java
        PreciseGenlexWrapper.java
        filter
        AMRSupervisedFilter.java
        AMRSupervisedFilterFactory.java
        batch
        AbstractBatchLearner.java
        BatchLearner.java
        distributed
        AbstractDistributedBatchLearner.java
        HybridDistributedBatchLearner.java
        DistributeMiniBatchLearner.java
        HybridBatchLearner.java
        AbstractVanillaBatchLearner.java
        voting
        MaxVotingFunction.java
        MaxVoting.java
        MaxLexemeVoting.java
        StubVoting.java
        data
        LabeledAmrSentenceLexCollection.java
        AmrSentenceCollection.java
        QuickFilter.java
        Tokenizer.java
        RefFilter.java
        LabeledAmrSentenceCollection.java
        LabeledAmrSentenceLex.java
        AMRMeta.java
        LabeledAmrSentence.java
        ontology
        AMROntology.java
        features
        DynamicLexicalGeneratorFeatures.java
        AttachmentFeatures.java
        ParseStepSyntaxFeatures.java
        SemanticShiftingFeatureSet.java
        ShiftingRuleFeatureSet.java
        CrossingRuleFeatureSet.java
        AttributePOSTagFeatures.java
        SloppyLexiconFeatures.java
        AmrLexicalFeatures.java
        Init.java
        jamr
        alignment
        GetAlignedSubExp.java
        AlignmentServices.java
        ccgbank
        easyccg
        EasyCCGWrapper.java
        ISuperTagger.java
        IBankParser.java
        CcgBankServices.java
        parser
        EvaluationResult.java
        AbstractAmrParser.java
        InferenceMethod.java
        ProbEvaluationResult.java
        constraints
        UnaryLexicalConstraint.java
        AmrDerivation.java
        AbstractAmrParserOutput.java
        SloppyAmrClosure.java
        AmrParsingFilter.java
        GraphAmrParser.java
        factorgraph
        visitor
        GetMapping.java
        GetExpression.java
        GetVariables.java
        GetFactors.java
        GetEdges.java
        FactorGraphToString.java
        GetMaxEvaluations.java
        MarginalsProduct.java
        IFactorGraphVisitor.java
        table
        ITableImmutable.java
        ColumnHeader.java
        Table.java
        MappingPair.java
        assignmentgen
        AssignmentGeneratorFactory.java
        AssignmentGeneratorFactoryStub.java
        AssignmentGenerator.java
        IAssignmentGeneratorFactory.java
        nodes
        AbstractDummyNode.java
        LiteralNode.java
        Edge.java
        IBaseNode.java
        VariableNode.java
        AbstractVariableNode.java
        INode.java
        CreateFactorGraph.java
        LogicalConstantNode.java
        LambdaNode.java
        SkolemIdNode.java
        IFactor.java
        Factor.java
        features
        UnaryBiasFeatures.java
        SurfaceFormFeature.java
        RefControlFeatureSet.java
        FactorGraphFeatureServices.java
        IFactorGraphFeatureSet.java
        ClosureFeature.java
        RelationSelectionalPreference.java
        FactorGraph.java
        inference
        BeamSearch.java
        LoopyBP.java
        IsValidAmr.java
        rules
        amrspecials
        dummyref
        SentenceWithDummy.java
        DummyEntityServices.java
        NounPhraseWithDummy.java
        NamedEntityKeywordCoordination.java
        DetermineNamedEntity.java
        keywords
        NamedEntityStamp.java
        KeywordUtil.java
        DateStamp.java
        SingleKeyword.java
        KeywordCoordinationInit.java
        AbstractNpKeyword.java
        coordination
        CoordinationCXRaisedApplyBackward.java
        ExtractTypedSubExpression.java
        CoordinationSyntax.java
        CoordinationCX4Rule.java
        CoordinationRuleSet.java
        AbstractCoordinationCXRaisedApply.java
        CoordinationCX1Rule.java
        CoordinationCX2Rule.java
        CoordinationCX3Rule.java
        CoordinationCXRaisedApplyForward.java
        CoordinationC1Rule.java
        CoordinationServices.java
        CoordinationC2Rule.java
        AbstractCoordinationCXRule.java
        LexConstants.java
        MergeNamedEntities.java
        lexicon
        UnderspecifiedLexiconCreator.java
        PseudoFactoredLexiconCreator.java
        genlex
        DatesGenerator.java
        NumeralGenerator.java
        NamedEntityGenerator.java
        GraphAmrDerivation.java
        GraphAmrParserOutput.java
        exec
        ExecOutput.java
        SloppyLexicon.java
        Exec.java
        Execution.java
  - .settings
    - org.eclipse.jdt.core.prefs
  - src-test
    - edu
      - uw
        cs
        lil
        amr
        TestServices.java
        lambda
        GetAmrSubExpressionsTest.java
        InstanceCloneTest.java
        convert
        LogicalExpressionToAmrTest.java
        AmrToLogicalExpressionConverterTest.java
        SortConjunctionsTest.java
        features
        AttachmentFeaturesTest.java
        jamr
        alignment
        GetAlignedSubExpTest.java
        parser
        IsValidAmrTest.java
        factorgraph
        table
        TableTest.java
        features
        RefControlFeatureSetTest.java
        inference
        LoopyBPTest.java
        BeamSearchTest.java
        SloppyAmrClosureTest.java
        rules
        amrspecials
        DetermineNamedEntityTest.java
        coordination
        ExtractTypedSubExpressionTest.java
        MergeNamedEntitiesTest.java
        genlex
        DatesGeneratorTest.java
        filter
        AMRSupervisedFilterFactoryTest.java
  - .project
  - .classpath
- ec2sync.sh
- getres.sh
- worker.init.script.ft
- experiments
  - dev.proxy.resume
    - dev.proxy.resume.inc
    - dev.proxy.resume.exp
    - README
    - dev.proxy.resume.dist.exp
    - .gitignore
  - data.inc
  - test.proxy
    - test.proxy.inc
    - README
    - test.proxy.exp
    - test.proxy.dist.exp
    - .gitignore
  - jobs.inc
  - data.proxy.inc
  - resources.proxy.inc
  - params.inc
  - dev.proxy.test
    - dev.proxy.test.exp
    - README
    - dev.proxy.test.inc
    - dev.proxy.test.dist.exp
    - .gitignore
  - parse
    - parse.exp
    - README
    - parse.inc
    - .gitignore
  - dev.proxy.augment
    - README
    - dev.proxy.augment.inc
    - .gitignore
    - dev.proxy.augment.exp
  - test.inc
  - data.cache
    - README
    - datacache.exp
  - seedonly
    - README
    - seedonly.exp
    - seedonly.inc
    - .gitignore
  - dev.proxy.noref.test
    - dev.proxy.noref.test.exp
    - README
    - dev.proxy.noref.test.dist.exp
    - dev.proxy.noref.test.inc
    - .gitignore
  - filter.inc
  - model.load.inc
  - init.inc
  - dist.inc
  - learn.inc
  - dev.proxy.noref
    - README
    - dev.proxy.noref.inc
    - dev.proxy.noref.dist.exp
    - .gitignore
    - dev.proxy.noref.exp
  - preprocess.inc
  - model.inc
  - log.inc
  - dev.proxy
    - dev.proxy.inc
    - README
    - dev.proxy.exp
    - dev.proxy.dist.exp
    - .gitignore
  - worker
    - README
    - worker.exp
    - .gitignore
  - jobs.dist.inc
- README.md
- .gitignore

package edu.uw.cs.lil.amr.learn.batch.distributed;

import java.io.Serializable;
import java.util.ArrayList;
import java.util.HashSet;
import java.util.Iterator;
import java.util.List;
import java.util.Map;
import java.util.Set;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.TimeoutException;
import java.util.function.BiFunction;
import java.util.function.Function;
import java.util.function.IntConsumer;
import java.util.function.Predicate;

import edu.cornell.cs.nlp.spf.base.hashvector.HashVectorFactory;
import edu.cornell.cs.nlp.spf.base.hashvector.IHashVector;
import edu.cornell.cs.nlp.spf.ccg.categories.ICategoryServices;
import edu.cornell.cs.nlp.spf.ccg.lexicon.ILexiconImmutable;
import edu.cornell.cs.nlp.spf.ccg.lexicon.LexicalEntry;
import edu.cornell.cs.nlp.spf.ccg.lexicon.Lexicon;
import edu.cornell.cs.nlp.spf.data.collection.IDataCollection;
import edu.cornell.cs.nlp.spf.data.situated.sentence.SituatedSentence;
import edu.cornell.cs.nlp.spf.explat.IResourceRepository;
import edu.cornell.cs.nlp.spf.explat.ParameterizedExperiment;
import edu.cornell.cs.nlp.spf.explat.ParameterizedExperiment.Parameters;
import edu.cornell.cs.nlp.spf.explat.resources.IResourceObjectCreator;
import edu.cornell.cs.nlp.spf.explat.resources.usage.ResourceUsage;
import edu.cornell.cs.nlp.spf.genlex.ccg.ILexiconGenerator;
import edu.cornell.cs.nlp.spf.genlex.ccg.ILexiconGeneratorPrecise;
import edu.cornell.cs.nlp.spf.mr.lambda.LogicalExpression;
import edu.cornell.cs.nlp.spf.parser.ParsingOp;
import edu.cornell.cs.nlp.spf.parser.joint.IJointInferenceFilter;
import edu.cornell.cs.nlp.spf.parser.joint.IJointInferenceFilterFactory;
import edu.cornell.cs.nlp.spf.parser.joint.IJointOutputLogger;
import edu.cornell.cs.nlp.spf.parser.joint.JointInferenceFilterUtils;
import edu.cornell.cs.nlp.spf.parser.joint.model.IJointDataItemModel;
import edu.cornell.cs.nlp.spf.parser.joint.model.IJointModelImmutable;
import edu.cornell.cs.nlp.spf.parser.joint.model.JointModel;
import edu.cornell.cs.nlp.spf.reliabledist.JobFuture;
import edu.cornell.cs.nlp.spf.reliabledist.ReliableManager;
import edu.uw.cs.lil.amr.data.AMRMeta;
import edu.uw.cs.lil.amr.data.LabeledAmrSentence;
import edu.uw.cs.lil.amr.learn.batch.voting.StubVoting;
import edu.uw.cs.lil.amr.learn.estimators.IWeightUpdateProcedure;
import edu.uw.cs.lil.amr.learn.gradient.GradientComputation;
import edu.uw.cs.lil.amr.learn.gradient.IGradientFunction;
import edu.uw.cs.lil.amr.parser.GraphAmrParser;
import edu.uw.cs.lil.amr.parser.IsValidAmr;

/**
 * Distributed learner. Each epoch includes two main passes: lexical generation
 * and parameter estimation. Lexical generation is done with a batch pass that
 * is fully distributed. Parameter estimation is done with mini batches. Each
 * mini batch is distributed.
 *
 * @author Yoav Artzi
 */
public class DistributeMiniBatchLearner
		extends AbstractDistributedBatchLearner {

	private final int batchSize;

	public DistributeMiniBatchLearner(int numIterations,
			IDataCollection<LabeledAmrSentence> trainingData, boolean sortData,
			int maxSentenceLength, GraphAmrParser parser,
			IJointOutputLogger<LogicalExpression, LogicalExpression, LogicalExpression> parserOutputLogger,
			ICategoryServices<LogicalExpression> categoryServices,
			ILexiconGeneratorPrecise<LabeledAmrSentence, LogicalExpression, IJointModelImmutable<SituatedSentence<AMRMeta>, LogicalExpression, LogicalExpression>> genlex,
			IJointInferenceFilterFactory<LabeledAmrSentence, LogicalExpression, LogicalExpression, LogicalExpression> filterFactory,
			IntConsumer postIteration, boolean pruneLexicon,
			BiFunction<Predicate<LexicalEntry<LogicalExpression>>, Map<LexicalEntry<LogicalExpression>, Double>, Set<LexicalEntry<LogicalExpression>>> votingProcedure,
			ReliableManager manager, int batchSize,
			IWeightUpdateProcedure estimator,
			IGradientFunction gradientFunction,
			Integer conditionedInferenceBeam,
			ILexiconGenerator<LabeledAmrSentence, LogicalExpression, IJointModelImmutable<SituatedSentence<AMRMeta>, LogicalExpression, LogicalExpression>> alignmentGenlex,
			boolean resumedLearning,
			ILexiconImmutable<LogicalExpression> entriesNotToPrune) {
		super(numIterations, trainingData, sortData, maxSentenceLength, parser,
				parserOutputLogger, categoryServices, genlex, filterFactory,
				postIteration, pruneLexicon, votingProcedure, manager,
				estimator, gradientFunction, conditionedInferenceBeam,
				alignmentGenlex, resumedLearning, entriesNotToPrune);
		this.batchSize = batchSize;
		LOG.info("Init %s: batchSize=%d", getClass().getSimpleName(),
				batchSize);
	}

	@Override
	protected Set<LexicalEntry<LogicalExpression>> doParameterEstimation(
			JointModel<SituatedSentence<AMRMeta>, LogicalExpression, LogicalExpression> model,
			int epochNumber) {
		final long startTime = System.currentTimeMillis();

		if (!remoteModelIsUpToDate) {
			// Update the environment.
			// Update the entire model. This is the only time we do it. Further
			// updates will be incremental. We never update the structure of the
			// model, just the parameters. This is why we can do incremental
			// updates easily. And it will save transfer costs.
			if (!manager
					.updateEnviroment(LearningEnvironment.setModel(model))) {
				LOG.error("Failed to update environment");
				throw new IllegalStateException();
			}
			remoteModelIsUpToDate = true;
		}

		final Iterator<LabeledAmrSentence> dataIterator = trainingData
				.iterator();
		int itemCounter = -1;
		long computeTime = 0;
		int miniBatchCounter = -1;
		final Set<LexicalEntry<LogicalExpression>> viterbiEntries = new HashSet<>();
		while (dataIterator.hasNext()) {

			LOG.info("======================= [%d.%d / PARAM]", epochNumber,
					++miniBatchCounter);

			// Create the mini batch and submit the jobs.
			int batchBaseNumber = itemCounter;
			final List<LabeledAmrSentence> batch = new ArrayList<>(batchSize);
			final List<JobFuture<GradientResult>> futures = new ArrayList<>(
					batchSize);
			while (batch.size() < batchSize && dataIterator.hasNext()) {
				final LabeledAmrSentence dataItem = dataIterator.next();
				batch.add(dataItem);
				futures.add(manager.execute(new GradientJob(dataItem,
						epochNumber, ++batchBaseNumber)));
			}

			// Wait for all jobs to complete.
			boolean working = true;
			final long distStartTime = System.currentTimeMillis();
			while (working) {
				working = false;
				int completed = 0;
				JobFuture<GradientResult> remainingFuture = null;
				for (final JobFuture<GradientResult> future : futures) {
					if (!future.isDone()) {
						remainingFuture = future;
						working = true;
					} else {
						++completed;
					}
				}
				LOG.info("Completed %d/%d (%.3fsec)", completed, futures.size(),
						(System.currentTimeMillis() - distStartTime) / 1000.0);
				if (remainingFuture != null) {
					try {
						remainingFuture.get(10, TimeUnit.SECONDS);
					} catch (InterruptedException | ExecutionException
							| TimeoutException e) {
						// Ignore.
					}
				}
			}
			LOG.info("TinyDist complete (%f.3sec)",
					(System.currentTimeMillis() - distStartTime) / 1000.0);

			final Iterator<LabeledAmrSentence> batchIterator = batch.iterator();
			final Iterator<JobFuture<GradientResult>> futureIterator = futures
					.iterator();
			final IHashVector aggregateGradient = HashVectorFactory.create();
			while (batchIterator.hasNext()) {
				final LabeledAmrSentence dataItem = batchIterator.next();
				final JobFuture<GradientResult> future = futureIterator.next();

				// Log sample header.
				LOG.info("%d : ================== [%d / PARAM]", ++itemCounter,
						epochNumber);
				LOG.info("Sample type: %s",
						dataItem.getClass().getSimpleName());
				LOG.info("%s", dataItem);

				try {
					LOG.info(future.getLog());
				} catch (final InterruptedException e) {
					LOG.error("Failed to get log due to an exception: %s", e);
				}

				final GradientResult result;
				try {
					result = future.get();
				} catch (InterruptedException | ExecutionException e) {
					LOG.error("Job failed: %s", e);
					continue;
				}

				computeTime += result.processingTime;

				if (result.processed) {
					stats.count("Processed for parameter estimation",
							epochNumber);

					// Apply updates to the learning statistics.
					result.computedGradient.getStatUpdates().accept(stats);

					// Aggregate the viterbi entries.
					viterbiEntries.addAll(
							result.computedGradient.getViterbiEntries());

					// Mark the sample as reachable.
					if (!result.computedGradient.getViterbiEntries()
							.isEmpty()) {
						reachableDuringLastEpoch.add(itemCounter);
					}

					if (result.computedGradient.getGradient() != null) {
						// Add the gradient into the aggregate vector.
						result.computedGradient.getGradient().addTimesInto(1.0,
								aggregateGradient);
					}

					LOG.info("Data item processing time: %.2fsec",
							result.processingTime / 1000.0);
				}
			}

			// Apply the mini batch update.
			if (updateProcedure.applyUpdate(aggregateGradient,
					model.getTheta())) {
				// Apply the update.
				remoteModelIsUpToDate = false;
				stats.count("Mini batch update", epochNumber);

				// Refresh the parameters of the remote model. Clone the
				// parameters to get a snapshot of the current parameters.
				if (!manager.updateEnviroment(
						LearningEnvironment.setModelParameters(
								HashVectorFactory.create(model.getTheta())))) {
					LOG.error("Failed to update environment");
					throw new IllegalStateException();
				}
				remoteModelIsUpToDate = true;
			}
		}

		// Log speedup.
		final long realTotalTime = System.currentTimeMillis() - startTime;
		LOG.info("Distribution speedup:");
		LOG.info("Real time: %.3f, compute time: %.3f, speedup: %.3f",
				realTotalTime / 1000.0, computeTime / 1000.0,
				computeTime / (double) realTotalTime);

		return viterbiEntries;

	}

	public static class Creator
			implements IResourceObjectCreator<DistributeMiniBatchLearner> {

		private final String type;

		public Creator() {
			this("learner.amr.minibatch.dist");
		}

		public Creator(String type) {
			this.type = type;
		}

		@Override
		public DistributeMiniBatchLearner create(Parameters params,
				IResourceRepository repo) {

			final IDataCollection<LabeledAmrSentence> trainingData = repo
					.get(params.get("data"));
			final int numIterations = params.getAsInteger("iter");
			final int maxSentenceLength = params
					.getAsInteger("maxSentenceLength", Integer.MAX_VALUE);
			final boolean sortData = params.getAsBoolean("sortData", false);

			final ICategoryServices<LogicalExpression> categoryServices;
			final ILexiconGeneratorPrecise<LabeledAmrSentence, LogicalExpression, IJointModelImmutable<SituatedSentence<AMRMeta>, LogicalExpression, LogicalExpression>> genlex;
			if (params.contains("genlex")) {
				genlex = repo.get(params.get("genlex"));
				categoryServices = repo.get(
						ParameterizedExperiment.CATEGORY_SERVICES_RESOURCE);
			} else {
				genlex = null;
				categoryServices = null;
			}

			final IJointOutputLogger<LogicalExpression, LogicalExpression, LogicalExpression> parserOutputLogger;
			if (params.contains("parseLogger")) {
				parserOutputLogger = repo.get(params.get("parseLogger"));
			} else {
				parserOutputLogger = null;
			}

			final IJointInferenceFilterFactory<LabeledAmrSentence, LogicalExpression, LogicalExpression, LogicalExpression> filterFactory;
			if (params.contains("filterFactory")) {
				filterFactory = repo.get(params.get("filterFactory"));
			} else {
				filterFactory = new IJointInferenceFilterFactory<LabeledAmrSentence, LogicalExpression, LogicalExpression, LogicalExpression>() {
					private static final long serialVersionUID = -8410588783722286647L;

					@Override
					public Predicate<ParsingOp<LogicalExpression>> create(
							LabeledAmrSentence object) {
						return JointInferenceFilterUtils.stubTrue();
					}

					@Override
					public IJointInferenceFilter<LogicalExpression, LogicalExpression, LogicalExpression> createJointFilter(
							LabeledAmrSentence ibj) {
						return JointInferenceFilterUtils.stubTrue();
					}
				};

			}

			IntConsumer postIteration = (i) -> {
				return;
			};
			for (final String id : params.getSplit("postIteration")) {
				postIteration = postIteration.andThen(repo.get(id));
			}

			final BiFunction<Predicate<LexicalEntry<LogicalExpression>>, Map<LexicalEntry<LogicalExpression>, Double>, Set<LexicalEntry<LogicalExpression>>> votingProcedure;
			if (params.contains("voter")) {
				votingProcedure = repo.get(params.get("voter"));
			} else {
				votingProcedure = new StubVoting();
			}

			Integer conditionedInferenceBeam;
			if (params.contains("conditionedBeam")) {
				conditionedInferenceBeam = params
						.getAsInteger("conditionedBeam");
			} else {
				conditionedInferenceBeam = null;
			}

			final ILexiconGenerator<LabeledAmrSentence, LogicalExpression, IJointModelImmutable<SituatedSentence<AMRMeta>, LogicalExpression, LogicalExpression>> alignmentGenlex;
			if (params.contains("alignGenlex")) {
				alignmentGenlex = repo.get(params.get("alignGenlex"));
			} else {
				alignmentGenlex = null;
			}

			final ILexiconImmutable<LogicalExpression> keepEntries;
			if (params.contains("keepEntries")) {
				keepEntries = repo.get(params.get("keepEntries"));
			} else {
				keepEntries = new Lexicon<>();
			}

			return new DistributeMiniBatchLearner(numIterations, trainingData,
					sortData, maxSentenceLength,
					repo.get(ParameterizedExperiment.PARSER_RESOURCE),
					parserOutputLogger, categoryServices, genlex, filterFactory,
					postIteration, params.getAsBoolean("prune", false),
					votingProcedure, repo.get(params.get("manager")),
					params.getAsInteger("batch"),
					repo.get(params.get("estimator")),
					repo.get(params.get("gradient")), conditionedInferenceBeam,
					alignmentGenlex, params.getAsBoolean("resume", false),
					keepEntries);
		}

		@Override
		public String type() {
			return type;
		}

		@Override
		public ResourceUsage usage() {
			return ResourceUsage.builder(type, DistributeMiniBatchLearner.class)
					.addParam("keepEntries", ILexiconImmutable.class,
							"Entries to keep during lexicon prunning despite if they are used or not (default: none)")
					.addParam("resume", Boolean.class,
							"Resume learning and skip initialization actions (default: false)")
					.addParam("alignGenlex", ILexiconGenerator.class,
							"High-precision heuristic alignment GENLEX to augment the model (default: null)")
					.addParam("prune", Boolean.class,
							"Prune the lexicon after each parameter update (default: false)")
					.addParam("voter", BiFunction.class,
							"Voting procedure (default: stub voter)")
					.setDescription(
							"AMR-specific gradient descent batch learner.")
					.addParam("batch", Integer.class, "Batch size")
					.addParam("data", IDataCollection.class, "Training data")
					.addParam("iter", "int", "Number of training iterations")
					.addParam("maxSentenceLength", "int",
							"Max sentence length to process")
					.addParam("gradient", IGradientFunction.class,
							"Functin to compute the gradient")
					.addParam("estimator", IWeightUpdateProcedure.class,
							"Parameter estimation update rule")
					.addParam("sortData", Boolean.class,
							"Sort the data according to sentence length in ascending order (default: false)")
					.addParam("genlex", ILexiconGeneratorPrecise.class,
							"GENLEX procedure")
					.addParam("parseLogger", "id",
							"Parse logger for debug detailed logging of parses")
					.addParam("manager", ReliableManager.class,
							"Reliable tinydist manager")
					.addParam("filterFactory",
							IJointInferenceFilterFactory.class,
							"Filter for conditioned inference (default: true stub)")
					.addParam("postIteration", Runnable.class,
							"Task to run after each iteration")
					.build();
		}

	}

	private static class GradientJob implements
			Function<LearningEnvironment, GradientResult>, Serializable {

		private static final long			serialVersionUID	= -531673379742439999L;
		private final LabeledAmrSentence	dataItem;
		private final int					epochNumber;
		private final int					itemNumber;

		public GradientJob(LabeledAmrSentence dataItem, int epochNumber,
				int itemNumber) {
			this.dataItem = dataItem;
			this.epochNumber = epochNumber;
			this.itemNumber = itemNumber;
		}

		@Override
		public GradientResult apply(LearningEnvironment env) {

			// Record sample processing start time.
			final long startTime = System.currentTimeMillis();

			final IJointDataItemModel<LogicalExpression, LogicalExpression> dataItemModel = env
					.getModel().createJointDataItemModel(dataItem.getSample());

			// Skip sample, if over the length limit.
			if (dataItem.getSample().getSample().getTokens().size() > env
					.getMaxSentenceLength()) {
				LOG.warn("Training sample too long, skipping");
				return new GradientResult(false, null,
						System.currentTimeMillis() - startTime);
			}

			// Skip sample if the label is invalid.
			if (!IsValidAmr.of(dataItem.getLabel(), true, true)) {
				LOG.warn("Annotated LF is an invalid AMR -- skipping");
				return new GradientResult(false, null,
						System.currentTimeMillis() - startTime);
			}

			final GradientComputation gradientComputation = env
					.getGradientFunction().of(dataItem, dataItemModel,
							itemNumber, epochNumber, env.getParser(),
							env.getFilterFactory(),
							env.getParserOutputLogger());

			// Validate the gradient.
			if (gradientComputation.getGradient() != null) {
				if (!env.getModel().isValidWeightVector(
						gradientComputation.getGradient())) {
					throw new IllegalStateException("Invalid gradient");
				}
			} else {
				LOG.info("No gradient");
			}

			return new GradientResult(true, gradientComputation,
					System.currentTimeMillis() - startTime);
		}

	}

	private static class GradientResult implements Serializable {

		private static final long			serialVersionUID	= 4225274940539731344L;
		private final GradientComputation	computedGradient;
		private final boolean				processed;
		private final long					processingTime;

		public GradientResult(boolean processed,
				GradientComputation computedGradient, long processingTime) {
			this.processed = processed;
			this.computedGradient = computedGradient;
			this.processingTime = processingTime;
		}

	}

}