java source code of MapRedUtil

spork-master
- NOTICE.txt
- src
  - main
    - jruby
      - pigudf.rb
  - python
    - streaming
      - pig_util.py
      - controller.py
  - packages
    - update-pig-env.sh
    - templates
      - conf
        pig-env.sh
    - pig-setup-conf.sh
  - overview.html
  - META-INF
    - services
      - org.apache.pig.ExecType
      - org.apache.hadoop.mapreduce.protocol.ClientProtocolProvider
  - org
    - apache
      - pig
        impl
        builtin
        GFAny.java
        IdentityColumn.java
        StreamingUDF.java
        SampleLoader.java
        PartitionSkewedKeys.java
        DefaultIndexableLoader.java
        ReadScalars.java
        FindQuantiles.java
        RandomSampleLoader.java
        GFReplicate.java
        PoissonSampleLoader.java
        GFCross.java
        GetMemNumRows.java
        plan
        DependencyOrderWalker.java
        VisitorException.java
        OperatorKey.java
        ReverseDependencyOrderWalker.java
        ProjectionMap.java
        CompilationMessageCollector.java
        OperatorPlan.java
        MapKeysInfo.java
        PlanValidationException.java
        PlanWalker.java
        RequiredFields.java
        PlanException.java
        DotPlanDumper.java
        PlanVisitor.java
        NodeIdGenerator.java
        optimizer
        OptimizerException.java
        DepthFirstWalker.java
        Operator.java
        PlanDumper.java
        PigContext.java
        streaming
        StreamingDelimiters.java
        PigStreamingUDF.java
        InputHandler.java
        ExecutableManager.java
        StreamingUDFInputHandler.java
        StreamingUtil.java
        DefaultInputHandler.java
        OutputHandler.java
        StreamingUDFException.java
        FileInputHandler.java
        StreamingCommand.java
        DefaultOutputHandler.java
        StreamingUDFOutputHandler.java
        FileOutputHandler.java
        HandlerFactory.java
        StreamingUDFOutputSchemaException.java
        util
        avro
        AvroBagWrapper.java
        AvroStorageDataConversionUtilities.java
        AvroMapWrapper.java
        AvroRecordWriter.java
        AvroRecordReader.java
        AvroStorageSchemaConversionUtilities.java
        AvroTupleWrapper.java
        AvroArrayReader.java
        JavaCompilerHelper.java
        IdentityHashSet.java
        orc
        OrcUtils.java
        LineageTracer.java
        UriUtil.java
        NumValCarrier.java
        Utils.java
        ObjectSerializer.java
        HashOutputStream.java
        CastUtils.java
        Spillable.java
        TupleFormat.java
        JarManager.java
        GroupingSpillable.java
        WrappedIOException.java
        MultiMap.java
        PropertiesUtil.java
        CompilerUtils.java
        UDFContext.java
        ConfigurationValidator.java
        RewindableIterator.java
        LogUtils.java
        SpillableMemoryManager.java
        Pair.java
        StorageUtil.java
        StringUtils.java
        BagFormat.java
        LinkedMultiMap.java
        PigImplConstants.java
        logicalLayer
        validators
        TypeCheckerException.java
        FrontendException.java
        schema
        Schema.java
        SchemaUtil.java
        SchemaMergeException.java
        package.html
        CanonicalNamer.java
        io
        NullableDateTimeWritable.java
        BinStorageRecordReader.java
        NullableBigIntegerWritable.java
        TFileStorage.java
        FileSpec.java
        BinStorageOutputFormat.java
        NullableUnknownWritable.java
        InterRecordWriter.java
        NullableBag.java
        ResourceNotFoundException.java
        NullableDoubleWritable.java
        SequenceFileInterStorage.java
        NullableBooleanWritable.java
        InterRecordReader.java
        NullableText.java
        FileLocalizer.java
        ReadToEndLoader.java
        NullableBigDecimalWritable.java
        NullableFloatWritable.java
        NullableIntWritable.java
        PigNullableWritable.java
        NullableBytesWritable.java
        InterStorage.java
        NullableLongWritable.java
        TFileRecordWriter.java
        BinStorageRecordWriter.java
        BufferedPositionedInputStream.java
        BinStorageInputFormat.java
        NullableTuple.java
        PigFile.java
        TFileRecordReader.java
        NullablePartitionWritable.java
        JVMReuseImpl.java
        TerminatingAccumulator.java
        FuncSpec.java
        PigConfiguration.java
        scripting
        BoundScript.java
        jruby
        JrubyAccumulatorEvalFunc.java
        RubySchema.java
        RubyDataBag.java
        JrubyScriptEngine.java
        JrubyAlgebraicEvalFunc.java
        RubyDataByteArray.java
        PigJrubyLibrary.java
        JrubyEvalFunc.java
        streaming
        python
        PythonScriptEngine.java
        SyncProgressNotificationAdaptor.java
        ScriptPigContext.java
        ScriptingOutputCapturer.java
        Pig.java
        js
        JSPig.java
        JsFunction.java
        JsScriptEngine.java
        groovy
        AccumulatorCleanup.java
        AlgebraicInitial.java
        GroovyScriptEngine.java
        OutputSchemaFunction.java
        GroovyAccumulatorEvalFunc.java
        AccumulatorAccumulate.java
        GroovyEvalFunc.java
        AccumulatorGetValue.java
        AlgebraicIntermed.java
        GroovyAlgebraicEvalFunc.java
        GroovyUtils.java
        GroovyEvalFuncObject.java
        AlgebraicFinal.java
        jython
        JythonFunction.java
        JythonScriptEngine.java
        JythonUtils.java
        ScriptEngine.java
        Accumulator.java
        ComparisonFunc.java
        PigRunner.java
        CollectableLoadFunc.java
        Algebraic.java
        LoadPushDown.java
        builtin
        ROUND.java
        BagSize.java
        GetMonth.java
        CubeDimensions.java
        BagToTuple.java
        StringMax.java
        ToDate3ARGS.java
        MapSize.java
        ParquetLoader.java
        SubtractDuration.java
        SIN.java
        BagToString.java
        BigIntegerSum.java
        GenericInvoker.java
        Utf8StorageConverter.java
        AlgebraicByteArrayMathBase.java
        COUNT_STAR.java
        FloatAvg.java
        LOG10.java
        KEYSET.java
        OrcStorage.java
        SPRINTF.java
        JsonMetadata.java
        IsEmpty.java
        UniqueID.java
        LongAvg.java
        BuildBloom.java
        ToMilliSeconds.java
        DIFF.java
        FloatRoundTo.java
        TOP.java
        ASIN.java
        REGEX_EXTRACT_ALL.java
        DoubleAbs.java
        FuncUtils.java
        LongSum.java
        COSH.java
        DoubleMin.java
        UCFIRST.java
        GetMinute.java
        Assert.java
        TRIM.java
        TrevniStorage.java
        SINH.java
        COUNT.java
        VALUELIST.java
        InvokeForLong.java
        GetHour.java
        FloatMin.java
        TextLoader.java
        BinStorage.java
        TOBAG.java
        Base.java
        BigIntegerAvg.java
        GetDay.java
        ToString.java
        JsonLoader.java
        FunctionWrapperEvalFunc.java
        CurrentTime.java
        GetWeek.java
        YearsBetween.java
        STARTSWITH.java
        RTRIM.java
        ToUnixTime.java
        Nondeterministic.java
        GetWeekYear.java
        TupleSize.java
        FLOOR.java
        AlgebraicMathBase.java
        INDEXOF.java
        REGEX_EXTRACT.java
        MAX.java
        SQRT.java
        EXP.java
        LAST_INDEX_OF.java
        SIZE.java
        BigIntegerMin.java
        STRSPLITTOBAG.java
        TOMAP.java
        IntAvg.java
        ENDSWITH.java
        DoubleSum.java
        BuildBloomBase.java
        TAN.java
        InvokeForString.java
        TANH.java
        DoubleAvg.java
        GetMilliSecond.java
        IntAbs.java
        INVERSEMAP.java
        InvokerFunction.java
        BigIntegerAbs.java
        LongMin.java
        DoubleMax.java
        ToDateISO.java
        IntMax.java
        EqualsIgnoreCase.java
        InvokeForDouble.java
        JsonStorage.java
        AvroStorage.java
        AlgebraicDoubleMathBase.java
        StringConcat.java
        Distinct.java
        InvokeForFloat.java
        ROUND_TO.java
        GetSecond.java
        LTRIM.java
        BigDecimalSum.java
        COR.java
        BigIntegerMax.java
        SUBTRACT.java
        BigDecimalWrapper.java
        WeeksBetween.java
        ATAN.java
        AlgebraicFloatMathBase.java
        AddDuration.java
        BigDecimalAvg.java
        MilliSecondsBetween.java
        mock
        Storage.java
        DoubleRoundTo.java
        ARITY.java
        COV.java
        VALUESET.java
        RollupDimensions.java
        ParquetStorer.java
        DaysBetween.java
        BigDecimalMax.java
        SecondsBetween.java
        StringSize.java
        COS.java
        MonitoredUDF.java
        Bloom.java
        SUBSTRING.java
        LongMax.java
        OutputSchema.java
        FloatRound.java
        FloatSum.java
        AlgebraicBigDecimalMathBase.java
        DoubleRound.java
        Invoker.java
        AlgebraicIntMathBase.java
        ACOS.java
        DoubleBase.java
        UPPER.java
        DateTimeMin.java
        SUM.java
        ToDate.java
        AVG.java
        CEIL.java
        BigDecimalAbs.java
        ToDate2ARGS.java
        BigIntegerWrapper.java
        PigStreaming.java
        TOKENIZE.java
        FloatMax.java
        TOTUPLE.java
        PluckTuple.java
        IntSum.java
        AlgebraicLongMathBase.java
        LCFIRST.java
        MIN.java
        InvokeForInt.java
        MonthsBetween.java
        InvokerGenerator.java
        MinutesBetween.java
        package.html
        CONCAT.java
        FloatAbs.java
        GetYear.java
        StringMin.java
        AlgebraicBigIntegerMathBase.java
        CBRT.java
        RANDOM.java
        STRSPLIT.java
        LOWER.java
        DateTimeMax.java
        LongAbs.java
        ABS.java
        LOG.java
        IntMin.java
        BigDecimalMin.java
        HoursBetween.java
        REPLACE.java
        PigStorage.java
        ConstantSize.java
        StoreFuncWrapper.java
        PigStreamingBase.java
        ExecType.java
        LoadPredicatePushdown.java
        ResourceSchema.java
        StoreCaster.java
        ExecTypeProvider.java
        StoreFunc.java
        IndexableLoadFunc.java
        AccumulatorEvalFunc.java
        LoadCaster.java
        StoreMetadata.java
        classification
        InterfaceStability.java
        InterfaceAudience.java
        StoreResources.java
        IteratingAccumulatorEvalFunc.java
        PigWarning.java
        backend
        hadoop
        DoubleWritable.java
        hbase
        TableSplitComparable.java
        HBaseBinaryConverter.java
        HBaseTableInputFormat.java
        HBaseStorage.java
        HDataType.java
        streaming
        HadoopExecutableManager.java
        BigIntegerWritable.java
        DateTimeWritable.java
        executionengine
        JobCreationException.java
        HJob.java
        fetch
        FetchLauncher.java
        FetchOptimizer.java
        FetchProgressableReporter.java
        FetchPOStoreImpl.java
        FetchTaskContext.java
        FetchContext.java
        MapRedResult.java
        util
        ParallelConstantVisitor.java
        SecondaryKeyOptimizerUtil.java
        CombinerOptimizerUtil.java
        AccumulatorOptimizerUtil.java
        MapRedUtil.java
        spark
        SparkExecType.java
        SparkExecutionEngine.java
        running
        PigInputFormatSpark.java
        BroadCastClient.java
        BroadCastServer.java
        converter
        SortConverter.java
        UnionConverter.java
        SkewedJoinConverter.java
        CounterConverter.java
        FilterConverter.java
        POConverter.java
        LocalRearrangeConverter.java
        CollectedGroupConverter.java
        LimitConverter.java
        POOutputConsumerIterator.java
        SplitConverter.java
        PackageConverter.java
        RankConverter.java
        GlobalRearrangeConverter.java
        LoadConverter.java
        StoreConverter.java
        IteratorTransform.java
        DistinctConverter.java
        ForEachConverter.java
        SparkLauncher.java
        SparkUtil.java
        KryoSerializer.java
        Launcher.java
        optimizer
        SecondaryKeyOptimizer.java
        mapReduceLayer
        DistinctCombiner.java
        SecondaryKeyOptimizer.java
        NativeMapReduceOper.java
        PigMapOnly.java
        MRUtil.java
        plans
        DotMRPrinter.java
        UDFFinder.java
        XMLMRPrinter.java
        ScalarPhyFinder.java
        POPackageAnnotator.java
        MRIntermediateDataVisitor.java
        MRPrinter.java
        MROperPlan.java
        MROpPlanVisitor.java
        EndOfAllInputSetter.java
        PhyPlanSetter.java
        ColumnChainInfo.java
        FileBasedOutputSizeReader.java
        MultiQueryOptimizer.java
        PigTextRawComparator.java
        MRCompilerException.java
        PigSplit.java
        MapReducePOStoreImpl.java
        SortKeyInfo.java
        PigFloatRawComparator.java
        SecondaryKeyOptimizerMR.java
        MRTaskContext.java
        AccumulatorOptimizer.java
        PigBytesRawComparator.java
        MapReduceLauncher.java
        partitioners
        SkewedPartitioner.java
        CountingMap.java
        SecondaryKeyPartitioner.java
        WeightedRangePartitioner.java
        DiscreteProbabilitySampleGenerator.java
        PigOutputFormat.java
        PigGenericMapReduce.java
        MRExecutionEngine.java
        PigOutputCommitter.java
        CombinerOptimizer.java
        JobControlCompiler.java
        RunJarSecurityManager.java
        PigFileInputFormat.java
        PigHadoopLogger.java
        PigSecondaryKeyComparator.java
        NoopStoreRemover.java
        KeyTypeDiscoveryVisitor.java
        PigReducerEstimator.java
        InputSizeReducerEstimator.java
        IllustrateDummyReporter.java
        UDFFinishVisitor.java
        PigTextInputFormat.java
        ProgressableReporter.java
        PigGenericMapBase.java
        PigMapReduceCounter.java
        PigSequenceFileInputFormat.java
        PigDateTimeRawComparator.java
        PigDoubleRawComparator.java
        PigInputFormat.java
        NoopFilterRemover.java
        PigCombiner.java
        MapReduceOper.java
        PigStatsOutputSizeReader.java
        PigIntRawComparator.java
        MRCompiler.java
        SampleOptimizer.java
        MRExecType.java
        PigBigIntegerRawComparator.java
        PigBigDecimalRawComparator.java
        LimitAdjuster.java
        PigLongRawComparator.java
        PigTextOutputFormat.java
        PigTupleSortComparator.java
        PigRecordReader.java
        PigBooleanRawComparator.java
        PigTupleDefaultRawComparator.java
        LocalExecType.java
        MRConfiguration.java
        ColumnInfo.java
        MergeJoinIndexer.java
        physicalLayer
        PigProgressable.java
        plans
        PhyPlanVisitor.java
        PatternNode.java
        PlanPrinter.java
        PatternPlan.java
        UdfCacheShipFilesVisitor.java
        XMLPhysicalPlanPrinter.java
        DotPOPrinter.java
        PhysicalPlan.java
        POPrinter.java
        PhysicalOperator.java
        relationalOperators
        MultiQueryPackager.java
        POSkewedJoin.java
        POPackage.java
        POLoad.java
        POForEach.java
        POPreCombinerLocalRearrange.java
        POStoreImpl.java
        POSplit.java
        PODemux.java
        PODistinct.java
        POMergeJoin.java
        POSortedDistinct.java
        POUnion.java
        CombinerPackager.java
        LitePackager.java
        POLocalRearrange.java
        POStream.java
        POSort.java
        JoinPackager.java
        POReservoirSample.java
        POPartialAgg.java
        POGlobalRearrange.java
        POFRJoin.java
        PORank.java
        POFilter.java
        POCollectedGroup.java
        Packager.java
        POOptimizedForEach.java
        POMergeCogroup.java
        POPartitionRearrange.java
        POCounter.java
        PONative.java
        AccumulativeTupleBuffer.java
        POPoissonSample.java
        POStore.java
        POLimit.java
        POCross.java
        util
        MonitoredUDFExecutor.java
        PlanHelper.java
        Result.java
        POStatus.java
        expressionOperators
        ExpressionOperator.java
        POAnd.java
        EqualToExpr.java
        POProject.java
        POMapLookUp.java
        POCast.java
        Add.java
        Mod.java
        LTOrEqualToExpr.java
        NotEqualToExpr.java
        PONegative.java
        regex
        CompiledAutomaton.java
        NonConstantRegex.java
        RegexInit.java
        RegexImpl.java
        CompiledRegex.java
        PONot.java
        GreaterThanExpr.java
        BinaryComparisonOperator.java
        BinaryExpressionOperator.java
        UnaryExpressionOperator.java
        UnaryComparisonOperator.java
        POIsNull.java
        LessThanExpr.java
        PORegexp.java
        POUserFunc.java
        Divide.java
        Multiply.java
        POOr.java
        GTOrEqualToExpr.java
        POBinCond.java
        ConstantExpression.java
        POUserComparisonFunc.java
        Subtract.java
        ComparisonOperator.java
        PORelationToExprProject.java
        PigLogger.java
        package.html
        LogicalToPhysicalTranslatorException.java
        tez
        TezJobCompiler.java
        TezExecutionEngine.java
        TezSessionManager.java
        plan
        TezOperator.java
        TezPlanContainer.java
        udf
        FindQuantilesTez.java
        ReadScalarsTez.java
        PartitionSkewedKeysTez.java
        TezOpPlanVisitor.java
        TezPOStreamVisitor.java
        TezPlanContainerNode.java
        TezPOUserFuncVisitor.java
        TezPlanContainerPrinter.java
        operator
        NativeTezOper.java
        POIdentityInOutTez.java
        POStoreTez.java
        POPartitionRearrangeTez.java
        POLocalRearrangeTez.java
        POShuffleTezLoad.java
        POLocalRearrangeTezFactory.java
        POSimpleTezLoad.java
        PORankTez.java
        POCounterStatsTez.java
        POCounterTez.java
        POValueInputTez.java
        POFRJoinTez.java
        POShuffledValueInputTez.java
        POValueOutputTez.java
        TezPOPackageAnnotator.java
        optimizer
        TezParallelismEstimator.java
        AccumulatorOptimizer.java
        LoaderProcessor.java
        MultiQueryOptimizerTez.java
        CombinerOptimizer.java
        ParallelismSetter.java
        UnionOptimizer.java
        TezOperDependencyParallelismEstimator.java
        NoopFilterRemover.java
        SecondaryKeyOptimizerTez.java
        TezEdgeDescriptor.java
        TezCompilerException.java
        TezPrinter.java
        TezCompiler.java
        TezOperPlan.java
        TezPlanContainerUDFCollector.java
        TezPlanContainerVisitor.java
        util
        MRToTezHelper.java
        SecurityHelper.java
        TezCompilerUtil.java
        runtime
        PartitionerDefinedVertexManager.java
        RoundRobinPartitioner.java
        PigOutputFormatTez.java
        WeightedRangePartitionerTez.java
        SkewedPartitionerTez.java
        TezTaskContext.java
        TezOutput.java
        PigProcessor.java
        TezTaskConfigurable.java
        ObjectCache.java
        TezInput.java
        TezExecType.java
        TezResourceManager.java
        TezLocalExecType.java
        TezJob.java
        TezLauncher.java
        TezDagBuilder.java
        HExecutionEngine.java
        TaskContext.java
        BigDecimalWritable.java
        accumulo
        AbstractAccumuloStorage.java
        Utils.java
        Column.java
        AccumuloBinaryConverter.java
        FixedByteArrayOutputStream.java
        AccumuloStorageOptions.java
        AccumuloStorage.java
        datastorage
        HConfiguration.java
        HSeekableInputStream.java
        HDataStorage.java
        ConfigurationUtil.java
        HDirectory.java
        HFile.java
        HPath.java
        executionengine
        ExecException.java
        ExecJob.java
        ExecutionEngine.java
        BackendException.java
        datastorage
        ImmutableOutputStream.java
        DataStorageException.java
        ElementDescriptor.java
        SeekableInputStream.java
        DataStorage.java
        ContainerDescriptor.java
        Function.java
        newplan
        FilterExtractor.java
        DependencyOrderWalker.java
        ReverseDependencyOrderWalkerWOSeenChk.java
        ReverseDependencyOrderWalker.java
        OperatorPlan.java
        PredicatePushDownFilterExtractor.java
        OperatorSubPlan.java
        PlanWalker.java
        DotPlanDumper.java
        PlanVisitor.java
        optimizer
        PlanOptimizer.java
        Rule.java
        PlanTransformListener.java
        Transformer.java
        DepthFirstWalker.java
        PartitionFilterExtractor.java
        Operator.java
        logical
        DotLOPrinter.java
        visitor
        CastLineageSetter.java
        LineageFindRelVisitor.java
        TypeCheckingRelVisitor.java
        ProjectStarExpanderUtil.java
        ResetProjectionAttachedRelationalOpVisitor.java
        DuplicateForEachColumnRewriteVisitor.java
        ScalarVisitor.java
        UDFFinder.java
        ProjectStarExpander.java
        SchemaAliasVisitor.java
        ImplicitSplitInsertVisitor.java
        UnionOnSchemaSetter.java
        StoreAliasSetter.java
        InputOutputFileValidatorVisitor.java
        SortInfoSetter.java
        ColumnAliasConversionVisitor.java
        DanglingNestedNodeRemover.java
        TypeCheckingExpVisitor.java
        ProjStarInUdfExpander.java
        ScalarVariableValidator.java
        relational
        LOStore.java
        LOFilter.java
        LOUnion.java
        LODistinct.java
        LogToPhyTranslationVisitor.java
        LogicalSchema.java
        LOJoin.java
        MapSideMergeValidator.java
        SchemaNotDefinedException.java
        LOLoad.java
        LogicalPlan.java
        LORank.java
        LogicalRelationalOperator.java
        LOCross.java
        LOLimit.java
        LOInnerLoad.java
        LogicalRelationalNodesVisitor.java
        LOSplitOutput.java
        LOCube.java
        LOSplit.java
        LOStream.java
        LONative.java
        LOCogroup.java
        LogicalPlanData.java
        LOForEach.java
        LOGenerate.java
        LOSort.java
        optimizer
        SchemaPatcher.java
        UidResetter.java
        ProjectionPatcher.java
        LogicalPlanOptimizer.java
        AllExpressionVisitor.java
        SchemaResetter.java
        AllSameRalationalNodesVisitor.java
        LogicalPlanPrinter.java
        Util.java
        rules
        GroupByConstParallelSetter.java
        PushDownForEachFlatten.java
        TypeCastInserter.java
        OptimizerUtils.java
        ColumnPruneHelper.java
        MergeFilter.java
        FilterAboveForeach.java
        FilterConstantCalculator.java
        PredicatePushdownOptimizer.java
        LoadTypeCastInserter.java
        SplitFilter.java
        PartitionFilterOptimizer.java
        ForEachConstantCalculator.java
        ColumnMapKeyPrune.java
        MergeForEach.java
        WholePlanRule.java
        AddForEach.java
        ConstantCalculator.java
        LimitOptimizer.java
        LogicalRelationalNodeValidator.java
        MapKeysPruneHelper.java
        PushUpFilter.java
        StreamTypeCastInserter.java
        ColumnPruneVisitor.java
        expression
        UserFuncExpression.java
        SubtractExpression.java
        ProjectExpression.java
        LessThanEqualExpression.java
        EqualExpression.java
        MapLookupExpression.java
        CastExpression.java
        ModExpression.java
        LessThanExpression.java
        GreaterThanExpression.java
        DereferenceExpression.java
        RegexExpression.java
        NegativeExpression.java
        GreaterThanEqualExpression.java
        LogicalExpressionVisitor.java
        OrExpression.java
        AllSameExpressionVisitor.java
        AndExpression.java
        NotEqualExpression.java
        MultiplyExpression.java
        LogicalExpressionPlan.java
        NotExpression.java
        ScalarExpression.java
        BinCondExpression.java
        UnaryExpression.java
        ExpToPhyTranslationVisitor.java
        BinaryExpression.java
        AddExpression.java
        ConstantExpression.java
        IsNullExpression.java
        LogicalExpression.java
        DivideExpression.java
        ColumnExpression.java
        SubtreeDependencyOrderWalker.java
        BaseOperatorPlan.java
        PlanEdge.java
        PlanDumper.java
        validator
        BlackAndWhitelistFilter.java
        BlackAndWhitelistValidator.java
        PigCommandFilter.java
        PigCounters.java
        FileInputLoadFunc.java
        StreamToPig.java
        LoadFuncMetadataWrapper.java
        PigConstants.java
        StaticDataCleanup.java
        EvalFunc.java
        Main.java
        pen
        ExampleGenerator.java
        POOptimizeDisabler.java
        FakeRawKeyValueIterator.java
        AugmentBaseDataVisitor.java
        IllustratorAttacher.java
        Illustrable.java
        PhysicalPlanResetter.java
        util
        PreOrderDepthFirstWalker.java
        LineageTracer.java
        MetricEvaluation.java
        DisplayExamples.java
        ExampleTuple.java
        LocalMapReduceSimulator.java
        Illustrator.java
        LineageTrimmingVisitor.java
        EquivalenceClasses.java
        LoadMetadata.java
        data
        DefaultDataBag.java
        FieldIsNullException.java
        BinSedesTupleFactory.java
        DefaultTupleFactory.java
        DataType.java
        WritableByteArray.java
        utils
        MethodHelper.java
        SedesHelper.java
        StructuresHelper.java
        BytesHelper.java
        DataByteArray.java
        InternalMap.java
        SchemaTupleBackend.java
        SingleTupleBag.java
        AppendableSchemaTuple.java
        BagFactory.java
        DistinctDataBag.java
        SizeUtil.java
        AbstractTuple.java
        TupleFactory.java
        DefaultTuple.java
        SchemaTupleFactory.java
        DataReaderWriter.java
        InterSedes.java
        FileList.java
        Tuple.java
        BinSedesTuple.java
        SortedDataBag.java
        TargetedTuple.java
        DataBag.java
        TupleMaker.java
        InternalCachedBag.java
        TypeAwareTuple.java
        AmendableTuple.java
        DefaultBagFactory.java
        SortedSpillBag.java
        SchemaTupleFrontend.java
        SelfSpillBag.java
        ReadOnceBag.java
        AccumulativeBag.java
        InterSedesFactory.java
        InternalSortedBag.java
        DefaultAbstractBag.java
        SchemaTuple.java
        BinInterSedes.java
        TupleRawComparator.java
        TimestampedTuple.java
        package.html
        NonSpillableDataBag.java
        SchemaTupleClassGenerator.java
        InternalDistinctBag.java
        FileSplitComparable.java
        ResourceStatistics.java
        PigServer.java
        LoadFuncWrapper.java
        PigException.java
        TypedOutputEvalFunc.java
        tools
        timer
        PerformanceTimerFactory.java
        PerformanceTimer.java
        streams
        StreamGenerator.java
        parameters
        PreprocessorContext.java
        ParamLoader.jj
        ParameterSubstitutionPreprocessor.java
        ParameterSubstitutionException.java
        PigFileParser.jj
        cmdline
        CmdLineParser.java
        pigscript
        parser
        PigScriptParser.jj
        ToolsPigServer.java
        counters
        PigCounterHelper.java
        grunt
        PigCompletor.java
        autocomplete_aliases
        Command.java
        GruntParser.java
        PigCompletorAliases.java
        autocomplete
        Grunt.java
        pigstats
        EmbeddedPigStats.java
        PigStatsUtil.java
        PigStats.java
        EmptyPigStats.java
        OutputStats.java
        PigProgressNotificationListener.java
        SparkStats.java
        InputStats.java
        tez
        TezDAGStats.java
        TezVertexStats.java
        TezPigScriptStats.java
        PigTezProgressNotificationListener.java
        TezScriptState.java
        JobStats.java
        mapreduce
        MRPigStatsUtil.java
        SimplePigStats.java
        MRScriptState.java
        MRJobStats.java
        PigStatusReporter.java
        ScriptState.java
        StoreFuncInterface.java
        OrderedLoadFunc.java
        SortInfo.java
        LoadFunc.java
        LoadStoreCaster.java
        PrimitiveEvalFunc.java
        OverwritableStoreFunc.java
        PigToStream.java
        SortColInfo.java
        StoreFuncMetadataWrapper.java
        package.html
        FilterFunc.java
        Expression.java
        parser
        QueryParserFileStream.java
        QueryParserStringStream.java
        QueryParserDriver.java
        ParserValidationException.java
        LogicalPlanBuilder.java
        SourceLocation.java
        DuplicatedSchemaAliasException.java
        AstPrinter.g
        QueryParserStreamUtil.java
        AliasMasker.g
        QueryParser.g
        FunctionType.java
        PigParserNode.java
        PigMacro.java
        AstValidator.g
        PigParserNodeAdaptor.java
        StreamingCommandUtils.java
        PigRecognitionException.java
        InvalidScalarProjectionException.java
        QueryParserUtils.java
        ParserException.java
        DryRunGruntParser.java
        InvalidCommandException.java
        LogicalPlanGenerator.g
        PlanGenerationFailureException.java
        InvalidPathException.java
        UndefinedAliasException.java
        NonProjectExpressionException.java
        QueryLexer.g
        AlgebraicEvalFunc.java
        JVMReuseManager.java
        ExceptionalFunction.java
  - docs
    - src
      - documentation
        translations
        tabs_de.xml
        tabs_fr.xml
        languages_nl.xml
        languages_de.xml
        menu_es.xml
        tabs.xml
        langcode.xml
        menu_no.xml
        tabs_es.xml
        menu_fr.xml
        menu_sk.xml
        languages_es.xml
        menu_af.xml
        menu.xml
        menu_de.xml
        menu_it.xml
        tabs_nl.xml
        menu_ru.xml
        languages_en.xml
        languages_fr.xml
        menu_nl.xml
        resources
        images
        pig-in-overalls-big.jpg
        ellipse-2.svg
        stylesheets
        hello2document.xsl
        schema
        hello-v10.dtd
        symbols-project-v10.ent
        catalog.xcat
        classes
        CatalogManager.properties
        content
        locationmap.xml
        test1.html
        xdocs
        index.xml
        perf.xml
        admin.xml
        cmds.xml
        func.xml
        images
        project.svg
        hadoop-logo.jpg
        group.svg
        pig-logo.gif
        zebra.jpg
        test.xml
        start.xml
        pig-index.xml
        tabs.xml
        udf.xml
        cont.xml
        site.xml
        pigunit.xml
        sitemap.xmap
        README.txt
        skinconf.xml
        conf
        cli.xconf
    - forrest.properties.xml
    - forrest.properties
    - jdiff
    - forrest.properties.dispatcher.properties
  - pig-default.properties
- lib-src
  - bzip2
    - org
      - apache
        pig
        bzip2r
        Bzip2TextInputFormat.java
        tools
        bzip2r
        CRC.java
        CBZip2InputStream.java
        CBZip2OutputStream.java
        BZip2Constants.java
- build.xml
- ivy
  - pigsmoke-template.xml
  - pig-template.xml
  - libraries.properties
  - pigunit-template.xml
  - piggybank-template.xml
  - ivysettings.xml
- shims
  - src
    - hadoop23
      - org
        apache
        hadoop
        mapred
        DowngradeHelper.java
        pig
        backend
        hadoop23
        PigJobControl.java
        hadoop
        executionengine
        shims
        HadoopShims.java
        mapReduceLayer
        PigMapReduce.java
        PigMapBase.java
    - hadoop20
      - org
        apache
        pig
        backend
        hadoop
        executionengine
        shims
        HadoopShims.java
        mapReduceLayer
        PigMapReduce.java
        PigMapBase.java
        hadoop20
        PigJobControl.java
  - test
    - hadoop23
      - org
        apache
        pig
        test
        MiniCluster.java
        TezMiniCluster.java
        SparkMiniCluster.java
    - hadoop20
      - org
        apache
        pig
        test
        MiniCluster.java
        TezMiniCluster.java
        SparkMiniCluster.java
- CHANGES.txt
- tutorial
  - src
    - org
      - apache
        pig
        tutorial
        ToLower.java
        TutorialTest.java
        ScoreGenerator.java
        NGramGenerator.java
        ExtractHour.java
        NonURLDetector.java
        TutorialUtil.java
  - build.xml
  - data
  - scripts
    - script2-hadoop.pig
    - script1-local.pig
    - script2-local.pig
    - script1-hadoop.pig
- LICENSE
- .eclipse.templates
  - README.txt
  - .project
  - .classpath
- test
  - spark-tests
  - tez-tests
  - resources
    - org
      - apache
        pig
        test
        RegisteredJarVisibilitySchema.java
        ClassLoaderSanityCheck.java
        RegisteredJarVisibilityLoader.java
  - tez-local-tests
  - pigunit-tests
  - checkstyle.xml
  - checkstyle-noframes-sorted.xsl
  - unit-tests
  - e2e
    - pig
      - whirr
        pigtest.properties
        README
        whirr_test_patch.sh
      - build.xml
      - resource
        default.res
        windows.res
      - paramfiles
        params_3
      - deployers
        ExistingClusterDeployer.pm
        LocalDeployer.pm
      - streaming
        nameMap
        DieRandomly.pl
        PigStreamingDepend.pl
        PigStreaming.pl
        Split.pl
        PigStreamingModule.pm
        PigStreamingBad.pl
        GroupBy.pl
      - drivers
        Util.pm
        TestDriverPig.pm
        TestDriverScript.pm
      - lib
      - udfs
        ruby
        udf2.rb
        morerubyudfs.rb
        scriptingudfs.rb
        cpython
        scriptingudf.py
        morepythonudfs.py
        python
        scriptingudf.py
        morepythonudfs.py
        stringutil.py
        java
        build.xml
        org
        apache
        pig
        TestingAccumulatorHelper.java
        test
        utils
        SimpleCustomPartitioner2.java
        udf
        evalfunc
        IteratingAccumulatorIsEmpty.java
        TOBAG2.java
        BadUdf.java
        BadMonitored.java
        CreateTupleBag.java
        Swap.java
        BadUdf2.java
        Nil.java
        UdfContextFrontend.java
        TOBAG.java
        TestWarningFunc.java
        DECODE.java
        NonAlgNonAccCount.java
        IteratingAccumulatorSum.java
        TOMAP.java
        IteratingAccumulatorCount.java
        BadMonitoredDefault.java
        BadUdf4.java
        VARBAG.java
        BadUdf3.java
        Udfcachetest.java
        Fred.java
        CreateMap.java
        AllFirstLetter.java
        TestConstructorArgs.java
        GoodMonitored.java
        UPPER.java
        TestEvalFunc.java
        AppendIndex.java
        TestBoolean.java
        UDFContextTestUDF.java
        streaming
        StreamingDump.java
        DumpStreamerBad.java
        DumpStreamer.java
        orderby
        OrdDesc.java
        storefunc
        DumpLoaderBad.java
        StringStore.java
        StringStoreBad.java
        DumpLoader.java
        SimpleCollectableLoader.java
      - tests
        orc.conf
        grunt.conf
        cmdline.conf
        multiquery.conf
        turing_jython.conf
        negative.conf
        hcat.conf
        streaming_local.conf
        macro.conf
        bigdata.conf
        streaming.conf
      - tools
        test
        explainchk.pl
        floatpostprocessor.pl
        generate
        generate_data.pl
      - conf
        default.conf
        tez.conf
        rpm.conf
        existing_deployer.conf
        local.conf
        testpropertiesfile.conf
        local_deployer.conf
        spark.conf
      - macros
        macro1.pig
        macro_bad1.pig
    - harness
      - build.xml
      - TestDriverFactory.pm
      - test_harness.pl
      - test
        tests
        deploy.conf
        test.conf
        conf
        default.conf
      - xmlReport.pl
      - TestReport.pm
      - TestDeployerFactory.pm
      - TestDeployerTest.pm
      - Insert2Mysql.pm
      - Properties.pm
      - TestDeployer.pm
      - TestDriver.pm
      - TestDriverTest.pm
      - Log.pm
  - excluded-tests-20
  - findbugsExcludeFile.xml
  - hbase-site.xml
  - commit-tests
  - smoke-tests
  - all-tests
  - python
    - streaming
      - test_controller.py
  - data
    - pigunit
      - top_queries_expected_top_3.txt
      - top_queries_input_data.txt
      - top_queries.pig
      - top_queries_macro.pig
      - top_queries_params.txt
  - excluded-tests-23
  - excluded-tests
  - bin
    - test-patch.sh
  - org
    - apache
      - pig
        impl
        builtin
        TestStreamingUDF.java
        streaming
        TestPigStreamingUDF.java
        TestStreamingUtil.java
        TestStreamingUDFOutputHandler.java
        builtin
        avro
        code
        pig
        identity_blank_first_args.pig
        with_dates.pig
        identity.pig
        projection_test.pig
        identity_ao2.pig
        identity_just_ao2.pig
        trevni_to_avro.pig
        dump.pig
        namesWithDoubleColons.pig
        recursive_tests.pig
        identity_codec.pig
        trevni_to_trevni.pig
        identity_ai1_ao2.pig
        directory_test.pig
        projection_test_with_schema.pig
        data
        json
        arrays.json
        recordsWithSimpleUnion.json
        recordsWithDoubleUnderscores.json
        recordsAsOutputByPig.json
        recordsWithEnums.json
        recordsWithNullableUnions.json
        recordsOfArraysOfRecords.json
        recursiveRecord.json
        recordsOfArrays.json
        records.json
        projectionTest.json
        recordsAsOutputByPigWithDates.json
        recordsWithFixed.json
        recordsSubSchema.json
        recordsOfStringArrays.json
        recordsWithSimpleUnionOutput.json
        projectionTestWithSchema.json
        recordsSubSchemaNullable.json
        recordsWithMapsOfRecords.json
        arraysAsOutputByPig.json
        recordWithRepeatedSubRecords.json
        recordsWithMaps.json
        schema
        recordWithRepeatedSubRecords.avsc
        testDirectory.avsc
        recordsAsOutputByPig.avsc
        arrays.avsc
        recordsOfStringArrays.avsc
        records.avsc
        recordsWithMapsOfRecords.avsc
        recordsWithDoubleUnderscores.avsc
        recursiveRecord.avsc
        recordsWithEnums.avsc
        recordsWithSimpleUnionOutput.avsc
        recordsOfArraysOfRecords.avsc
        recordsOfArrays.avsc
        recordsWithMaps.avsc
        arraysAsOutputByPig.avsc
        projectionTestWithSchema.avsc
        recordsWithNullableUnions.avsc
        recordsWithFixed.avsc
        projectionTest.avsc
        recordsAsOutputByPigWithDates.avsc
        recordsSubSchemaNullable.avsc
        testDirectoryCounts.avsc
        simpleRecordsTrevni.avsc
        recordsSubSchema.avsc
        recordsWithSimpleUnion.avsc
        TestPluckTuple.java
        orc
        charvarchar.orc
        nullmapkey.orc
        TestOrcStoragePushdown.java
        TestTOP.java
        TestSUBTRACT.java
        TestBigTypeSort.java
        mock
        TestMockStorage.java
        TestAvroStorage.java
        TestFunctionWrapperEvalFunc.java
        TestInvokerGenerator.java
        TestCurrentTime.java
        TestOrcStorage.java
        TestStoreFuncMetadataWrapper.java
        TestLoadStoreFuncLifeCycle.java
        test
        TestPigServer.java
        TestMultiQueryBasic.java
        TestBuiltInBagToTupleOrString.java
        TestPackage.java
        TestInvoker.java
        TestSplitStore.java
        TestNativeMapReduce.java
        TestFilter.java
        TestJobSubmission.java
        TestAlgebraicInstantiation.java
        TestDivide.java
        FakeFSOutputStream.java
        PigStorageNoDefCtor.java
        TestUDFGroovy.java
        TestFilterOpNumeric.java
        TestLoaderStorerShipCacheFilesMR.java
        TestPoissonSampleLoader.java
        PigStorageWithStatistics.java
        TestGTOrEqual.java
        TestLineageFindRelVisitor.java
        TestShortcuts.java
        TestNull.java
        TestAdd.java
        TestAutoLocalMode.java
        MiniGenericCluster.java
        TestLTOrEqual.java
        utils
        Identity.java
        UDFContextTestEvalFunc.java
        ScriptSchemaTestLoader.java
        WrongCustomPartitioner.java
        UDFContextTestLoader.java
        TestHelper.java
        SimpleCustomPartitioner3.java
        WordCount.java
        URLPARSE.java
        BagCount.java
        UDFContextTestLoaderWithSignature.java
        NewLogicalPlanUtil.java
        UDFContextTestEvalFunc3.java
        AccumulativeSumBag.java
        HelperEvalFuncUtils.java
        planComparer
        PlanStructuralComparer.java
        POCastDummy.java
        LocalSeekableInputStream.java
        MultiLevelDerivedUDF1.java
        dotGraph
        DotEdge.java
        NodeMatcher.java
        DOTParser.jjt
        DotGraphReader.java
        ExactKeyMatcher.java
        DotNode.java
        IncreasingKeyMatcher.java
        OperatorPlanLoader.java
        DotGraph.java
        SimpleCustomPartitioner.java
        MultiLevelDerivedUDF2.java
        AccumulatorBagCount.java
        UPPER.java
        GenPhyOp.java
        GenRandomData.java
        ReportingUDF.java
        MultiLevelDerivedUDF3.java
        FILTERFROMFILE.java
        MyUDFWithoutParameter.java
        TypeCheckingTestUtil.java
        MyUDFReturnMap.java
        UDFContextTestEvalFunc2.java
        TestNewPartitionFilterPushDown.java
        TestBatchAliases.java
        TestMRExecutionEngine.java
        TestLoadFunc.java
        InputSchemaUDF.java
        TestParser.java
        TestRelationToExprProject.java
        TestNewPlanPushDownForeachFlatten.java
        TestLimitSchemaStore.java
        TestDefaultDateTimeZone.java
        TestMod.java
        TestJobControlCompiler.java
        TestPigServerWithMacros.java
        FakeFSInputStream.java
        TestScriptLanguageJavaScript.java
        TestProjectStarRangeInUdf.java
        TestMacroExpansion.java
        TestPORegexp.java
        TestUnion.java
        TestRegisteredJarVisibility.java
        TestDataBag.java
        TestEvalPipeline2.java
        TestRank1.java
        TestBuiltinInvoker.java
        TestOrderBy.java
        TestBZip.java
        TestLogToPhyCompiler.java
        TestSplitIndex.java
        TestCommit.java
        TestNewPlanPushUpFilter.java
        TestBestFitCast.java
        TestUnionOnSchema.java
        TestNewPlanRule.java
        TestNewPlanListener.java
        TestImplicitSplit.java
        TestPODistinct.java
        TestMultiply.java
        TestKeyTypeDiscoveryVisitor.java
        TestScriptingLanguagePython.java
        TestLessThan.java
        TestPinOptions.java
        TestForEach.java
        TestScriptUDF.java
        TestFRJoinNullValue.java
        TestBagFormat.java
        TestScriptLanguage.java
        TestEvalFuncOutputAnnotation.java
        TestPOSort.java
        TestProjectRange.java
        NonDefaultBagFactory.java
        TestMultiQuery.java
        TestConversions.java
        TestCharArrayToNumeric.java
        TestLoad.java
        TestCmdLineParser.java
        TestAlgebraicEvalLocal.java
        TestMapReduce.java
        TestCompressedFiles.java
        TestLogicalPlanBuilder.java
        TestCubeDimensions.java
        TestGroupConstParallel.java
        TestUDFContext.java
        TestJobSubmissionMR.java
        TestJoin.java
        TestConstantCalculator.java
        TestStringUDFs.java
        TestTextDataParser.java
        TestRank2.java
        TestNewPlanFilterAboveForeach.java
        TestStreaming.java
        TestFuncSpec.java
        TestTuple.java
        TestMultiQueryLocal.java
        TestPruneColumn.java
        TestNewPlanPruneMapKeys.java
        TestAccumulator.java
        TestNestedForeach.java
        TestPOCast.java
        TestJoinSmoke.java
        TestHBaseStorage.java
        TestPigStats.java
        TestBinInterSedes.java
        TestEvalPipelineLocal.java
        TestHBaseStorageParams.java
        TestEqualTo.java
        TestPigException.java
        TestAlgebraicEval.java
        TestFetch.java
        TestProjectStarExpander.java
        OrdDesc.java
        RegexGroupCount.java
        TestLimitAdjuster.java
        TestNewPlanColumnPrune.java
        TestPOBinCond.java
        TestConstExpr.java
        TestInputOutputMiniClusterFileValidator.java
        TestPigRunner.java
        TestNewPlanFilterRule.java
        TestExampleGenerator.java
        TestMapSideCogroup.java
        TestSecondarySort.java
        TestNewPlanLogToPhyTranslationVisitor.java
        TestStreamingLocal.java
        TestUDF.java
        TestPigScriptParser.java
        OrdAsc.java
        TestSchema.java
        TestForEachNestedPlan.java
        TestFindQuantiles.java
        TestPigTupleRawComparator.java
        PigExecTestCase.java
        TestMergeForEachOptimization.java
        TestTmpFileCompression.java
        TestUDFWithoutParameter.java
        TestCubeOperator.java
        PigTestLoader.java
        TestPlanGeneration.java
        TestSubtract.java
        TestProject.java
        TestOrderBy3.java
        PORead.java
        TestLimitVariable.java
        TestRegexp.java
        TestToolsPigServer.java
        TestLargeFile.java
        data
        input4.pig
        input6.pig
        ExpectedResult3.txt
        inputSubWithinLiteral.pig
        newinputS.txt
        illustrate4.pig
        inputCmdnameAsParamDeclare.pig
        testsubnested_run.pig
        input1.pig
        testsub.pig
        TestIllustrateInput.txt
        ExpectedResult2.pig
        inputMultipleDeclares.pig
        illustrate.pig
        explainScript.pig
        tc.js
        ConfFile1.txt
        inputEscape.pig
        illustrate3.pig
        inputDollarSign.pig
        output26.pig
        ExpectedResult.pig
        ExpectedResult6.pig
        ExpectedResult4.pig
        DotFiles
        new-optlimitplan7.dot
        testScript5.dot
        new-optlimitplan6.dot
        new-optlimitplan1.dot
        optlimitplan5.dot
        optlimitplan8.dot
        optlimitplan1.dot
        new-optlimitplan10.dot
        optlimitplan12.dot
        optplan1.dot
        new-optlimitplan5.dot
        explain1.dot
        optlimitplan7.dot
        new-optlimitplan9.dot
        optlimitplan3.dot
        new-optlimitplan2.dot
        plan1.dot
        testScript4.dot
        new-optlimitplan8.dot
        testScript6.dot
        optlimitplan10.dot
        optlimitplan2.dot
        new-optlimitplan4.dot
        testScript2.dot
        testScript3.dot
        optlimitplan6.dot
        optlimitplan4.dot
        optlimitplan9.dot
        new-optlimitplan3.dot
        testScript1.dot
        ExpectedResultDefault.pig
        ConfFileWithEmptyComments.txt
        TestIllustrateInput2.txt
        ExpectedResultMulDecs.pig
        ConfFileWithValidLines.txt
        ConfFile2.txt
        ExpectedResultDollarSign.pig
        InputFiles
        passwd
        jsTst5.txt
        jsTst2.txt
        jsTst1.txt
        test_broken.ppf
        inputNoVars.pig
        generate_date.sh
        passwd
        TestRelationToExprProjectInput.txt
        testsubnested_exec.pig
        ExpectedResultComment.pig
        inputCmdlineParamPriortoDeclare.pig
        passwd2
        ConfFileWithInvalidLines.txt
        output1.pig
        ConfFileSameParamMultipleTimes.txt
        inputMultipleParams.pig
        inputDefault.pig
        inputSubstitutionWithinValue.pig
        test.ppf
        output3.pig
        illustrate7.pig
        GoldenFiles
        MRC10.gld
        Distinct.gld
        MRC5.gld
        MRC6.gld
        MRC7.gld
        MRC19.gld
        MRC1.gld
        Split2.gld
        Arithmetic.gld
        MRC14.gld
        Split1.gld
        MRC13.gld
        MRC3.gld
        MRC17.gld
        IsNull1.gld
        IsNull2.gld
        Comparison.gld
        Cogroup.gld
        jsTst4
        Limit.gld
        MRC2.gld
        Sort.gld
        MRC15.gld
        MRC16.gld
        MRC4.gld
        BinCond.gld
        Union.gld
        tez
        TEZC-Union-4-OPTOFF.gld
        TEZC-Union-10-OPTOFF.gld
        TEZC-Cogroup-1.gld
        TEZC-Limit-3.gld
        TEZC-MQ-4.gld
        TEZC-Union-9.gld
        TEZC-MQ-2-OPTOFF.gld
        TEZC-Union-2.gld
        TEZC-FRJoin-1.gld
        TEZC-MQ-5.gld
        TEZC-Union-5-OPTOFF.gld
        TEZC-Union-10.gld
        TEZC-Union-6-OPTOFF.gld
        TEZC-Order-1.gld
        TEZC-Distinct-2.gld
        TEZC-Distinct-1.gld
        TEZC-Limit-1.gld
        TEZC-Rank-2.gld
        TEZC-SecKeySort-1.gld
        TEZC-MQ-2.gld
        TEZC-Union-5.gld
        TEZC-Union-1-OPTOFF.gld
        TEZC-Rank-1.gld
        TEZC-MQ-3-OPTOFF.gld
        TEZC-Filter-1.gld
        TEZC-MQ-1.gld
        TEZC-Union-9-OPTOFF.gld
        TEZC-Union-4.gld
        TEZC-Union-3.gld
        TEZC-MQ-3.gld
        TEZC-MQ-1-OPTOFF.gld
        TEZC-MQ-5-OPTOFF.gld
        TEZC-Union-1.gld
        TEZC-Union-8-OPTOFF.gld
        TEZC-Union-7.gld
        TEZC-Join-1.gld
        TEZC-Stream-1.gld
        TEZC-Union-2-OPTOFF.gld
        TEZC-SkewJoin-1.gld
        TEZC-Limit-2.gld
        TEZC-Group-1.gld
        TEZC-SecKeySort-2.gld
        TEZC-FRJoin-2.gld
        TEZC-MQ-4-OPTOFF.gld
        TEZC-Union-7-OPTOFF.gld
        TEZC-Union-6.gld
        TEZC-Union-3-OPTOFF.gld
        TEZC-Union-8.gld
        MRC9.gld
        MRC11.gld
        MRC8.gld
        jsTst3
        Generate.gld
        MRC12.gld
        ComplexForeach.gld
        bzipdir1.bz2
        bzipdir2.bz2
        recordLossblockHeaderEndsAt136500.txt.bz2
        ConfFile3.txt
        input2.pig
        inputSubstitutionWithinShellCommand.pig
        ConfFileDuplicates.txt
        ConfFileComplexVal.txt
        inputThreeParams.pig
        illustrate5.pig
        input7.pig
        inputComment.pig
        illustrate2.pig
        input5.pig
        generate_date.bat
        TestIllustrateInput_invalid.txt
        input3.pig
        ExpectedResultCmdLnPriorDeclare.pig
        ExpectedResult7.pig
        illustrate6.pig
        TestSecondarySortMR.java
        Util.java
        TestTypeCheckingValidatorNewLP.java
        TestGroupConstParallelMR.java
        TestBuiltin.java
        TestTypedMap.java
        TestPigSplit.java
        TestBloom.java
        TestGreaterThan.java
        TestEvalPipeline.java
        TestPOGenerate.java
        TestNewPlanOperatorPlan.java
        OptimizeLimitPlanPrinter.java
        TestFilterUDF.java
        TestLocal.java
        TestIn.java
        TestCase.java
        TestMergeJoinOuter.java
        pigunit
        TestPigTest.java
        pig
        TestGruntParser.java
        TestMRCompiler.java
        TestLOLoadDeterminedSchema.java
        TestNewPlanImplicitSplit.java
        TestFilterOpString.java
        TestPigStreaming.java
        TestPigContext.java
        TestNumberOfReducers.java
        TestDataModel.java
        TestSchemaUtil.java
        TestPOPartialAgg.java
        TestCollectedGroup.java
        TestPhyPatternMatch.java
        OrdDescNumeric.java
        TestScalarAliases.java
        TestStore.java
        TestMultiQueryCompiler.java
        TestPOUserFunc.java
        TestGrunt.java
        TestPi.java
        TestLocal2.java
        TestMapReduce2.java
        TestBinaryExpressionOps.java
        TestMapProjectionDuplicate.java
        TestBlackAndWhitelistValidator.java
        TestLocalRearrange.java
        TestRollupDimensions.java
        PigStorageWithDifferentCaster.java
        TestNullConstant.java
        TestInstantiateFunc.java
        TestForEachNestedPlanLocal.java
        TestPOPartialAggPlan.java
        TestDeleteOnFail.java
        TestPigStorage.java
        junit
        OrderedJUnit4Runner.java
        TestPigProgressReporting.java
        TestLoaderStorerShipCacheFiles.java
        TestAssert.java
        TestPONegative.java
        TestEmptyInputDir.java
        TestGFCross.java
        TestDataBagAccess.java
        TestFRJoin.java
        TestSample.java
        TestStoreOld.java
        TestPOMapLookUp.java
        TestPigContextClassCache.java
        TestRank3.java
        TestCounters.java
        PigStorageWithSchema.java
        TestNewPlanLogicalOptimizer.java
        TestFinish.java
        TestBoolean.java
        TestMRJobStats.java
        TestStoreInstances.java
        TestSplitCombine.java
        TestUTF8.java
        TestSkewedJoin.java
        TestPhyOp.java
        TestMonitoredUDF.java
        TestSplit.java
        TestForEachStar.java
        TestParamSubPreproc.java
        TestJsonLoaderStorage.java
        TestOptimizeLimit.java
        TestFRJoin2.java
        TestPredeployedJar.java
        TestInfixArithmetic.java
        TestMergeJoin.java
        TestNotEqualTo.java
        TestInputOutputFileValidator.java
        TestPOSplit.java
        TestSampleOptimizer.java
        TestCombiner.java
        TestResourceSchema.java
        TestOrderBy2.java
        TestCustomPartitioner.java
        backend
        hadoop
        hbase
        TestHBaseStorageFiltering.java
        executionengine
        mapReduceLayer
        TestPigBytesRawComparator.java
        TestInputSizeReducerEstimator.java
        accumulo
        TestAccumuloPigCluster.java
        TestAccumuloStorage.java
        TestAbstractAccumuloStorage.java
        TestAccumuloStorageConfiguration.java
        TestAccumuloColumns.java
        TestAccumuloStorageOptions.java
        TestAccumuloBinaryConverter.java
        newplan
        logical
        relational
        TestLocationInPhysicalPlan.java
        LOTestHelper.java
        optimizer
        TestImplicitSplitOnTuple.java
        TestSchemaResetter.java
        TestLoadFuncWrapper.java
        data
        utils
        TestMethodHelper.java
        TestSchemaTuple.java
        TestAlgebraicEvalWithParameterizedReturnType.java
        pigunit
        pig
        GruntParser.java
        PigServer.java
        Cluster.java
        MiniClusterRunner.java
        PigTest.java
        TestStoreFuncWrapper.java
        tools
        grunt
        TestGruntParser.java
        tez
        TestTezJobControlCompiler.java
        TestTezLauncher.java
        TestJobSubmissionTez.java
        TestTezAutoParallelism.java
        TestLoaderStorerShipCacheFilesTez.java
        TestTezCompiler.java
        TestGroupConstParallelTez.java
        TestSecondarySortTez.java
        TestLoadFuncMetadataWrapper.java
        TestPrimitiveEvalFunc.java
        parser
        TestSchemaAliasVisitor.java
        TestDefaultDataTypeInserter.pig
        TestQueryLexer.java
        TestUnionOnSchemaSetter.java
        TestErrorHandling.java
        TestAST.pig
        TestQueryParser.java
        TestLogicalPlanGenerator.java
        TestParser.pig
        ParsingFailureException.java
        TestLexer.pig
        TestScalarVisitor.java
        TestQueryParserUtils.java
        ParserTestingUtils.java
        TreePrinter.java
        TestAstValidator.java
        TestColumnAliasConversion.java
        TestTypedOutputEvalFunc.java
        TestMain.java
  - perf
    - pigmix
      - src
        pig
        L2.pig
        L16.pig
        L13.pig
        L17.pig
        L3.pig
        L11.pig
        L9.pig
        L4.pig
        L6.pig
        L14.pig
        L12.pig
        L7.pig
        L10.pig
        L15.pig
        L5.pig
        L1.pig
        L8.pig
        java
        org
        apache
        pig
        test
        pigmix
        datagen
        DataGenerator.java
        udf
        PigPerformanceLoader.java
        mapreduce
        L15.java
        L14.java
        L6.java
        L8.java
        L11.java
        L1.java
        L5.java
        L9.java
        L12.java
        L17.java
        L3.java
        L4.java
        L10.java
        L16.java
        L13.java
        L2.java
        Library.java
        L7.java
      - build.xml
      - lib
      - bin
        runpigmix.pl
        generate_data.sh
      - conf
        config.sh
- doap_Pig.rdf
- license
  - jline-LICENSE.txt
  - brics-LICENSE.txt
  - junit-LICENSE.txt
  - javacc-LICENSE.txt
  - hadoop-LICENSE.txt
- ivy.xml
- README.md
- RELEASE_NOTES.txt
- KEYS
- bin
  - pig.py
  - pig.cmd
  - pig
- autocomplete
- .gitignore
- contrib
  - CHANGES.txt
  - piggybank
    - java
      - src
        main
        java
        org
        apache
        pig
        piggybank
        storage
        SequenceFileLoader.java
        avro
        PigSchema2Avro.java
        AvroStorageUtils.java
        AvroStorageLog.java
        AvroStorageInputStream.java
        AvroSchemaManager.java
        PigAvroInputFormat.java
        AvroStorage.java
        PigAvroDatumReader.java
        PigAvroRecordReader.java
        PigAvroRecordWriter.java
        AvroSchema2Pig.java
        PigAvroOutputFormat.java
        PigAvroDatumWriter.java
        MyRegExLoader.java
        FixedWidthLoader.java
        JsonMetadata.java
        allloader
        LoadFuncHelper.java
        HiveColumnarStorage.java
        partition
        PathPartitionHelper.java
        PathPartitioner.java
        DBStorage.java
        IndexedStorage.java
        XMLLoader.java
        HiveColumnarLoader.java
        PigStorageSchema.java
        FixedWidthStorer.java
        AllLoader.java
        HadoopJobHistoryLoader.java
        RegExLoader.java
        apachelog
        CommonLogLoader.java
        CombinedLogLoader.java
        MultiStorage.java
        CSVExcelStorage.java
        hiverc
        HiveRCOutputFormat.java
        HiveRCSchemaUtil.java
        HiveRCRecordReader.java
        HiveRCInputFormat.java
        CSVLoader.java
        evaluation
        Over.java
        xml
        XPath.java
        MaxTupleBy1stField.java
        Stitch.java
        util
        apachelogparser
        SearchTermExtractor.java
        SearchEngineExtractor.java
        HostExtractor.java
        DateExtractor.java
        ToTuple.java
        ToBag.java
        Top.java
        SearchQuery.java
        decode
        Bin.java
        BinCond.java
        Decode.java
        datetime
        diff
        ISOHoursBetween.java
        ISODaysBetween.java
        ISOMonthsBetween.java
        ISOSecondsBetween.java
        ISOMinutesBetween.java
        ISOYearsBetween.java
        truncate
        ISOToMonth.java
        ISOToSecond.java
        ISOToWeek.java
        ISOHelper.java
        ISOToHour.java
        ISOToDay.java
        ISOToMinute.java
        ISOToYear.java
        convert
        ISOToUnix.java
        UnixToISO.java
        CustomFormatToISO.java
        DiffDate.java
        IsInt.java
        math
        ROUND.java
        SIN.java
        ULP.java
        LOG10.java
        DoubleGetExponent.java
        ASIN.java
        DoubleAbs.java
        POW.java
        COSH.java
        DoubleMin.java
        FloatSignum.java
        SINH.java
        SCALB.java
        FloatMin.java
        Base.java
        DoubleUlp.java
        FLOOR.java
        copySign.java
        RINT.java
        MAX.java
        SQRT.java
        SIGNUM.java
        EXP.java
        DoubleCopySign.java
        toDegrees.java
        FloatUlp.java
        TAN.java
        TANH.java
        FloatCopySign.java
        IntAbs.java
        toRadians.java
        LongMin.java
        DoubleMax.java
        IntMax.java
        FloatNextAfter.java
        EXPM1.java
        Util.java
        nextAfter.java
        DoubleNextAfter.java
        ATAN2.java
        ATAN.java
        IEEEremainder.java
        COS.java
        LOG1P.java
        LongMax.java
        DoubleDoubleBase.java
        FloatRound.java
        FloatGetExponent.java
        HYPOT.java
        DoubleRound.java
        ACOS.java
        FloatNextup.java
        DoubleBase.java
        CEIL.java
        getExponent.java
        FloatMax.java
        MIN.java
        DoubleNextup.java
        FloatAbs.java
        CBRT.java
        RANDOM.java
        LongAbs.java
        ABS.java
        LOG.java
        IntMin.java
        NEXTUP.java
        DoubleSignum.java
        IsDouble.java
        stats
        COR.java
        COV.java
        IsLong.java
        IsFloat.java
        string
        Reverse.java
        LookupInFiles.java
        HashFNV.java
        LENGTH.java
        HashFNV1.java
        LcFirst.java
        RegexExtractAll.java
        INDEXOF.java
        UcFirst.java
        Trim.java
        RegexExtract.java
        SUBSTRING.java
        UPPER.java
        RegexMatch.java
        LASTINDEXOF.java
        Split.java
        HashFNV2.java
        LOWER.java
        Stuff.java
        REPLACE.java
        ExtremalTupleByNthField.java
        IsNumeric.java
        test
        java
        org
        apache
        pig
        piggybank
        test
        storage
        avro
        TestAvroStorageUtils.java
        avro_test_files
        expected_testMultipleSchemas1.avro
        expected_testRecordWithFieldSchema.avro
        expected_testRecursiveRecordReference2.avro
        expected_test_dir_1.avro
        test_generic_union.avro
        expected_testCorruptedFile.avro
        test_dir1
        test_subdir
        test_glob4.avro
        test_glob5.avro
        test_glob2.avro
        test_glob3.avro
        test_glob1.avro
        test_array.avro
        test_corrupted_file.avro
        expected_testArrayDefault.avro
        expected_testRecordSplit2.avro
        test_loadavrowithnulls.avro
        test_recursive_record_in_union.avsc
        test_record.avsc
        test_recursive_record_in_union.avro
        test_recursive_record_in_map.avro
        expected_testUserDefinedLoadSchema.avro
        expected_testArrayWithSchema.avro
        test_no_extension
        test_user_defined_load_schema
        testUserDefinedLoadSchema_input2.avro
        testUserDefinedLoadSchema_input1.avro
        expected_testRecordSplitFromText2.avro
        expected_testFileWithNoExtension.avro
        expected_testDefaultSchemaWrite.avro
        test_recursive_record_in_array.avro
        messages.avro
        expected_testRecursiveRecordReference1.avro
        expected_testArrayWithSchemaURI.avro
        test_merge_schemas_default
        Employee3.avro
        Employee6.avro
        Employee4.avro
        test_recursive_record_in_record.avro
        test_primitive_types
        test_double.avro
        test_string.avro
        test_float.avro
        test_int.avro
        test_long.avro
        test_enum.avro
        test_complex_types
        test_record_int.avro
        test_record_string.avro
        test_record_double.avro
        test_record_enum.avro
        test_record_float.avro
        test_record_long.avro
        expected_test_dir_1_2.avro
        expected_testRecordSplit1.avro
        expected_testDir.avro
        expected_testRecordSplitFromText1.avro
        test_array.avsc
        test_record.txt
        expected_testRecursiveRecordReference3.avro
        test_record.avro
        expected_testMultipleSchemas2.avro
        test_dir2
        test_glob4.avro
        test_glob5.avro
        TestAvroStorage.java
        TestHiveColumnarLoader.java
        TestHadoopJobHistoryLoader.java
        TestHelper.java
        TestCombinedLogLoader.java
        TestDBStorage.java
        TestPathPartitioner.java
        TestXMLLoader.java
        TestLoadFuncHelper.java
        TestMyRegExLoader.java
        TestIndexedStorage.java
        TestSequenceFileLoader.java
        TestMultiStorageCompression.java
        TestFixedWidthLoader.java
        TestCSVExcelStorage.java
        TestRegExLoader.java
        TestFixedWidthStorer.java
        TestPathPartitionHelper.java
        TestMultiStorage.java
        TestCSVStorage.java
        TestHiveColumnarStorage.java
        TestAvroStorageData
        expected_testRecordWithFieldSchema.avro
        test_array.avro
        expected_testArrayDefault.avro
        expected_testRecordSplit2.avro
        expected_testArrayWithSchema.avro
        expected_testRecordSplit1.avro
        test_record.avro
        TestCommonLogLoader.java
        TestAllLoader.java
        evaluation
        xml
        XPathTest.java
        data
        test-file-2.xml.bz2
        TestIsInt.java
        TestIsLong.java
        TestMathUDF.java
        TestExtremalTupleByNthField.java
        util
        apachelogparser
        TestSearchEngineExtractor.java
        TestHostExtractor.java
        TestDateExtractor.java
        TestSearchTermExtractor.java
        TestSearchQuery.java
        TestTop.java
        TestToBagToTuple.java
        TestIsNumeric.java
        TestStat.java
        decode
        TestDecode.java
        TestEvalString.java
        datetime
        diff
        TestDiffDateTime.java
        truncate
        TestTruncateDateTime.java
        convert
        TestConvertDateTime.java
        TestDiffDate.java
        TestIsDouble.java
        TestIsFloat.java
        string
        TestHashFNV.java
        TestReverse.java
        TestRegex.java
        TestStuff.java
        TestLength.java
        TestLookupInFiles.java
        TestUcFirst.java
        TestSplit.java
        data
        jh
        localhost_1272395783545_job_201004271216_9998_user_PigLatinTest.pig
        localhost_1272395783545_job_conf.xml
        localhost_1272395783545_job_201004271216_9998_conf.xml
        evaluation
        TestOver.java
        TestStitch.java
      - build.xml
      - lib
        .gitignore
- conf
  - log4j.properties.template
  - pig.properties
  - test-log4j.properties

/*
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 * with the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

package org.apache.pig.backend.hadoop.executionengine.util;

import java.io.IOException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.HashSet;
import java.util.Iterator;
import java.util.List;
import java.util.Map;

import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.PathFilter;
import org.apache.hadoop.mapreduce.InputSplit;
import org.apache.pig.FuncSpec;
import org.apache.pig.PigConfiguration;
import org.apache.pig.PigException;
import org.apache.pig.backend.executionengine.ExecException;
import org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.JobControlCompiler;
import org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigMapReduce;
import org.apache.pig.backend.hadoop.executionengine.physicalLayer.PhysicalOperator;
import org.apache.pig.backend.hadoop.executionengine.physicalLayer.plans.PhysicalPlan;
import org.apache.pig.backend.hadoop.executionengine.physicalLayer.relationalOperators.POStore;
import org.apache.pig.backend.hadoop.executionengine.shims.HadoopShims;
import org.apache.pig.data.DataBag;
import org.apache.pig.data.DataType;
import org.apache.pig.data.Tuple;
import org.apache.pig.data.TupleFactory;
import org.apache.pig.impl.PigContext;
import org.apache.pig.impl.builtin.PartitionSkewedKeys;
import org.apache.pig.impl.io.FileLocalizer;
import org.apache.pig.impl.io.FileSpec;
import org.apache.pig.impl.io.ReadToEndLoader;
import org.apache.pig.impl.plan.NodeIdGenerator;
import org.apache.pig.impl.plan.OperatorKey;
import org.apache.pig.impl.util.Pair;
import org.apache.pig.impl.util.UDFContext;
import org.apache.pig.impl.util.Utils;

/**
 * A class of utility static methods to be used in the hadoop map reduce backend
 */
public class MapRedUtil {

    private static Log log = LogFactory.getLog(MapRedUtil.class);
    private static final TupleFactory tf = TupleFactory.getInstance();

    public static final String FILE_SYSTEM_NAME = "fs.default.name";

    /**
     * Loads the key distribution sampler file
     *
     * @param keyDistFile the name for the distribution file
     * @param totalReducers gets set to the total number of reducers as found in the dist file
     * @param keyType Type of the key to be stored in the return map. It currently treats Tuple as a special case.
     */
    @SuppressWarnings("unchecked")
    public static <E> Map<E, Pair<Integer, Integer>> loadPartitionFileFromLocalCache(
            String keyDistFile, Integer[] totalReducers, byte keyType, Configuration mapConf)
            throws IOException {

        Map<E, Pair<Integer, Integer>> reducerMap = new HashMap<E, Pair<Integer, Integer>>();

        // use local file system to get the keyDistFile
        Configuration conf = new Configuration(false);

        if (mapConf.get("yarn.resourcemanager.principal")!=null) {
            conf.set("yarn.resourcemanager.principal", mapConf.get("yarn.resourcemanager.principal"));
        }

        if (PigMapReduce.sJobConfInternal.get().get("fs.file.impl")!=null)
            conf.set("fs.file.impl", PigMapReduce.sJobConfInternal.get().get("fs.file.impl"));
        if (PigMapReduce.sJobConfInternal.get().get("fs.hdfs.impl")!=null)
            conf.set("fs.hdfs.impl", PigMapReduce.sJobConfInternal.get().get("fs.hdfs.impl"));

        copyTmpFileConfigurationValues(PigMapReduce.sJobConfInternal.get(), conf);

        conf.set(MapRedUtil.FILE_SYSTEM_NAME, "file:///");

        ReadToEndLoader loader = new ReadToEndLoader(Utils.getTmpFileStorageObject(PigMapReduce.sJobConfInternal.get()), conf,
                keyDistFile, 0);
        DataBag partitionList;
        Tuple t = loader.getNext();
        if (t == null) {
            // this could happen if the input directory for sampling is empty
            log.warn("Empty dist file: " + keyDistFile);
            return reducerMap;
        }
        // The keydist file is structured as (key, min, max)
        // min, max being the index of the reducers
        Map<String, Object > distMap = (Map<String, Object>) t.get (0);
        partitionList = (DataBag) distMap.get(PartitionSkewedKeys.PARTITION_LIST);
        totalReducers[0] = Integer.valueOf(""+distMap.get(PartitionSkewedKeys.TOTAL_REDUCERS));
        Iterator<Tuple> it = partitionList.iterator();
        while (it.hasNext()) {
            Tuple idxTuple = it.next();
            Integer maxIndex = (Integer) idxTuple.get(idxTuple.size() - 1);
            Integer minIndex = (Integer) idxTuple.get(idxTuple.size() - 2);
            // Used to replace the maxIndex with the number of reducers
            if (maxIndex < minIndex) {
                maxIndex = totalReducers[0] + maxIndex;
            }
            E keyT;

            // if the join is on more than 1 key
            if (idxTuple.size() > 3) {
                // remove the last 2 fields of the tuple, i.e: minIndex and maxIndex and store
                // it in the reducer map
                Tuple keyTuple = tf.newTuple();
                for (int i=0; i < idxTuple.size() - 2; i++) {
                    keyTuple.append(idxTuple.get(i));
                }
                keyT = (E) keyTuple;
            } else {
                if (keyType == DataType.TUPLE) {
                    keyT = (E)tf.newTuple(1);
                    ((Tuple)keyT).set(0,idxTuple.get(0));
                } else {
                    keyT = (E) idxTuple.get(0);
                }
            }
            // number of reducers
            Integer cnt = maxIndex - minIndex;
            reducerMap.put(keyT, new Pair(minIndex, cnt));// 1 is added to account for the 0 index
        }
        return reducerMap;
    }

    public static void copyTmpFileConfigurationValues(Configuration fromConf, Configuration toConf) {
        // Currently these are used only by loaders (and not storers), so we do not need to copy
        // mapred properties that are required by @{Link SequenceFileInterStorage}

        if (fromConf.getBoolean(PigConfiguration.PIG_ENABLE_TEMP_FILE_COMPRESSION, false)) {
            toConf.setBoolean(PigConfiguration.PIG_ENABLE_TEMP_FILE_COMPRESSION, true);
            if (fromConf.get(PigConfiguration.PIG_TEMP_FILE_COMPRESSION_CODEC) != null) {
                toConf.set(PigConfiguration.PIG_TEMP_FILE_COMPRESSION_CODEC,
                        fromConf.get(PigConfiguration.PIG_TEMP_FILE_COMPRESSION_CODEC));
            }
            if (fromConf.get(PigConfiguration.PIG_TEMP_FILE_COMPRESSION_STORAGE) != null) {
                toConf.set(PigConfiguration.PIG_TEMP_FILE_COMPRESSION_STORAGE,
                        fromConf.get(PigConfiguration.PIG_TEMP_FILE_COMPRESSION_STORAGE));
            }
        }
    }

    public static void setupUDFContext(Configuration job) throws IOException {
        UDFContext udfc = UDFContext.getUDFContext();
        udfc.addJobConf(job);
        // don't deserialize in front-end
        if (udfc.isUDFConfEmpty()) {
            udfc.deserialize();
        }
    }

    /**
     * Sets up output and log dir paths for a single-store streaming job
     *
     * @param st - POStore of the current job
     * @param pigContext
     * @param conf
     * @throws IOException
     */
    public static void setupStreamingDirsConfSingle(POStore st, PigContext pigContext,
            Configuration conf) throws IOException {
        // set out filespecs
        String outputPathString = st.getSFile().getFileName();
        if (HadoopShims.hasFileSystemImpl(new Path(outputPathString), conf)) {
            conf.set("pig.streaming.log.dir",
                    new Path(outputPathString, JobControlCompiler.LOG_DIR).toString());
        }
        else {
            String tmpLocationStr = FileLocalizer.getTemporaryPath(pigContext).toString();
            Path tmpLocation = new Path(tmpLocationStr);
            conf.set("pig.streaming.log.dir",
                    new Path(tmpLocation, JobControlCompiler.LOG_DIR).toString());
        }
        conf.set("pig.streaming.task.output.dir", outputPathString);
    }

    /**
     * Sets up output and log dir paths for a multi-store streaming job
     *
     * @param pigContext
     * @param conf
     * @throws IOException
     */
    public static void setupStreamingDirsConfMulti(PigContext pigContext, Configuration conf)
            throws IOException {

        String tmpLocationStr = FileLocalizer.getTemporaryPath(pigContext).toString();
        Path tmpLocation = new Path(tmpLocationStr);
        conf.set("pig.streaming.log.dir",
                new Path(tmpLocation, JobControlCompiler.LOG_DIR).toString());
        conf.set("pig.streaming.task.output.dir", tmpLocation.toString());
    }

    public static FileSpec checkLeafIsStore(
            PhysicalPlan plan,
            PigContext pigContext) throws ExecException {
        try {
            PhysicalOperator leaf = plan.getLeaves().get(0);
            FileSpec spec = null;
            if(!(leaf instanceof POStore)){
                String scope = leaf.getOperatorKey().getScope();
                POStore str = new POStore(new OperatorKey(scope,
                    NodeIdGenerator.getGenerator().getNextNodeId(scope)));
                spec = new FileSpec(FileLocalizer.getTemporaryPath(
                    pigContext).toString(),
                    new FuncSpec(Utils.getTmpFileCompressorName(pigContext)));
                str.setSFile(spec);
                plan.addAsLeaf(str);
            } else{
                spec = ((POStore)leaf).getSFile();
            }
            return spec;
        } catch (Exception e) {
            int errCode = 2045;
            String msg = "Internal error. Not able to check if the leaf node is a store operator.";
            throw new ExecException(msg, errCode, PigException.BUG, e);
        }
    }

    /**
     * Get all files recursively from the given list of files
     *
     * @param files a list of FileStatus
     * @param conf the configuration object
     * @return the list of fileStatus that contains all the files in the given
     *         list and, recursively, all the files inside the directories in
     *         the given list
     * @throws IOException
     */
    public static List<FileStatus> getAllFileRecursively(
            List<FileStatus> files, Configuration conf) throws IOException {
        List<FileStatus> result = new ArrayList<FileStatus>();
        int len = files.size();
        for (int i = 0; i < len; ++i) {
            FileStatus file = files.get(i);
            if (file.isDir()) {
                Path p = file.getPath();
                FileSystem fs = p.getFileSystem(conf);
                addInputPathRecursively(result, fs, p, hiddenFileFilter);
            } else {
                result.add(file);
            }
        }
        log.info("Total input paths to process : " + result.size());
        return result;
    }

    private static void addInputPathRecursively(List<FileStatus> result,
            FileSystem fs, Path path, PathFilter inputFilter)
            throws IOException {
        for (FileStatus stat: fs.listStatus(path, inputFilter)) {
            if (stat.isDir()) {
                addInputPathRecursively(result, fs, stat.getPath(), inputFilter);
            } else {
                result.add(stat);
            }
        }
    }

    private static final PathFilter hiddenFileFilter = new PathFilter(){
        @Override
        public boolean accept(Path p){
            String name = p.getName();
            return !name.startsWith("_") && !name.startsWith(".");
        }
    };

    public static long getPathLength(FileSystem fs, FileStatus status)
            throws IOException{
        return getPathLength(fs, status, Long.MAX_VALUE);
    }

    /**
     * Returns the total number of bytes for this file, or if a directory all
     * files in the directory.
     * 
     * @param fs FileSystem
     * @param status FileStatus
     * @param max Maximum value of total length that will trigger exit. Many
     * times we're only interested whether the total length of files is greater
     * than X or not. In such case, we can exit the function early as soon as
     * the max is reached.
     * @return
     * @throws IOException
     */
    public static long getPathLength(FileSystem fs, FileStatus status, long max)
            throws IOException {
        if (!status.isDir()) {
            return status.getLen();
        } else {
            FileStatus[] children = fs.listStatus(
                    status.getPath(), hiddenFileFilter);
            long size = 0;
            for (FileStatus child : children) {
                size += getPathLength(fs, child, max);
                if (size > max) return size;
            }
            return size;
        }
    }

    /* The following codes are for split combination: see PIG-1518
     *
     */
    private static Comparator<Node> nodeComparator = new Comparator<Node>() {
        @Override
        public int compare(Node o1, Node o2) {
            long cmp = o1.length - o2.length;
            return cmp == 0 ? 0 : cmp < 0 ? -1 : 1;
        }
    };

    private static final class ComparableSplit implements Comparable<ComparableSplit> {
        private InputSplit rawInputSplit;
        private HashSet<Node> nodes;
        // id used as a tie-breaker when two splits are of equal size.
        private long id;
        ComparableSplit(InputSplit split, long id) {
            rawInputSplit = split;
            nodes = new HashSet<Node>();
            this.id = id;
        }

        void add(Node node) {
            nodes.add(node);
        }

        void removeFromNodes() {
            for (Node node : nodes)
                node.remove(this);
        }

        public InputSplit getSplit() {
            return rawInputSplit;
        }

        @Override
        public boolean equals(Object other) {
            if (other == null || !(other instanceof ComparableSplit))
                return false;
            return (compareTo((ComparableSplit) other) == 0);
        }

        @Override
        public int hashCode() {
            return 41;
        }

        @Override
        public int compareTo(ComparableSplit other) {
            try {
                long cmp = rawInputSplit.getLength() - other.rawInputSplit.getLength();
                // in descending order
                return cmp == 0 ? (id == other.id ? 0 : id < other.id ? -1 : 1) : cmp < 0 ?  1 : -1;
            } catch (IOException e) {
                throw new RuntimeException(e);
            } catch (InterruptedException e) {
                throw new RuntimeException(e);
            }
        }
    }

    private static class DummySplit extends InputSplit {
        private long length;

        @Override
        public String[] getLocations() {
            return null;
        }

        @Override
        public long getLength() {
            return length;
        }

        public void setLength(long length) {
            this.length = length;
        }
    }

    private static class Node {
        private long length = 0;
        private ArrayList<ComparableSplit> splits;
        private boolean sorted;

        Node() throws IOException, InterruptedException {
            length = 0;
            splits = new ArrayList<ComparableSplit>();
            sorted = false;
        }

        void add(ComparableSplit split) throws IOException, InterruptedException {
            splits.add(split);
            length++;
        }

        void remove(ComparableSplit split) {
            if (!sorted)
                sort();
            int index = Collections.binarySearch(splits, split);
            if (index >= 0) {
                splits.remove(index);
                length--;
            }
        }

        void sort() {
            if (!sorted) {
                Collections.sort(splits);
                sorted = true;
            }
        }

        ArrayList<ComparableSplit> getSplits() {
            return splits;
        }

        public long getLength() {
            return length;
        }
    }

    public static List<List<InputSplit>> getCombinePigSplits(List<InputSplit>
        oneInputSplits, long maxCombinedSplitSize, Configuration conf)
          throws IOException, InterruptedException {
        ArrayList<Node> nodes = new ArrayList<Node>();
        HashMap<String, Node> nodeMap = new HashMap<String, Node>();
        List<List<InputSplit>> result = new ArrayList<List<InputSplit>>();
        List<Long> resultLengths = new ArrayList<Long>();
        long comparableSplitId = 0;

        int size = 0, nSplits = oneInputSplits.size();
        InputSplit lastSplit = null;
        int emptyCnt = 0;
        for (InputSplit split : oneInputSplits) {
            if (split.getLength() == 0) {
                emptyCnt++;
                continue;
            }
            if (split.getLength() >= maxCombinedSplitSize) {
                comparableSplitId++;
                ArrayList<InputSplit> combinedSplits = new ArrayList<InputSplit>();
                combinedSplits.add(split);
                result.add(combinedSplits);
                resultLengths.add(split.getLength());
            } else {
                ComparableSplit csplit = new ComparableSplit(split, comparableSplitId++);
                String[] locations = split.getLocations();
                // sort the locations to stabilize the number of maps: PIG-1757
                Arrays.sort(locations);
                HashSet<String> locationSeen = new HashSet<String>();
                for (String location : locations)
                {
                    if (!locationSeen.contains(location))
                    {
                        Node node = nodeMap.get(location);
                        if (node == null) {
                            node = new Node();
                            nodes.add(node);
                            nodeMap.put(location, node);
                        }
                        node.add(csplit);
                        csplit.add(node);
                        locationSeen.add(location);
                    }
                }
                lastSplit = split;
                size++;
            }
        }
        /* verification code: debug purpose
        {
          ArrayList<ComparableSplit> leftoverSplits = new ArrayList<ComparableSplit>();
          HashSet<InputSplit> seen = new HashSet<InputSplit>();
          for (Node node : nodes) {
            if (node.getLength() > 0)
            {
              ArrayList<ComparableSplit> splits = node.getSplits();
              for (ComparableSplit split : splits) {
                if (!seen.contains(split.getSplit())) {
                  // remove duplicates. The set has to be on the raw input split not the
                  // comparable input split as the latter overrides the compareTo method
                  // so its equality semantics is changed and not we want here
                  seen.add(split.getSplit());
                  leftoverSplits.add(split);
                }
              }
            }
          }

          int combinedSplitLen = 0;
          for (PigSplit split : result)
            combinedSplitLen += split.getNumPaths();
          if (combinedSplitLen + leftoverSplits.size()!= nSplits-emptyCnt) {
            throw new AssertionError("number of combined splits {"+combinedSplitLen+"+"+leftoverSplits.size()+"-"+size+"} does not match the number of original splits ["+nSplits+"].");
          }
        }
        */
        if (nSplits > 0 && emptyCnt == nSplits)
        {
            // if all splits are empty, add a single empty split as currently an empty directory is
            // not properly handled somewhere
            ArrayList<InputSplit> combinedSplits = new ArrayList<InputSplit>();
            combinedSplits.add(oneInputSplits.get(0));
            result.add(combinedSplits);
        }
        else if (size == 1) {
            ArrayList<InputSplit> combinedSplits = new ArrayList<InputSplit>();
            combinedSplits.add(lastSplit);
            result.add(combinedSplits);
        } else if (size > 1) {
            // combine small splits
            Collections.sort(nodes, nodeComparator);
            DummySplit dummy = new DummySplit();
            // dummy is used to search for next split of suitable size to be combined
            ComparableSplit dummyComparableSplit = new ComparableSplit(dummy, -1);
            for (Node node : nodes) {
                // sort the splits on this node in descending order
                node.sort();
                long totalSize = 0;
                ArrayList<ComparableSplit> splits = node.getSplits();
                int idx;
                int lenSplits;
                ArrayList<InputSplit> combinedSplits = new ArrayList<InputSplit>();
                ArrayList<ComparableSplit> combinedComparableSplits = new ArrayList<ComparableSplit>();
                while (!splits.isEmpty()) {
                    combinedSplits.add(splits.get(0).getSplit());
                    combinedComparableSplits.add(splits.get(0));
                    int startIdx = 1;
                    lenSplits = splits.size();
                    totalSize += splits.get(0).getSplit().getLength();
                    long spaceLeft = maxCombinedSplitSize - totalSize;
                    dummy.setLength(spaceLeft);
                    idx = Collections.binarySearch(node.getSplits().subList(startIdx, lenSplits), dummyComparableSplit);
                    idx = -idx-1+startIdx;
                    while (idx < lenSplits)
                    {
                        long thisLen = splits.get(idx).getSplit().getLength();
                        combinedSplits.add(splits.get(idx).getSplit());
                        combinedComparableSplits.add(splits.get(idx));
                        totalSize += thisLen;
                        spaceLeft -= thisLen;
                        if (spaceLeft <= 0)
                            break;
                        // find next combinable chunk
                        startIdx = idx + 1;
                        if (startIdx >= lenSplits)
                            break;
                        dummy.setLength(spaceLeft);
                        idx = Collections.binarySearch(node.getSplits().subList(startIdx, lenSplits), dummyComparableSplit);
                        idx = -idx-1+startIdx;
                    }
                    if (totalSize > maxCombinedSplitSize/2) {
                        result.add(combinedSplits);
                        resultLengths.add(totalSize);
                        removeSplits(combinedComparableSplits);
                        totalSize = 0;
                        combinedSplits = new ArrayList<InputSplit>();
                        combinedComparableSplits.clear();
                        splits = node.getSplits();
                    } else {
                        if (combinedSplits.size() != lenSplits)
                            throw new AssertionError("Combined split logic error!");
                        break;
                    }
                }
            }
            // handle leftovers
            ArrayList<ComparableSplit> leftoverSplits = new ArrayList<ComparableSplit>();
            HashSet<InputSplit> seen = new HashSet<InputSplit>();
            for (Node node : nodes) {
                for (ComparableSplit split : node.getSplits()) {
                    if (!seen.contains(split.getSplit())) {
                        // remove duplicates. The set has to be on the raw input split not the
                        // comparable input split as the latter overrides the compareTo method
                        // so its equality semantics is changed and not we want here
                        seen.add(split.getSplit());
                        leftoverSplits.add(split);
                    }
                }
            }

            /* verification code
            int combinedSplitLen = 0;
            for (PigSplit split : result)
              combinedSplitLen += split.getNumPaths();
            if (combinedSplitLen + leftoverSplits.size()!= nSplits-emptyCnt)
              throw new AssertionError("number of combined splits ["+combinedSplitLen+"+"+leftoverSplits.size()+"] does not match the number of original splits ["+nSplits+"].");
            */
            if (!leftoverSplits.isEmpty())
            {
                long totalSize = 0;
                ArrayList<InputSplit> combinedSplits = new ArrayList<InputSplit>();
                ArrayList<ComparableSplit> combinedComparableSplits = new ArrayList<ComparableSplit>();

                int splitLen = leftoverSplits.size();
                for (int i = 0; i < splitLen; i++)
                {
                    ComparableSplit split = leftoverSplits.get(i);
                    long thisLen = split.getSplit().getLength();
                    if (totalSize + thisLen >= maxCombinedSplitSize) {
                        removeSplits(combinedComparableSplits);
                        result.add(combinedSplits);
                        resultLengths.add(totalSize);
                        combinedSplits = new ArrayList<InputSplit>();
                        combinedComparableSplits.clear();
                        totalSize = 0;
                    }
                    combinedSplits.add(split.getSplit());
                    combinedComparableSplits.add(split);
                    totalSize += split.getSplit().getLength();
                    if (i == splitLen - 1) {
                        // last piece: it could be very small, try to see it can be squeezed into any existing splits
                        for (int j =0; j < result.size(); j++)
                        {
                            if (resultLengths.get(j) + totalSize <= maxCombinedSplitSize)
                            {
                                List<InputSplit> isList = result.get(j);
                                for (InputSplit csplit : combinedSplits) {
                                    isList.add(csplit);
                                }
                                removeSplits(combinedComparableSplits);
                                combinedSplits.clear();
                                break;
                            }
                        }
                        if (!combinedSplits.isEmpty()) {
                            // last piece can not be squeezed in, create a new combined split for them.
                            removeSplits(combinedComparableSplits);
                            result.add(combinedSplits);
                        }
                    }
                }
            }
        }
        /* verification codes
        int combinedSplitLen = 0;
        for (PigSplit split : result)
          combinedSplitLen += split.getNumPaths();
        if (combinedSplitLen != nSplits-emptyCnt)
          throw new AssertionError("number of combined splits ["+combinedSplitLen+"] does not match the number of original splits ["+nSplits+"].");

        long totalLen = 0;
        for (PigSplit split : result)
          totalLen += split.getLength();

        long origTotalLen = 0;
        for (InputSplit split : oneInputSplits)
          origTotalLen += split.getLength();
        if (totalLen != origTotalLen)
          throw new AssertionError("The total length ["+totalLen+"] does not match the original ["+origTotalLen+"]");
        */
        log.info("Total input paths (combined) to process : " + result.size());
        return result;
    }

    private static void removeSplits(List<ComparableSplit> splits) {
        for (ComparableSplit split: splits)
            split.removeFromNodes();
    }

    public String inputSplitToString(InputSplit[] splits) throws IOException, InterruptedException {
        // debugging purpose only
        StringBuilder st = new StringBuilder();
        st.append("Number of splits :" + splits.length+"\n");
        long len = 0;
        for (InputSplit split: splits)
            len += split.getLength();
        st.append("Total Length = "+ len +"\n");
        for (int i = 0; i < splits.length; i++) {
            st.append("Input split["+i+"]:\n   Length = "+ splits[i].getLength()+"\n  Locations:\n");
            for (String location :  splits[i].getLocations())
                st.append("    "+location+"\n");
            st.append("\n-----------------------\n");
        }
        return st.toString();
    }

    /* verification code: debug purpose only
    public String inputSplitToString(ArrayList<ComparableSplit> splits) throws IOException, InterruptedException {
      StringBuilder st = new StringBuilder();
      st.append("Number of splits :" + splits.size()+"\n");
      long len = 0;
      for (ComparableSplit split: splits)
        len += split.getSplit().getLength();
      st.append("Total Length = "+ len +"\n");
      for (int i = 0; i < splits.size(); i++) {
        st.append("Input split["+i+"]:\n   Length = "+ splits.get(i).getSplit().getLength()+"\n  Locations:\n");
        for (String location :  splits.get(i).getSplit().getLocations())
          st.append("    "+location+"\n");
        st.append("\n-----------------------\n");
      }
      return st.toString();
    }
    */
}