java source code of HBaseStorage

spork-master
- NOTICE.txt
- src
  - main
    - jruby
      - pigudf.rb
  - python
    - streaming
      - pig_util.py
      - controller.py
  - packages
    - update-pig-env.sh
    - templates
      - conf
        pig-env.sh
    - pig-setup-conf.sh
  - overview.html
  - META-INF
    - services
      - org.apache.pig.ExecType
      - org.apache.hadoop.mapreduce.protocol.ClientProtocolProvider
  - org
    - apache
      - pig
        impl
        builtin
        GFAny.java
        IdentityColumn.java
        StreamingUDF.java
        SampleLoader.java
        PartitionSkewedKeys.java
        DefaultIndexableLoader.java
        ReadScalars.java
        FindQuantiles.java
        RandomSampleLoader.java
        GFReplicate.java
        PoissonSampleLoader.java
        GFCross.java
        GetMemNumRows.java
        plan
        DependencyOrderWalker.java
        VisitorException.java
        OperatorKey.java
        ReverseDependencyOrderWalker.java
        ProjectionMap.java
        CompilationMessageCollector.java
        OperatorPlan.java
        MapKeysInfo.java
        PlanValidationException.java
        PlanWalker.java
        RequiredFields.java
        PlanException.java
        DotPlanDumper.java
        PlanVisitor.java
        NodeIdGenerator.java
        optimizer
        OptimizerException.java
        DepthFirstWalker.java
        Operator.java
        PlanDumper.java
        PigContext.java
        streaming
        StreamingDelimiters.java
        PigStreamingUDF.java
        InputHandler.java
        ExecutableManager.java
        StreamingUDFInputHandler.java
        StreamingUtil.java
        DefaultInputHandler.java
        OutputHandler.java
        StreamingUDFException.java
        FileInputHandler.java
        StreamingCommand.java
        DefaultOutputHandler.java
        StreamingUDFOutputHandler.java
        FileOutputHandler.java
        HandlerFactory.java
        StreamingUDFOutputSchemaException.java
        util
        avro
        AvroBagWrapper.java
        AvroStorageDataConversionUtilities.java
        AvroMapWrapper.java
        AvroRecordWriter.java
        AvroRecordReader.java
        AvroStorageSchemaConversionUtilities.java
        AvroTupleWrapper.java
        AvroArrayReader.java
        JavaCompilerHelper.java
        IdentityHashSet.java
        orc
        OrcUtils.java
        LineageTracer.java
        UriUtil.java
        NumValCarrier.java
        Utils.java
        ObjectSerializer.java
        HashOutputStream.java
        CastUtils.java
        Spillable.java
        TupleFormat.java
        JarManager.java
        GroupingSpillable.java
        WrappedIOException.java
        MultiMap.java
        PropertiesUtil.java
        CompilerUtils.java
        UDFContext.java
        ConfigurationValidator.java
        RewindableIterator.java
        LogUtils.java
        SpillableMemoryManager.java
        Pair.java
        StorageUtil.java
        StringUtils.java
        BagFormat.java
        LinkedMultiMap.java
        PigImplConstants.java
        logicalLayer
        validators
        TypeCheckerException.java
        FrontendException.java
        schema
        Schema.java
        SchemaUtil.java
        SchemaMergeException.java
        package.html
        CanonicalNamer.java
        io
        NullableDateTimeWritable.java
        BinStorageRecordReader.java
        NullableBigIntegerWritable.java
        TFileStorage.java
        FileSpec.java
        BinStorageOutputFormat.java
        NullableUnknownWritable.java
        InterRecordWriter.java
        NullableBag.java
        ResourceNotFoundException.java
        NullableDoubleWritable.java
        SequenceFileInterStorage.java
        NullableBooleanWritable.java
        InterRecordReader.java
        NullableText.java
        FileLocalizer.java
        ReadToEndLoader.java
        NullableBigDecimalWritable.java
        NullableFloatWritable.java
        NullableIntWritable.java
        PigNullableWritable.java
        NullableBytesWritable.java
        InterStorage.java
        NullableLongWritable.java
        TFileRecordWriter.java
        BinStorageRecordWriter.java
        BufferedPositionedInputStream.java
        BinStorageInputFormat.java
        NullableTuple.java
        PigFile.java
        TFileRecordReader.java
        NullablePartitionWritable.java
        JVMReuseImpl.java
        TerminatingAccumulator.java
        FuncSpec.java
        PigConfiguration.java
        scripting
        BoundScript.java
        jruby
        JrubyAccumulatorEvalFunc.java
        RubySchema.java
        RubyDataBag.java
        JrubyScriptEngine.java
        JrubyAlgebraicEvalFunc.java
        RubyDataByteArray.java
        PigJrubyLibrary.java
        JrubyEvalFunc.java
        streaming
        python
        PythonScriptEngine.java
        SyncProgressNotificationAdaptor.java
        ScriptPigContext.java
        ScriptingOutputCapturer.java
        Pig.java
        js
        JSPig.java
        JsFunction.java
        JsScriptEngine.java
        groovy
        AccumulatorCleanup.java
        AlgebraicInitial.java
        GroovyScriptEngine.java
        OutputSchemaFunction.java
        GroovyAccumulatorEvalFunc.java
        AccumulatorAccumulate.java
        GroovyEvalFunc.java
        AccumulatorGetValue.java
        AlgebraicIntermed.java
        GroovyAlgebraicEvalFunc.java
        GroovyUtils.java
        GroovyEvalFuncObject.java
        AlgebraicFinal.java
        jython
        JythonFunction.java
        JythonScriptEngine.java
        JythonUtils.java
        ScriptEngine.java
        Accumulator.java
        ComparisonFunc.java
        PigRunner.java
        CollectableLoadFunc.java
        Algebraic.java
        LoadPushDown.java
        builtin
        ROUND.java
        BagSize.java
        GetMonth.java
        CubeDimensions.java
        BagToTuple.java
        StringMax.java
        ToDate3ARGS.java
        MapSize.java
        ParquetLoader.java
        SubtractDuration.java
        SIN.java
        BagToString.java
        BigIntegerSum.java
        GenericInvoker.java
        Utf8StorageConverter.java
        AlgebraicByteArrayMathBase.java
        COUNT_STAR.java
        FloatAvg.java
        LOG10.java
        KEYSET.java
        OrcStorage.java
        SPRINTF.java
        JsonMetadata.java
        IsEmpty.java
        UniqueID.java
        LongAvg.java
        BuildBloom.java
        ToMilliSeconds.java
        DIFF.java
        FloatRoundTo.java
        TOP.java
        ASIN.java
        REGEX_EXTRACT_ALL.java
        DoubleAbs.java
        FuncUtils.java
        LongSum.java
        COSH.java
        DoubleMin.java
        UCFIRST.java
        GetMinute.java
        Assert.java
        TRIM.java
        TrevniStorage.java
        SINH.java
        COUNT.java
        VALUELIST.java
        InvokeForLong.java
        GetHour.java
        FloatMin.java
        TextLoader.java
        BinStorage.java
        TOBAG.java
        Base.java
        BigIntegerAvg.java
        GetDay.java
        ToString.java
        JsonLoader.java
        FunctionWrapperEvalFunc.java
        CurrentTime.java
        GetWeek.java
        YearsBetween.java
        STARTSWITH.java
        RTRIM.java
        ToUnixTime.java
        Nondeterministic.java
        GetWeekYear.java
        TupleSize.java
        FLOOR.java
        AlgebraicMathBase.java
        INDEXOF.java
        REGEX_EXTRACT.java
        MAX.java
        SQRT.java
        EXP.java
        LAST_INDEX_OF.java
        SIZE.java
        BigIntegerMin.java
        STRSPLITTOBAG.java
        TOMAP.java
        IntAvg.java
        ENDSWITH.java
        DoubleSum.java
        BuildBloomBase.java
        TAN.java
        InvokeForString.java
        TANH.java
        DoubleAvg.java
        GetMilliSecond.java
        IntAbs.java
        INVERSEMAP.java
        InvokerFunction.java
        BigIntegerAbs.java
        LongMin.java
        DoubleMax.java
        ToDateISO.java
        IntMax.java
        EqualsIgnoreCase.java
        InvokeForDouble.java
        JsonStorage.java
        AvroStorage.java
        AlgebraicDoubleMathBase.java
        StringConcat.java
        Distinct.java
        InvokeForFloat.java
        ROUND_TO.java
        GetSecond.java
        LTRIM.java
        BigDecimalSum.java
        COR.java
        BigIntegerMax.java
        SUBTRACT.java
        BigDecimalWrapper.java
        WeeksBetween.java
        ATAN.java
        AlgebraicFloatMathBase.java
        AddDuration.java
        BigDecimalAvg.java
        MilliSecondsBetween.java
        mock
        Storage.java
        DoubleRoundTo.java
        ARITY.java
        COV.java
        VALUESET.java
        RollupDimensions.java
        ParquetStorer.java
        DaysBetween.java
        BigDecimalMax.java
        SecondsBetween.java
        StringSize.java
        COS.java
        MonitoredUDF.java
        Bloom.java
        SUBSTRING.java
        LongMax.java
        OutputSchema.java
        FloatRound.java
        FloatSum.java
        AlgebraicBigDecimalMathBase.java
        DoubleRound.java
        Invoker.java
        AlgebraicIntMathBase.java
        ACOS.java
        DoubleBase.java
        UPPER.java
        DateTimeMin.java
        SUM.java
        ToDate.java
        AVG.java
        CEIL.java
        BigDecimalAbs.java
        ToDate2ARGS.java
        BigIntegerWrapper.java
        PigStreaming.java
        TOKENIZE.java
        FloatMax.java
        TOTUPLE.java
        PluckTuple.java
        IntSum.java
        AlgebraicLongMathBase.java
        LCFIRST.java
        MIN.java
        InvokeForInt.java
        MonthsBetween.java
        InvokerGenerator.java
        MinutesBetween.java
        package.html
        CONCAT.java
        FloatAbs.java
        GetYear.java
        StringMin.java
        AlgebraicBigIntegerMathBase.java
        CBRT.java
        RANDOM.java
        STRSPLIT.java
        LOWER.java
        DateTimeMax.java
        LongAbs.java
        ABS.java
        LOG.java
        IntMin.java
        BigDecimalMin.java
        HoursBetween.java
        REPLACE.java
        PigStorage.java
        ConstantSize.java
        StoreFuncWrapper.java
        PigStreamingBase.java
        ExecType.java
        LoadPredicatePushdown.java
        ResourceSchema.java
        StoreCaster.java
        ExecTypeProvider.java
        StoreFunc.java
        IndexableLoadFunc.java
        AccumulatorEvalFunc.java
        LoadCaster.java
        StoreMetadata.java
        classification
        InterfaceStability.java
        InterfaceAudience.java
        StoreResources.java
        IteratingAccumulatorEvalFunc.java
        PigWarning.java
        backend
        hadoop
        DoubleWritable.java
        hbase
        TableSplitComparable.java
        HBaseBinaryConverter.java
        HBaseTableInputFormat.java
        HBaseStorage.java
        HDataType.java
        streaming
        HadoopExecutableManager.java
        BigIntegerWritable.java
        DateTimeWritable.java
        executionengine
        JobCreationException.java
        HJob.java
        fetch
        FetchLauncher.java
        FetchOptimizer.java
        FetchProgressableReporter.java
        FetchPOStoreImpl.java
        FetchTaskContext.java
        FetchContext.java
        MapRedResult.java
        util
        ParallelConstantVisitor.java
        SecondaryKeyOptimizerUtil.java
        CombinerOptimizerUtil.java
        AccumulatorOptimizerUtil.java
        MapRedUtil.java
        spark
        SparkExecType.java
        SparkExecutionEngine.java
        running
        PigInputFormatSpark.java
        BroadCastClient.java
        BroadCastServer.java
        converter
        SortConverter.java
        UnionConverter.java
        SkewedJoinConverter.java
        CounterConverter.java
        FilterConverter.java
        POConverter.java
        LocalRearrangeConverter.java
        CollectedGroupConverter.java
        LimitConverter.java
        POOutputConsumerIterator.java
        SplitConverter.java
        PackageConverter.java
        RankConverter.java
        GlobalRearrangeConverter.java
        LoadConverter.java
        StoreConverter.java
        IteratorTransform.java
        DistinctConverter.java
        ForEachConverter.java
        SparkLauncher.java
        SparkUtil.java
        KryoSerializer.java
        Launcher.java
        optimizer
        SecondaryKeyOptimizer.java
        mapReduceLayer
        DistinctCombiner.java
        SecondaryKeyOptimizer.java
        NativeMapReduceOper.java
        PigMapOnly.java
        MRUtil.java
        plans
        DotMRPrinter.java
        UDFFinder.java
        XMLMRPrinter.java
        ScalarPhyFinder.java
        POPackageAnnotator.java
        MRIntermediateDataVisitor.java
        MRPrinter.java
        MROperPlan.java
        MROpPlanVisitor.java
        EndOfAllInputSetter.java
        PhyPlanSetter.java
        ColumnChainInfo.java
        FileBasedOutputSizeReader.java
        MultiQueryOptimizer.java
        PigTextRawComparator.java
        MRCompilerException.java
        PigSplit.java
        MapReducePOStoreImpl.java
        SortKeyInfo.java
        PigFloatRawComparator.java
        SecondaryKeyOptimizerMR.java
        MRTaskContext.java
        AccumulatorOptimizer.java
        PigBytesRawComparator.java
        MapReduceLauncher.java
        partitioners
        SkewedPartitioner.java
        CountingMap.java
        SecondaryKeyPartitioner.java
        WeightedRangePartitioner.java
        DiscreteProbabilitySampleGenerator.java
        PigOutputFormat.java
        PigGenericMapReduce.java
        MRExecutionEngine.java
        PigOutputCommitter.java
        CombinerOptimizer.java
        JobControlCompiler.java
        RunJarSecurityManager.java
        PigFileInputFormat.java
        PigHadoopLogger.java
        PigSecondaryKeyComparator.java
        NoopStoreRemover.java
        KeyTypeDiscoveryVisitor.java
        PigReducerEstimator.java
        InputSizeReducerEstimator.java
        IllustrateDummyReporter.java
        UDFFinishVisitor.java
        PigTextInputFormat.java
        ProgressableReporter.java
        PigGenericMapBase.java
        PigMapReduceCounter.java
        PigSequenceFileInputFormat.java
        PigDateTimeRawComparator.java
        PigDoubleRawComparator.java
        PigInputFormat.java
        NoopFilterRemover.java
        PigCombiner.java
        MapReduceOper.java
        PigStatsOutputSizeReader.java
        PigIntRawComparator.java
        MRCompiler.java
        SampleOptimizer.java
        MRExecType.java
        PigBigIntegerRawComparator.java
        PigBigDecimalRawComparator.java
        LimitAdjuster.java
        PigLongRawComparator.java
        PigTextOutputFormat.java
        PigTupleSortComparator.java
        PigRecordReader.java
        PigBooleanRawComparator.java
        PigTupleDefaultRawComparator.java
        LocalExecType.java
        MRConfiguration.java
        ColumnInfo.java
        MergeJoinIndexer.java
        physicalLayer
        PigProgressable.java
        plans
        PhyPlanVisitor.java
        PatternNode.java
        PlanPrinter.java
        PatternPlan.java
        UdfCacheShipFilesVisitor.java
        XMLPhysicalPlanPrinter.java
        DotPOPrinter.java
        PhysicalPlan.java
        POPrinter.java
        PhysicalOperator.java
        relationalOperators
        MultiQueryPackager.java
        POSkewedJoin.java
        POPackage.java
        POLoad.java
        POForEach.java
        POPreCombinerLocalRearrange.java
        POStoreImpl.java
        POSplit.java
        PODemux.java
        PODistinct.java
        POMergeJoin.java
        POSortedDistinct.java
        POUnion.java
        CombinerPackager.java
        LitePackager.java
        POLocalRearrange.java
        POStream.java
        POSort.java
        JoinPackager.java
        POReservoirSample.java
        POPartialAgg.java
        POGlobalRearrange.java
        POFRJoin.java
        PORank.java
        POFilter.java
        POCollectedGroup.java
        Packager.java
        POOptimizedForEach.java
        POMergeCogroup.java
        POPartitionRearrange.java
        POCounter.java
        PONative.java
        AccumulativeTupleBuffer.java
        POPoissonSample.java
        POStore.java
        POLimit.java
        POCross.java
        util
        MonitoredUDFExecutor.java
        PlanHelper.java
        Result.java
        POStatus.java
        expressionOperators
        ExpressionOperator.java
        POAnd.java
        EqualToExpr.java
        POProject.java
        POMapLookUp.java
        POCast.java
        Add.java
        Mod.java
        LTOrEqualToExpr.java
        NotEqualToExpr.java
        PONegative.java
        regex
        CompiledAutomaton.java
        NonConstantRegex.java
        RegexInit.java
        RegexImpl.java
        CompiledRegex.java
        PONot.java
        GreaterThanExpr.java
        BinaryComparisonOperator.java
        BinaryExpressionOperator.java
        UnaryExpressionOperator.java
        UnaryComparisonOperator.java
        POIsNull.java
        LessThanExpr.java
        PORegexp.java
        POUserFunc.java
        Divide.java
        Multiply.java
        POOr.java
        GTOrEqualToExpr.java
        POBinCond.java
        ConstantExpression.java
        POUserComparisonFunc.java
        Subtract.java
        ComparisonOperator.java
        PORelationToExprProject.java
        PigLogger.java
        package.html
        LogicalToPhysicalTranslatorException.java
        tez
        TezJobCompiler.java
        TezExecutionEngine.java
        TezSessionManager.java
        plan
        TezOperator.java
        TezPlanContainer.java
        udf
        FindQuantilesTez.java
        ReadScalarsTez.java
        PartitionSkewedKeysTez.java
        TezOpPlanVisitor.java
        TezPOStreamVisitor.java
        TezPlanContainerNode.java
        TezPOUserFuncVisitor.java
        TezPlanContainerPrinter.java
        operator
        NativeTezOper.java
        POIdentityInOutTez.java
        POStoreTez.java
        POPartitionRearrangeTez.java
        POLocalRearrangeTez.java
        POShuffleTezLoad.java
        POLocalRearrangeTezFactory.java
        POSimpleTezLoad.java
        PORankTez.java
        POCounterStatsTez.java
        POCounterTez.java
        POValueInputTez.java
        POFRJoinTez.java
        POShuffledValueInputTez.java
        POValueOutputTez.java
        TezPOPackageAnnotator.java
        optimizer
        TezParallelismEstimator.java
        AccumulatorOptimizer.java
        LoaderProcessor.java
        MultiQueryOptimizerTez.java
        CombinerOptimizer.java
        ParallelismSetter.java
        UnionOptimizer.java
        TezOperDependencyParallelismEstimator.java
        NoopFilterRemover.java
        SecondaryKeyOptimizerTez.java
        TezEdgeDescriptor.java
        TezCompilerException.java
        TezPrinter.java
        TezCompiler.java
        TezOperPlan.java
        TezPlanContainerUDFCollector.java
        TezPlanContainerVisitor.java
        util
        MRToTezHelper.java
        SecurityHelper.java
        TezCompilerUtil.java
        runtime
        PartitionerDefinedVertexManager.java
        RoundRobinPartitioner.java
        PigOutputFormatTez.java
        WeightedRangePartitionerTez.java
        SkewedPartitionerTez.java
        TezTaskContext.java
        TezOutput.java
        PigProcessor.java
        TezTaskConfigurable.java
        ObjectCache.java
        TezInput.java
        TezExecType.java
        TezResourceManager.java
        TezLocalExecType.java
        TezJob.java
        TezLauncher.java
        TezDagBuilder.java
        HExecutionEngine.java
        TaskContext.java
        BigDecimalWritable.java
        accumulo
        AbstractAccumuloStorage.java
        Utils.java
        Column.java
        AccumuloBinaryConverter.java
        FixedByteArrayOutputStream.java
        AccumuloStorageOptions.java
        AccumuloStorage.java
        datastorage
        HConfiguration.java
        HSeekableInputStream.java
        HDataStorage.java
        ConfigurationUtil.java
        HDirectory.java
        HFile.java
        HPath.java
        executionengine
        ExecException.java
        ExecJob.java
        ExecutionEngine.java
        BackendException.java
        datastorage
        ImmutableOutputStream.java
        DataStorageException.java
        ElementDescriptor.java
        SeekableInputStream.java
        DataStorage.java
        ContainerDescriptor.java
        Function.java
        newplan
        FilterExtractor.java
        DependencyOrderWalker.java
        ReverseDependencyOrderWalkerWOSeenChk.java
        ReverseDependencyOrderWalker.java
        OperatorPlan.java
        PredicatePushDownFilterExtractor.java
        OperatorSubPlan.java
        PlanWalker.java
        DotPlanDumper.java
        PlanVisitor.java
        optimizer
        PlanOptimizer.java
        Rule.java
        PlanTransformListener.java
        Transformer.java
        DepthFirstWalker.java
        PartitionFilterExtractor.java
        Operator.java
        logical
        DotLOPrinter.java
        visitor
        CastLineageSetter.java
        LineageFindRelVisitor.java
        TypeCheckingRelVisitor.java
        ProjectStarExpanderUtil.java
        ResetProjectionAttachedRelationalOpVisitor.java
        DuplicateForEachColumnRewriteVisitor.java
        ScalarVisitor.java
        UDFFinder.java
        ProjectStarExpander.java
        SchemaAliasVisitor.java
        ImplicitSplitInsertVisitor.java
        UnionOnSchemaSetter.java
        StoreAliasSetter.java
        InputOutputFileValidatorVisitor.java
        SortInfoSetter.java
        ColumnAliasConversionVisitor.java
        DanglingNestedNodeRemover.java
        TypeCheckingExpVisitor.java
        ProjStarInUdfExpander.java
        ScalarVariableValidator.java
        relational
        LOStore.java
        LOFilter.java
        LOUnion.java
        LODistinct.java
        LogToPhyTranslationVisitor.java
        LogicalSchema.java
        LOJoin.java
        MapSideMergeValidator.java
        SchemaNotDefinedException.java
        LOLoad.java
        LogicalPlan.java
        LORank.java
        LogicalRelationalOperator.java
        LOCross.java
        LOLimit.java
        LOInnerLoad.java
        LogicalRelationalNodesVisitor.java
        LOSplitOutput.java
        LOCube.java
        LOSplit.java
        LOStream.java
        LONative.java
        LOCogroup.java
        LogicalPlanData.java
        LOForEach.java
        LOGenerate.java
        LOSort.java
        optimizer
        SchemaPatcher.java
        UidResetter.java
        ProjectionPatcher.java
        LogicalPlanOptimizer.java
        AllExpressionVisitor.java
        SchemaResetter.java
        AllSameRalationalNodesVisitor.java
        LogicalPlanPrinter.java
        Util.java
        rules
        GroupByConstParallelSetter.java
        PushDownForEachFlatten.java
        TypeCastInserter.java
        OptimizerUtils.java
        ColumnPruneHelper.java
        MergeFilter.java
        FilterAboveForeach.java
        FilterConstantCalculator.java
        PredicatePushdownOptimizer.java
        LoadTypeCastInserter.java
        SplitFilter.java
        PartitionFilterOptimizer.java
        ForEachConstantCalculator.java
        ColumnMapKeyPrune.java
        MergeForEach.java
        WholePlanRule.java
        AddForEach.java
        ConstantCalculator.java
        LimitOptimizer.java
        LogicalRelationalNodeValidator.java
        MapKeysPruneHelper.java
        PushUpFilter.java
        StreamTypeCastInserter.java
        ColumnPruneVisitor.java
        expression
        UserFuncExpression.java
        SubtractExpression.java
        ProjectExpression.java
        LessThanEqualExpression.java
        EqualExpression.java
        MapLookupExpression.java
        CastExpression.java
        ModExpression.java
        LessThanExpression.java
        GreaterThanExpression.java
        DereferenceExpression.java
        RegexExpression.java
        NegativeExpression.java
        GreaterThanEqualExpression.java
        LogicalExpressionVisitor.java
        OrExpression.java
        AllSameExpressionVisitor.java
        AndExpression.java
        NotEqualExpression.java
        MultiplyExpression.java
        LogicalExpressionPlan.java
        NotExpression.java
        ScalarExpression.java
        BinCondExpression.java
        UnaryExpression.java
        ExpToPhyTranslationVisitor.java
        BinaryExpression.java
        AddExpression.java
        ConstantExpression.java
        IsNullExpression.java
        LogicalExpression.java
        DivideExpression.java
        ColumnExpression.java
        SubtreeDependencyOrderWalker.java
        BaseOperatorPlan.java
        PlanEdge.java
        PlanDumper.java
        validator
        BlackAndWhitelistFilter.java
        BlackAndWhitelistValidator.java
        PigCommandFilter.java
        PigCounters.java
        FileInputLoadFunc.java
        StreamToPig.java
        LoadFuncMetadataWrapper.java
        PigConstants.java
        StaticDataCleanup.java
        EvalFunc.java
        Main.java
        pen
        ExampleGenerator.java
        POOptimizeDisabler.java
        FakeRawKeyValueIterator.java
        AugmentBaseDataVisitor.java
        IllustratorAttacher.java
        Illustrable.java
        PhysicalPlanResetter.java
        util
        PreOrderDepthFirstWalker.java
        LineageTracer.java
        MetricEvaluation.java
        DisplayExamples.java
        ExampleTuple.java
        LocalMapReduceSimulator.java
        Illustrator.java
        LineageTrimmingVisitor.java
        EquivalenceClasses.java
        LoadMetadata.java
        data
        DefaultDataBag.java
        FieldIsNullException.java
        BinSedesTupleFactory.java
        DefaultTupleFactory.java
        DataType.java
        WritableByteArray.java
        utils
        MethodHelper.java
        SedesHelper.java
        StructuresHelper.java
        BytesHelper.java
        DataByteArray.java
        InternalMap.java
        SchemaTupleBackend.java
        SingleTupleBag.java
        AppendableSchemaTuple.java
        BagFactory.java
        DistinctDataBag.java
        SizeUtil.java
        AbstractTuple.java
        TupleFactory.java
        DefaultTuple.java
        SchemaTupleFactory.java
        DataReaderWriter.java
        InterSedes.java
        FileList.java
        Tuple.java
        BinSedesTuple.java
        SortedDataBag.java
        TargetedTuple.java
        DataBag.java
        TupleMaker.java
        InternalCachedBag.java
        TypeAwareTuple.java
        AmendableTuple.java
        DefaultBagFactory.java
        SortedSpillBag.java
        SchemaTupleFrontend.java
        SelfSpillBag.java
        ReadOnceBag.java
        AccumulativeBag.java
        InterSedesFactory.java
        InternalSortedBag.java
        DefaultAbstractBag.java
        SchemaTuple.java
        BinInterSedes.java
        TupleRawComparator.java
        TimestampedTuple.java
        package.html
        NonSpillableDataBag.java
        SchemaTupleClassGenerator.java
        InternalDistinctBag.java
        FileSplitComparable.java
        ResourceStatistics.java
        PigServer.java
        LoadFuncWrapper.java
        PigException.java
        TypedOutputEvalFunc.java
        tools
        timer
        PerformanceTimerFactory.java
        PerformanceTimer.java
        streams
        StreamGenerator.java
        parameters
        PreprocessorContext.java
        ParamLoader.jj
        ParameterSubstitutionPreprocessor.java
        ParameterSubstitutionException.java
        PigFileParser.jj
        cmdline
        CmdLineParser.java
        pigscript
        parser
        PigScriptParser.jj
        ToolsPigServer.java
        counters
        PigCounterHelper.java
        grunt
        PigCompletor.java
        autocomplete_aliases
        Command.java
        GruntParser.java
        PigCompletorAliases.java
        autocomplete
        Grunt.java
        pigstats
        EmbeddedPigStats.java
        PigStatsUtil.java
        PigStats.java
        EmptyPigStats.java
        OutputStats.java
        PigProgressNotificationListener.java
        SparkStats.java
        InputStats.java
        tez
        TezDAGStats.java
        TezVertexStats.java
        TezPigScriptStats.java
        PigTezProgressNotificationListener.java
        TezScriptState.java
        JobStats.java
        mapreduce
        MRPigStatsUtil.java
        SimplePigStats.java
        MRScriptState.java
        MRJobStats.java
        PigStatusReporter.java
        ScriptState.java
        StoreFuncInterface.java
        OrderedLoadFunc.java
        SortInfo.java
        LoadFunc.java
        LoadStoreCaster.java
        PrimitiveEvalFunc.java
        OverwritableStoreFunc.java
        PigToStream.java
        SortColInfo.java
        StoreFuncMetadataWrapper.java
        package.html
        FilterFunc.java
        Expression.java
        parser
        QueryParserFileStream.java
        QueryParserStringStream.java
        QueryParserDriver.java
        ParserValidationException.java
        LogicalPlanBuilder.java
        SourceLocation.java
        DuplicatedSchemaAliasException.java
        AstPrinter.g
        QueryParserStreamUtil.java
        AliasMasker.g
        QueryParser.g
        FunctionType.java
        PigParserNode.java
        PigMacro.java
        AstValidator.g
        PigParserNodeAdaptor.java
        StreamingCommandUtils.java
        PigRecognitionException.java
        InvalidScalarProjectionException.java
        QueryParserUtils.java
        ParserException.java
        DryRunGruntParser.java
        InvalidCommandException.java
        LogicalPlanGenerator.g
        PlanGenerationFailureException.java
        InvalidPathException.java
        UndefinedAliasException.java
        NonProjectExpressionException.java
        QueryLexer.g
        AlgebraicEvalFunc.java
        JVMReuseManager.java
        ExceptionalFunction.java
  - docs
    - src
      - documentation
        translations
        tabs_de.xml
        tabs_fr.xml
        languages_nl.xml
        languages_de.xml
        menu_es.xml
        tabs.xml
        langcode.xml
        menu_no.xml
        tabs_es.xml
        menu_fr.xml
        menu_sk.xml
        languages_es.xml
        menu_af.xml
        menu.xml
        menu_de.xml
        menu_it.xml
        tabs_nl.xml
        menu_ru.xml
        languages_en.xml
        languages_fr.xml
        menu_nl.xml
        resources
        images
        pig-in-overalls-big.jpg
        ellipse-2.svg
        stylesheets
        hello2document.xsl
        schema
        hello-v10.dtd
        symbols-project-v10.ent
        catalog.xcat
        classes
        CatalogManager.properties
        content
        locationmap.xml
        test1.html
        xdocs
        index.xml
        perf.xml
        admin.xml
        cmds.xml
        func.xml
        images
        project.svg
        hadoop-logo.jpg
        group.svg
        pig-logo.gif
        zebra.jpg
        test.xml
        start.xml
        pig-index.xml
        tabs.xml
        udf.xml
        cont.xml
        site.xml
        pigunit.xml
        sitemap.xmap
        README.txt
        skinconf.xml
        conf
        cli.xconf
    - forrest.properties.xml
    - forrest.properties
    - jdiff
    - forrest.properties.dispatcher.properties
  - pig-default.properties
- lib-src
  - bzip2
    - org
      - apache
        pig
        bzip2r
        Bzip2TextInputFormat.java
        tools
        bzip2r
        CRC.java
        CBZip2InputStream.java
        CBZip2OutputStream.java
        BZip2Constants.java
- build.xml
- ivy
  - pigsmoke-template.xml
  - pig-template.xml
  - libraries.properties
  - pigunit-template.xml
  - piggybank-template.xml
  - ivysettings.xml
- shims
  - src
    - hadoop23
      - org
        apache
        hadoop
        mapred
        DowngradeHelper.java
        pig
        backend
        hadoop23
        PigJobControl.java
        hadoop
        executionengine
        shims
        HadoopShims.java
        mapReduceLayer
        PigMapReduce.java
        PigMapBase.java
    - hadoop20
      - org
        apache
        pig
        backend
        hadoop
        executionengine
        shims
        HadoopShims.java
        mapReduceLayer
        PigMapReduce.java
        PigMapBase.java
        hadoop20
        PigJobControl.java
  - test
    - hadoop23
      - org
        apache
        pig
        test
        MiniCluster.java
        TezMiniCluster.java
        SparkMiniCluster.java
    - hadoop20
      - org
        apache
        pig
        test
        MiniCluster.java
        TezMiniCluster.java
        SparkMiniCluster.java
- CHANGES.txt
- tutorial
  - src
    - org
      - apache
        pig
        tutorial
        ToLower.java
        TutorialTest.java
        ScoreGenerator.java
        NGramGenerator.java
        ExtractHour.java
        NonURLDetector.java
        TutorialUtil.java
  - build.xml
  - data
  - scripts
    - script2-hadoop.pig
    - script1-local.pig
    - script2-local.pig
    - script1-hadoop.pig
- LICENSE
- .eclipse.templates
  - README.txt
  - .project
  - .classpath
- test
  - spark-tests
  - tez-tests
  - resources
    - org
      - apache
        pig
        test
        RegisteredJarVisibilitySchema.java
        ClassLoaderSanityCheck.java
        RegisteredJarVisibilityLoader.java
  - tez-local-tests
  - pigunit-tests
  - checkstyle.xml
  - checkstyle-noframes-sorted.xsl
  - unit-tests
  - e2e
    - pig
      - whirr
        pigtest.properties
        README
        whirr_test_patch.sh
      - build.xml
      - resource
        default.res
        windows.res
      - paramfiles
        params_3
      - deployers
        ExistingClusterDeployer.pm
        LocalDeployer.pm
      - streaming
        nameMap
        DieRandomly.pl
        PigStreamingDepend.pl
        PigStreaming.pl
        Split.pl
        PigStreamingModule.pm
        PigStreamingBad.pl
        GroupBy.pl
      - drivers
        Util.pm
        TestDriverPig.pm
        TestDriverScript.pm
      - lib
      - udfs
        ruby
        udf2.rb
        morerubyudfs.rb
        scriptingudfs.rb
        cpython
        scriptingudf.py
        morepythonudfs.py
        python
        scriptingudf.py
        morepythonudfs.py
        stringutil.py
        java
        build.xml
        org
        apache
        pig
        TestingAccumulatorHelper.java
        test
        utils
        SimpleCustomPartitioner2.java
        udf
        evalfunc
        IteratingAccumulatorIsEmpty.java
        TOBAG2.java
        BadUdf.java
        BadMonitored.java
        CreateTupleBag.java
        Swap.java
        BadUdf2.java
        Nil.java
        UdfContextFrontend.java
        TOBAG.java
        TestWarningFunc.java
        DECODE.java
        NonAlgNonAccCount.java
        IteratingAccumulatorSum.java
        TOMAP.java
        IteratingAccumulatorCount.java
        BadMonitoredDefault.java
        BadUdf4.java
        VARBAG.java
        BadUdf3.java
        Udfcachetest.java
        Fred.java
        CreateMap.java
        AllFirstLetter.java
        TestConstructorArgs.java
        GoodMonitored.java
        UPPER.java
        TestEvalFunc.java
        AppendIndex.java
        TestBoolean.java
        UDFContextTestUDF.java
        streaming
        StreamingDump.java
        DumpStreamerBad.java
        DumpStreamer.java
        orderby
        OrdDesc.java
        storefunc
        DumpLoaderBad.java
        StringStore.java
        StringStoreBad.java
        DumpLoader.java
        SimpleCollectableLoader.java
      - tests
        orc.conf
        grunt.conf
        cmdline.conf
        multiquery.conf
        turing_jython.conf
        negative.conf
        hcat.conf
        streaming_local.conf
        macro.conf
        bigdata.conf
        streaming.conf
      - tools
        test
        explainchk.pl
        floatpostprocessor.pl
        generate
        generate_data.pl
      - conf
        default.conf
        tez.conf
        rpm.conf
        existing_deployer.conf
        local.conf
        testpropertiesfile.conf
        local_deployer.conf
        spark.conf
      - macros
        macro1.pig
        macro_bad1.pig
    - harness
      - build.xml
      - TestDriverFactory.pm
      - test_harness.pl
      - test
        tests
        deploy.conf
        test.conf
        conf
        default.conf
      - xmlReport.pl
      - TestReport.pm
      - TestDeployerFactory.pm
      - TestDeployerTest.pm
      - Insert2Mysql.pm
      - Properties.pm
      - TestDeployer.pm
      - TestDriver.pm
      - TestDriverTest.pm
      - Log.pm
  - excluded-tests-20
  - findbugsExcludeFile.xml
  - hbase-site.xml
  - commit-tests
  - smoke-tests
  - all-tests
  - python
    - streaming
      - test_controller.py
  - data
    - pigunit
      - top_queries_expected_top_3.txt
      - top_queries_input_data.txt
      - top_queries.pig
      - top_queries_macro.pig
      - top_queries_params.txt
  - excluded-tests-23
  - excluded-tests
  - bin
    - test-patch.sh
  - org
    - apache
      - pig
        impl
        builtin
        TestStreamingUDF.java
        streaming
        TestPigStreamingUDF.java
        TestStreamingUtil.java
        TestStreamingUDFOutputHandler.java
        builtin
        avro
        code
        pig
        identity_blank_first_args.pig
        with_dates.pig
        identity.pig
        projection_test.pig
        identity_ao2.pig
        identity_just_ao2.pig
        trevni_to_avro.pig
        dump.pig
        namesWithDoubleColons.pig
        recursive_tests.pig
        identity_codec.pig
        trevni_to_trevni.pig
        identity_ai1_ao2.pig
        directory_test.pig
        projection_test_with_schema.pig
        data
        json
        arrays.json
        recordsWithSimpleUnion.json
        recordsWithDoubleUnderscores.json
        recordsAsOutputByPig.json
        recordsWithEnums.json
        recordsWithNullableUnions.json
        recordsOfArraysOfRecords.json
        recursiveRecord.json
        recordsOfArrays.json
        records.json
        projectionTest.json
        recordsAsOutputByPigWithDates.json
        recordsWithFixed.json
        recordsSubSchema.json
        recordsOfStringArrays.json
        recordsWithSimpleUnionOutput.json
        projectionTestWithSchema.json
        recordsSubSchemaNullable.json
        recordsWithMapsOfRecords.json
        arraysAsOutputByPig.json
        recordWithRepeatedSubRecords.json
        recordsWithMaps.json
        schema
        recordWithRepeatedSubRecords.avsc
        testDirectory.avsc
        recordsAsOutputByPig.avsc
        arrays.avsc
        recordsOfStringArrays.avsc
        records.avsc
        recordsWithMapsOfRecords.avsc
        recordsWithDoubleUnderscores.avsc
        recursiveRecord.avsc
        recordsWithEnums.avsc
        recordsWithSimpleUnionOutput.avsc
        recordsOfArraysOfRecords.avsc
        recordsOfArrays.avsc
        recordsWithMaps.avsc
        arraysAsOutputByPig.avsc
        projectionTestWithSchema.avsc
        recordsWithNullableUnions.avsc
        recordsWithFixed.avsc
        projectionTest.avsc
        recordsAsOutputByPigWithDates.avsc
        recordsSubSchemaNullable.avsc
        testDirectoryCounts.avsc
        simpleRecordsTrevni.avsc
        recordsSubSchema.avsc
        recordsWithSimpleUnion.avsc
        TestPluckTuple.java
        orc
        charvarchar.orc
        nullmapkey.orc
        TestOrcStoragePushdown.java
        TestTOP.java
        TestSUBTRACT.java
        TestBigTypeSort.java
        mock
        TestMockStorage.java
        TestAvroStorage.java
        TestFunctionWrapperEvalFunc.java
        TestInvokerGenerator.java
        TestCurrentTime.java
        TestOrcStorage.java
        TestStoreFuncMetadataWrapper.java
        TestLoadStoreFuncLifeCycle.java
        test
        TestPigServer.java
        TestMultiQueryBasic.java
        TestBuiltInBagToTupleOrString.java
        TestPackage.java
        TestInvoker.java
        TestSplitStore.java
        TestNativeMapReduce.java
        TestFilter.java
        TestJobSubmission.java
        TestAlgebraicInstantiation.java
        TestDivide.java
        FakeFSOutputStream.java
        PigStorageNoDefCtor.java
        TestUDFGroovy.java
        TestFilterOpNumeric.java
        TestLoaderStorerShipCacheFilesMR.java
        TestPoissonSampleLoader.java
        PigStorageWithStatistics.java
        TestGTOrEqual.java
        TestLineageFindRelVisitor.java
        TestShortcuts.java
        TestNull.java
        TestAdd.java
        TestAutoLocalMode.java
        MiniGenericCluster.java
        TestLTOrEqual.java
        utils
        Identity.java
        UDFContextTestEvalFunc.java
        ScriptSchemaTestLoader.java
        WrongCustomPartitioner.java
        UDFContextTestLoader.java
        TestHelper.java
        SimpleCustomPartitioner3.java
        WordCount.java
        URLPARSE.java
        BagCount.java
        UDFContextTestLoaderWithSignature.java
        NewLogicalPlanUtil.java
        UDFContextTestEvalFunc3.java
        AccumulativeSumBag.java
        HelperEvalFuncUtils.java
        planComparer
        PlanStructuralComparer.java
        POCastDummy.java
        LocalSeekableInputStream.java
        MultiLevelDerivedUDF1.java
        dotGraph
        DotEdge.java
        NodeMatcher.java
        DOTParser.jjt
        DotGraphReader.java
        ExactKeyMatcher.java
        DotNode.java
        IncreasingKeyMatcher.java
        OperatorPlanLoader.java
        DotGraph.java
        SimpleCustomPartitioner.java
        MultiLevelDerivedUDF2.java
        AccumulatorBagCount.java
        UPPER.java
        GenPhyOp.java
        GenRandomData.java
        ReportingUDF.java
        MultiLevelDerivedUDF3.java
        FILTERFROMFILE.java
        MyUDFWithoutParameter.java
        TypeCheckingTestUtil.java
        MyUDFReturnMap.java
        UDFContextTestEvalFunc2.java
        TestNewPartitionFilterPushDown.java
        TestBatchAliases.java
        TestMRExecutionEngine.java
        TestLoadFunc.java
        InputSchemaUDF.java
        TestParser.java
        TestRelationToExprProject.java
        TestNewPlanPushDownForeachFlatten.java
        TestLimitSchemaStore.java
        TestDefaultDateTimeZone.java
        TestMod.java
        TestJobControlCompiler.java
        TestPigServerWithMacros.java
        FakeFSInputStream.java
        TestScriptLanguageJavaScript.java
        TestProjectStarRangeInUdf.java
        TestMacroExpansion.java
        TestPORegexp.java
        TestUnion.java
        TestRegisteredJarVisibility.java
        TestDataBag.java
        TestEvalPipeline2.java
        TestRank1.java
        TestBuiltinInvoker.java
        TestOrderBy.java
        TestBZip.java
        TestLogToPhyCompiler.java
        TestSplitIndex.java
        TestCommit.java
        TestNewPlanPushUpFilter.java
        TestBestFitCast.java
        TestUnionOnSchema.java
        TestNewPlanRule.java
        TestNewPlanListener.java
        TestImplicitSplit.java
        TestPODistinct.java
        TestMultiply.java
        TestKeyTypeDiscoveryVisitor.java
        TestScriptingLanguagePython.java
        TestLessThan.java
        TestPinOptions.java
        TestForEach.java
        TestScriptUDF.java
        TestFRJoinNullValue.java
        TestBagFormat.java
        TestScriptLanguage.java
        TestEvalFuncOutputAnnotation.java
        TestPOSort.java
        TestProjectRange.java
        NonDefaultBagFactory.java
        TestMultiQuery.java
        TestConversions.java
        TestCharArrayToNumeric.java
        TestLoad.java
        TestCmdLineParser.java
        TestAlgebraicEvalLocal.java
        TestMapReduce.java
        TestCompressedFiles.java
        TestLogicalPlanBuilder.java
        TestCubeDimensions.java
        TestGroupConstParallel.java
        TestUDFContext.java
        TestJobSubmissionMR.java
        TestJoin.java
        TestConstantCalculator.java
        TestStringUDFs.java
        TestTextDataParser.java
        TestRank2.java
        TestNewPlanFilterAboveForeach.java
        TestStreaming.java
        TestFuncSpec.java
        TestTuple.java
        TestMultiQueryLocal.java
        TestPruneColumn.java
        TestNewPlanPruneMapKeys.java
        TestAccumulator.java
        TestNestedForeach.java
        TestPOCast.java
        TestJoinSmoke.java
        TestHBaseStorage.java
        TestPigStats.java
        TestBinInterSedes.java
        TestEvalPipelineLocal.java
        TestHBaseStorageParams.java
        TestEqualTo.java
        TestPigException.java
        TestAlgebraicEval.java
        TestFetch.java
        TestProjectStarExpander.java
        OrdDesc.java
        RegexGroupCount.java
        TestLimitAdjuster.java
        TestNewPlanColumnPrune.java
        TestPOBinCond.java
        TestConstExpr.java
        TestInputOutputMiniClusterFileValidator.java
        TestPigRunner.java
        TestNewPlanFilterRule.java
        TestExampleGenerator.java
        TestMapSideCogroup.java
        TestSecondarySort.java
        TestNewPlanLogToPhyTranslationVisitor.java
        TestStreamingLocal.java
        TestUDF.java
        TestPigScriptParser.java
        OrdAsc.java
        TestSchema.java
        TestForEachNestedPlan.java
        TestFindQuantiles.java
        TestPigTupleRawComparator.java
        PigExecTestCase.java
        TestMergeForEachOptimization.java
        TestTmpFileCompression.java
        TestUDFWithoutParameter.java
        TestCubeOperator.java
        PigTestLoader.java
        TestPlanGeneration.java
        TestSubtract.java
        TestProject.java
        TestOrderBy3.java
        PORead.java
        TestLimitVariable.java
        TestRegexp.java
        TestToolsPigServer.java
        TestLargeFile.java
        data
        input4.pig
        input6.pig
        ExpectedResult3.txt
        inputSubWithinLiteral.pig
        newinputS.txt
        illustrate4.pig
        inputCmdnameAsParamDeclare.pig
        testsubnested_run.pig
        input1.pig
        testsub.pig
        TestIllustrateInput.txt
        ExpectedResult2.pig
        inputMultipleDeclares.pig
        illustrate.pig
        explainScript.pig
        tc.js
        ConfFile1.txt
        inputEscape.pig
        illustrate3.pig
        inputDollarSign.pig
        output26.pig
        ExpectedResult.pig
        ExpectedResult6.pig
        ExpectedResult4.pig
        DotFiles
        new-optlimitplan7.dot
        testScript5.dot
        new-optlimitplan6.dot
        new-optlimitplan1.dot
        optlimitplan5.dot
        optlimitplan8.dot
        optlimitplan1.dot
        new-optlimitplan10.dot
        optlimitplan12.dot
        optplan1.dot
        new-optlimitplan5.dot
        explain1.dot
        optlimitplan7.dot
        new-optlimitplan9.dot
        optlimitplan3.dot
        new-optlimitplan2.dot
        plan1.dot
        testScript4.dot
        new-optlimitplan8.dot
        testScript6.dot
        optlimitplan10.dot
        optlimitplan2.dot
        new-optlimitplan4.dot
        testScript2.dot
        testScript3.dot
        optlimitplan6.dot
        optlimitplan4.dot
        optlimitplan9.dot
        new-optlimitplan3.dot
        testScript1.dot
        ExpectedResultDefault.pig
        ConfFileWithEmptyComments.txt
        TestIllustrateInput2.txt
        ExpectedResultMulDecs.pig
        ConfFileWithValidLines.txt
        ConfFile2.txt
        ExpectedResultDollarSign.pig
        InputFiles
        passwd
        jsTst5.txt
        jsTst2.txt
        jsTst1.txt
        test_broken.ppf
        inputNoVars.pig
        generate_date.sh
        passwd
        TestRelationToExprProjectInput.txt
        testsubnested_exec.pig
        ExpectedResultComment.pig
        inputCmdlineParamPriortoDeclare.pig
        passwd2
        ConfFileWithInvalidLines.txt
        output1.pig
        ConfFileSameParamMultipleTimes.txt
        inputMultipleParams.pig
        inputDefault.pig
        inputSubstitutionWithinValue.pig
        test.ppf
        output3.pig
        illustrate7.pig
        GoldenFiles
        MRC10.gld
        Distinct.gld
        MRC5.gld
        MRC6.gld
        MRC7.gld
        MRC19.gld
        MRC1.gld
        Split2.gld
        Arithmetic.gld
        MRC14.gld
        Split1.gld
        MRC13.gld
        MRC3.gld
        MRC17.gld
        IsNull1.gld
        IsNull2.gld
        Comparison.gld
        Cogroup.gld
        jsTst4
        Limit.gld
        MRC2.gld
        Sort.gld
        MRC15.gld
        MRC16.gld
        MRC4.gld
        BinCond.gld
        Union.gld
        tez
        TEZC-Union-4-OPTOFF.gld
        TEZC-Union-10-OPTOFF.gld
        TEZC-Cogroup-1.gld
        TEZC-Limit-3.gld
        TEZC-MQ-4.gld
        TEZC-Union-9.gld
        TEZC-MQ-2-OPTOFF.gld
        TEZC-Union-2.gld
        TEZC-FRJoin-1.gld
        TEZC-MQ-5.gld
        TEZC-Union-5-OPTOFF.gld
        TEZC-Union-10.gld
        TEZC-Union-6-OPTOFF.gld
        TEZC-Order-1.gld
        TEZC-Distinct-2.gld
        TEZC-Distinct-1.gld
        TEZC-Limit-1.gld
        TEZC-Rank-2.gld
        TEZC-SecKeySort-1.gld
        TEZC-MQ-2.gld
        TEZC-Union-5.gld
        TEZC-Union-1-OPTOFF.gld
        TEZC-Rank-1.gld
        TEZC-MQ-3-OPTOFF.gld
        TEZC-Filter-1.gld
        TEZC-MQ-1.gld
        TEZC-Union-9-OPTOFF.gld
        TEZC-Union-4.gld
        TEZC-Union-3.gld
        TEZC-MQ-3.gld
        TEZC-MQ-1-OPTOFF.gld
        TEZC-MQ-5-OPTOFF.gld
        TEZC-Union-1.gld
        TEZC-Union-8-OPTOFF.gld
        TEZC-Union-7.gld
        TEZC-Join-1.gld
        TEZC-Stream-1.gld
        TEZC-Union-2-OPTOFF.gld
        TEZC-SkewJoin-1.gld
        TEZC-Limit-2.gld
        TEZC-Group-1.gld
        TEZC-SecKeySort-2.gld
        TEZC-FRJoin-2.gld
        TEZC-MQ-4-OPTOFF.gld
        TEZC-Union-7-OPTOFF.gld
        TEZC-Union-6.gld
        TEZC-Union-3-OPTOFF.gld
        TEZC-Union-8.gld
        MRC9.gld
        MRC11.gld
        MRC8.gld
        jsTst3
        Generate.gld
        MRC12.gld
        ComplexForeach.gld
        bzipdir1.bz2
        bzipdir2.bz2
        recordLossblockHeaderEndsAt136500.txt.bz2
        ConfFile3.txt
        input2.pig
        inputSubstitutionWithinShellCommand.pig
        ConfFileDuplicates.txt
        ConfFileComplexVal.txt
        inputThreeParams.pig
        illustrate5.pig
        input7.pig
        inputComment.pig
        illustrate2.pig
        input5.pig
        generate_date.bat
        TestIllustrateInput_invalid.txt
        input3.pig
        ExpectedResultCmdLnPriorDeclare.pig
        ExpectedResult7.pig
        illustrate6.pig
        TestSecondarySortMR.java
        Util.java
        TestTypeCheckingValidatorNewLP.java
        TestGroupConstParallelMR.java
        TestBuiltin.java
        TestTypedMap.java
        TestPigSplit.java
        TestBloom.java
        TestGreaterThan.java
        TestEvalPipeline.java
        TestPOGenerate.java
        TestNewPlanOperatorPlan.java
        OptimizeLimitPlanPrinter.java
        TestFilterUDF.java
        TestLocal.java
        TestIn.java
        TestCase.java
        TestMergeJoinOuter.java
        pigunit
        TestPigTest.java
        pig
        TestGruntParser.java
        TestMRCompiler.java
        TestLOLoadDeterminedSchema.java
        TestNewPlanImplicitSplit.java
        TestFilterOpString.java
        TestPigStreaming.java
        TestPigContext.java
        TestNumberOfReducers.java
        TestDataModel.java
        TestSchemaUtil.java
        TestPOPartialAgg.java
        TestCollectedGroup.java
        TestPhyPatternMatch.java
        OrdDescNumeric.java
        TestScalarAliases.java
        TestStore.java
        TestMultiQueryCompiler.java
        TestPOUserFunc.java
        TestGrunt.java
        TestPi.java
        TestLocal2.java
        TestMapReduce2.java
        TestBinaryExpressionOps.java
        TestMapProjectionDuplicate.java
        TestBlackAndWhitelistValidator.java
        TestLocalRearrange.java
        TestRollupDimensions.java
        PigStorageWithDifferentCaster.java
        TestNullConstant.java
        TestInstantiateFunc.java
        TestForEachNestedPlanLocal.java
        TestPOPartialAggPlan.java
        TestDeleteOnFail.java
        TestPigStorage.java
        junit
        OrderedJUnit4Runner.java
        TestPigProgressReporting.java
        TestLoaderStorerShipCacheFiles.java
        TestAssert.java
        TestPONegative.java
        TestEmptyInputDir.java
        TestGFCross.java
        TestDataBagAccess.java
        TestFRJoin.java
        TestSample.java
        TestStoreOld.java
        TestPOMapLookUp.java
        TestPigContextClassCache.java
        TestRank3.java
        TestCounters.java
        PigStorageWithSchema.java
        TestNewPlanLogicalOptimizer.java
        TestFinish.java
        TestBoolean.java
        TestMRJobStats.java
        TestStoreInstances.java
        TestSplitCombine.java
        TestUTF8.java
        TestSkewedJoin.java
        TestPhyOp.java
        TestMonitoredUDF.java
        TestSplit.java
        TestForEachStar.java
        TestParamSubPreproc.java
        TestJsonLoaderStorage.java
        TestOptimizeLimit.java
        TestFRJoin2.java
        TestPredeployedJar.java
        TestInfixArithmetic.java
        TestMergeJoin.java
        TestNotEqualTo.java
        TestInputOutputFileValidator.java
        TestPOSplit.java
        TestSampleOptimizer.java
        TestCombiner.java
        TestResourceSchema.java
        TestOrderBy2.java
        TestCustomPartitioner.java
        backend
        hadoop
        hbase
        TestHBaseStorageFiltering.java
        executionengine
        mapReduceLayer
        TestPigBytesRawComparator.java
        TestInputSizeReducerEstimator.java
        accumulo
        TestAccumuloPigCluster.java
        TestAccumuloStorage.java
        TestAbstractAccumuloStorage.java
        TestAccumuloStorageConfiguration.java
        TestAccumuloColumns.java
        TestAccumuloStorageOptions.java
        TestAccumuloBinaryConverter.java
        newplan
        logical
        relational
        TestLocationInPhysicalPlan.java
        LOTestHelper.java
        optimizer
        TestImplicitSplitOnTuple.java
        TestSchemaResetter.java
        TestLoadFuncWrapper.java
        data
        utils
        TestMethodHelper.java
        TestSchemaTuple.java
        TestAlgebraicEvalWithParameterizedReturnType.java
        pigunit
        pig
        GruntParser.java
        PigServer.java
        Cluster.java
        MiniClusterRunner.java
        PigTest.java
        TestStoreFuncWrapper.java
        tools
        grunt
        TestGruntParser.java
        tez
        TestTezJobControlCompiler.java
        TestTezLauncher.java
        TestJobSubmissionTez.java
        TestTezAutoParallelism.java
        TestLoaderStorerShipCacheFilesTez.java
        TestTezCompiler.java
        TestGroupConstParallelTez.java
        TestSecondarySortTez.java
        TestLoadFuncMetadataWrapper.java
        TestPrimitiveEvalFunc.java
        parser
        TestSchemaAliasVisitor.java
        TestDefaultDataTypeInserter.pig
        TestQueryLexer.java
        TestUnionOnSchemaSetter.java
        TestErrorHandling.java
        TestAST.pig
        TestQueryParser.java
        TestLogicalPlanGenerator.java
        TestParser.pig
        ParsingFailureException.java
        TestLexer.pig
        TestScalarVisitor.java
        TestQueryParserUtils.java
        ParserTestingUtils.java
        TreePrinter.java
        TestAstValidator.java
        TestColumnAliasConversion.java
        TestTypedOutputEvalFunc.java
        TestMain.java
  - perf
    - pigmix
      - src
        pig
        L2.pig
        L16.pig
        L13.pig
        L17.pig
        L3.pig
        L11.pig
        L9.pig
        L4.pig
        L6.pig
        L14.pig
        L12.pig
        L7.pig
        L10.pig
        L15.pig
        L5.pig
        L1.pig
        L8.pig
        java
        org
        apache
        pig
        test
        pigmix
        datagen
        DataGenerator.java
        udf
        PigPerformanceLoader.java
        mapreduce
        L15.java
        L14.java
        L6.java
        L8.java
        L11.java
        L1.java
        L5.java
        L9.java
        L12.java
        L17.java
        L3.java
        L4.java
        L10.java
        L16.java
        L13.java
        L2.java
        Library.java
        L7.java
      - build.xml
      - lib
      - bin
        runpigmix.pl
        generate_data.sh
      - conf
        config.sh
- doap_Pig.rdf
- license
  - jline-LICENSE.txt
  - brics-LICENSE.txt
  - junit-LICENSE.txt
  - javacc-LICENSE.txt
  - hadoop-LICENSE.txt
- ivy.xml
- README.md
- RELEASE_NOTES.txt
- KEYS
- bin
  - pig.py
  - pig.cmd
  - pig
- autocomplete
- .gitignore
- contrib
  - CHANGES.txt
  - piggybank
    - java
      - src
        main
        java
        org
        apache
        pig
        piggybank
        storage
        SequenceFileLoader.java
        avro
        PigSchema2Avro.java
        AvroStorageUtils.java
        AvroStorageLog.java
        AvroStorageInputStream.java
        AvroSchemaManager.java
        PigAvroInputFormat.java
        AvroStorage.java
        PigAvroDatumReader.java
        PigAvroRecordReader.java
        PigAvroRecordWriter.java
        AvroSchema2Pig.java
        PigAvroOutputFormat.java
        PigAvroDatumWriter.java
        MyRegExLoader.java
        FixedWidthLoader.java
        JsonMetadata.java
        allloader
        LoadFuncHelper.java
        HiveColumnarStorage.java
        partition
        PathPartitionHelper.java
        PathPartitioner.java
        DBStorage.java
        IndexedStorage.java
        XMLLoader.java
        HiveColumnarLoader.java
        PigStorageSchema.java
        FixedWidthStorer.java
        AllLoader.java
        HadoopJobHistoryLoader.java
        RegExLoader.java
        apachelog
        CommonLogLoader.java
        CombinedLogLoader.java
        MultiStorage.java
        CSVExcelStorage.java
        hiverc
        HiveRCOutputFormat.java
        HiveRCSchemaUtil.java
        HiveRCRecordReader.java
        HiveRCInputFormat.java
        CSVLoader.java
        evaluation
        Over.java
        xml
        XPath.java
        MaxTupleBy1stField.java
        Stitch.java
        util
        apachelogparser
        SearchTermExtractor.java
        SearchEngineExtractor.java
        HostExtractor.java
        DateExtractor.java
        ToTuple.java
        ToBag.java
        Top.java
        SearchQuery.java
        decode
        Bin.java
        BinCond.java
        Decode.java
        datetime
        diff
        ISOHoursBetween.java
        ISODaysBetween.java
        ISOMonthsBetween.java
        ISOSecondsBetween.java
        ISOMinutesBetween.java
        ISOYearsBetween.java
        truncate
        ISOToMonth.java
        ISOToSecond.java
        ISOToWeek.java
        ISOHelper.java
        ISOToHour.java
        ISOToDay.java
        ISOToMinute.java
        ISOToYear.java
        convert
        ISOToUnix.java
        UnixToISO.java
        CustomFormatToISO.java
        DiffDate.java
        IsInt.java
        math
        ROUND.java
        SIN.java
        ULP.java
        LOG10.java
        DoubleGetExponent.java
        ASIN.java
        DoubleAbs.java
        POW.java
        COSH.java
        DoubleMin.java
        FloatSignum.java
        SINH.java
        SCALB.java
        FloatMin.java
        Base.java
        DoubleUlp.java
        FLOOR.java
        copySign.java
        RINT.java
        MAX.java
        SQRT.java
        SIGNUM.java
        EXP.java
        DoubleCopySign.java
        toDegrees.java
        FloatUlp.java
        TAN.java
        TANH.java
        FloatCopySign.java
        IntAbs.java
        toRadians.java
        LongMin.java
        DoubleMax.java
        IntMax.java
        FloatNextAfter.java
        EXPM1.java
        Util.java
        nextAfter.java
        DoubleNextAfter.java
        ATAN2.java
        ATAN.java
        IEEEremainder.java
        COS.java
        LOG1P.java
        LongMax.java
        DoubleDoubleBase.java
        FloatRound.java
        FloatGetExponent.java
        HYPOT.java
        DoubleRound.java
        ACOS.java
        FloatNextup.java
        DoubleBase.java
        CEIL.java
        getExponent.java
        FloatMax.java
        MIN.java
        DoubleNextup.java
        FloatAbs.java
        CBRT.java
        RANDOM.java
        LongAbs.java
        ABS.java
        LOG.java
        IntMin.java
        NEXTUP.java
        DoubleSignum.java
        IsDouble.java
        stats
        COR.java
        COV.java
        IsLong.java
        IsFloat.java
        string
        Reverse.java
        LookupInFiles.java
        HashFNV.java
        LENGTH.java
        HashFNV1.java
        LcFirst.java
        RegexExtractAll.java
        INDEXOF.java
        UcFirst.java
        Trim.java
        RegexExtract.java
        SUBSTRING.java
        UPPER.java
        RegexMatch.java
        LASTINDEXOF.java
        Split.java
        HashFNV2.java
        LOWER.java
        Stuff.java
        REPLACE.java
        ExtremalTupleByNthField.java
        IsNumeric.java
        test
        java
        org
        apache
        pig
        piggybank
        test
        storage
        avro
        TestAvroStorageUtils.java
        avro_test_files
        expected_testMultipleSchemas1.avro
        expected_testRecordWithFieldSchema.avro
        expected_testRecursiveRecordReference2.avro
        expected_test_dir_1.avro
        test_generic_union.avro
        expected_testCorruptedFile.avro
        test_dir1
        test_subdir
        test_glob4.avro
        test_glob5.avro
        test_glob2.avro
        test_glob3.avro
        test_glob1.avro
        test_array.avro
        test_corrupted_file.avro
        expected_testArrayDefault.avro
        expected_testRecordSplit2.avro
        test_loadavrowithnulls.avro
        test_recursive_record_in_union.avsc
        test_record.avsc
        test_recursive_record_in_union.avro
        test_recursive_record_in_map.avro
        expected_testUserDefinedLoadSchema.avro
        expected_testArrayWithSchema.avro
        test_no_extension
        test_user_defined_load_schema
        testUserDefinedLoadSchema_input2.avro
        testUserDefinedLoadSchema_input1.avro
        expected_testRecordSplitFromText2.avro
        expected_testFileWithNoExtension.avro
        expected_testDefaultSchemaWrite.avro
        test_recursive_record_in_array.avro
        messages.avro
        expected_testRecursiveRecordReference1.avro
        expected_testArrayWithSchemaURI.avro
        test_merge_schemas_default
        Employee3.avro
        Employee6.avro
        Employee4.avro
        test_recursive_record_in_record.avro
        test_primitive_types
        test_double.avro
        test_string.avro
        test_float.avro
        test_int.avro
        test_long.avro
        test_enum.avro
        test_complex_types
        test_record_int.avro
        test_record_string.avro
        test_record_double.avro
        test_record_enum.avro
        test_record_float.avro
        test_record_long.avro
        expected_test_dir_1_2.avro
        expected_testRecordSplit1.avro
        expected_testDir.avro
        expected_testRecordSplitFromText1.avro
        test_array.avsc
        test_record.txt
        expected_testRecursiveRecordReference3.avro
        test_record.avro
        expected_testMultipleSchemas2.avro
        test_dir2
        test_glob4.avro
        test_glob5.avro
        TestAvroStorage.java
        TestHiveColumnarLoader.java
        TestHadoopJobHistoryLoader.java
        TestHelper.java
        TestCombinedLogLoader.java
        TestDBStorage.java
        TestPathPartitioner.java
        TestXMLLoader.java
        TestLoadFuncHelper.java
        TestMyRegExLoader.java
        TestIndexedStorage.java
        TestSequenceFileLoader.java
        TestMultiStorageCompression.java
        TestFixedWidthLoader.java
        TestCSVExcelStorage.java
        TestRegExLoader.java
        TestFixedWidthStorer.java
        TestPathPartitionHelper.java
        TestMultiStorage.java
        TestCSVStorage.java
        TestHiveColumnarStorage.java
        TestAvroStorageData
        expected_testRecordWithFieldSchema.avro
        test_array.avro
        expected_testArrayDefault.avro
        expected_testRecordSplit2.avro
        expected_testArrayWithSchema.avro
        expected_testRecordSplit1.avro
        test_record.avro
        TestCommonLogLoader.java
        TestAllLoader.java
        evaluation
        xml
        XPathTest.java
        data
        test-file-2.xml.bz2
        TestIsInt.java
        TestIsLong.java
        TestMathUDF.java
        TestExtremalTupleByNthField.java
        util
        apachelogparser
        TestSearchEngineExtractor.java
        TestHostExtractor.java
        TestDateExtractor.java
        TestSearchTermExtractor.java
        TestSearchQuery.java
        TestTop.java
        TestToBagToTuple.java
        TestIsNumeric.java
        TestStat.java
        decode
        TestDecode.java
        TestEvalString.java
        datetime
        diff
        TestDiffDateTime.java
        truncate
        TestTruncateDateTime.java
        convert
        TestConvertDateTime.java
        TestDiffDate.java
        TestIsDouble.java
        TestIsFloat.java
        string
        TestHashFNV.java
        TestReverse.java
        TestRegex.java
        TestStuff.java
        TestLength.java
        TestLookupInFiles.java
        TestUcFirst.java
        TestSplit.java
        data
        jh
        localhost_1272395783545_job_201004271216_9998_user_PigLatinTest.pig
        localhost_1272395783545_job_conf.xml
        localhost_1272395783545_job_201004271216_9998_conf.xml
        evaluation
        TestOver.java
        TestStitch.java
      - build.xml
      - lib
        .gitignore
- conf
  - log4j.properties.template
  - pig.properties
  - test-log4j.properties

/**
 * Licensed to the Apache Software Foundation (ASF) under one or more
 * contributor license agreements. See the NOTICE file distributed with this
 * work for additional information regarding copyright ownership. The ASF
 * licenses this file to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 * http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
 * WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the
 * License for the specific language governing permissions and limitations under
 * the License.
 */
package org.apache.pig.backend.hadoop.hbase;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;
import java.lang.reflect.InvocationTargetException;
import java.lang.reflect.Method;
import java.lang.reflect.UndeclaredThrowableException;
import java.math.BigDecimal;
import java.math.BigInteger;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import java.util.NavigableMap;
import java.util.Properties;

import org.apache.commons.cli.CommandLine;
import org.apache.commons.cli.CommandLineParser;
import org.apache.commons.cli.GnuParser;
import org.apache.commons.cli.HelpFormatter;
import org.apache.commons.cli.Option;
import org.apache.commons.cli.OptionBuilder;
import org.apache.commons.cli.Options;
import org.apache.commons.cli.ParseException;
import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.filter.BinaryComparator;
import org.apache.hadoop.hbase.filter.ColumnPrefixFilter;
import org.apache.hadoop.hbase.filter.CompareFilter.CompareOp;
import org.apache.hadoop.hbase.filter.FamilyFilter;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.filter.FilterList;
import org.apache.hadoop.hbase.filter.QualifierFilter;
import org.apache.hadoop.hbase.filter.RegexStringComparator;
import org.apache.hadoop.hbase.filter.RowFilter;
import org.apache.hadoop.hbase.filter.WhileMatchFilter;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableInputFormat;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.hbase.mapreduce.TableOutputFormat;
import org.apache.hadoop.hbase.mapreduce.TableSplit;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.WritableComparable;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapreduce.InputFormat;
import org.apache.hadoop.mapreduce.InputSplit;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.OutputFormat;
import org.apache.hadoop.mapreduce.RecordReader;
import org.apache.hadoop.mapreduce.RecordWriter;
import org.apache.hadoop.security.UserGroupInformation;
import org.apache.pig.CollectableLoadFunc;
import org.apache.pig.LoadCaster;
import org.apache.pig.LoadFunc;
import org.apache.pig.LoadPushDown;
import org.apache.pig.LoadStoreCaster;
import org.apache.pig.OrderedLoadFunc;
import org.apache.pig.ResourceSchema;
import org.apache.pig.ResourceSchema.ResourceFieldSchema;
import org.apache.pig.StoreFuncInterface;
import org.apache.pig.StoreResources;
import org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigSplit;
import org.apache.pig.backend.hadoop.hbase.HBaseTableInputFormat.HBaseTableIFBuilder;
import org.apache.pig.builtin.FuncUtils;
import org.apache.pig.builtin.Utf8StorageConverter;
import org.apache.pig.data.DataBag;
import org.apache.pig.data.DataByteArray;
import org.apache.pig.data.DataType;
import org.apache.pig.data.Tuple;
import org.apache.pig.data.TupleFactory;
import org.apache.pig.impl.PigContext;
import org.apache.pig.impl.logicalLayer.FrontendException;
import org.apache.pig.impl.util.ObjectSerializer;
import org.apache.pig.impl.util.UDFContext;
import org.apache.pig.impl.util.Utils;
import org.joda.time.DateTime;

import com.google.common.collect.Lists;

/**
 * A HBase implementation of LoadFunc and StoreFunc.
 * <P>
 * Below is an example showing how to load data from HBase:
 * <pre>{@code
 * raw = LOAD 'hbase://SampleTable'
 *       USING org.apache.pig.backend.hadoop.hbase.HBaseStorage(
 *       'info:first_name info:last_name friends:* info:*', '-loadKey true -limit 5')
 *       AS (id:bytearray, first_name:chararray, last_name:chararray, friends_map:map[], info_map:map[]);
 * }</pre>
 * This example loads data redundantly from the info column family just to
 * illustrate usage. Note that the row key is inserted first in the result schema.
 * To load only column names that start with a given prefix, specify the column
 * name with a trailing '*'. For example passing <code>friends:bob_*</code> to
 * the constructor in the above example would cause only columns that start with
 * <i>bob_</i> to be loaded.
 * <P>
 * Note that when using a prefix like <code>friends:bob_*</code>, explicit HBase filters are set for
 * all columns and prefixes specified. Querying HBase with many filters can cause performance
 * degredation. This is typically seen when mixing one or more prefixed descriptors with a large list
 * of columns. In that case better perfomance will be seen by either loading the entire family via
 * <code>friends:*</code> or by specifying explicit column descriptor names.
 * <P>
 * Below is an example showing how to store data into HBase:
 * <pre>{@code
 * copy = STORE raw INTO 'hbase://SampleTableCopy'
 *       USING org.apache.pig.backend.hadoop.hbase.HBaseStorage(
 *       'info:first_name info:last_name friends:* info:*');
 * }</pre>
 * Note that STORE will expect the first value in the tuple to be the row key.
 * Scalars values need to map to an explicit column descriptor and maps need to
 * map to a column family name. In the above examples, the <code>friends</code>
 * column family data from <code>SampleTable</code> will be written to a
 * <code>buddies</code> column family in the <code>SampleTableCopy</code> table.
 *
 */
public class HBaseStorage extends LoadFunc implements StoreFuncInterface, LoadPushDown, OrderedLoadFunc, StoreResources,
        CollectableLoadFunc {

    private static final Log LOG = LogFactory.getLog(HBaseStorage.class);

    private final static String STRING_CASTER = "UTF8StorageConverter";
    private final static String BYTE_CASTER = "HBaseBinaryConverter";
    private final static String CASTER_PROPERTY = "pig.hbase.caster";
    private final static String ASTERISK = "*";
    private final static String COLON = ":";
    private final static String HBASE_SECURITY_CONF_KEY = "hbase.security.authentication";
    private final static String HBASE_CONFIG_SET = "hbase.config.set";
    private final static String HBASE_TOKEN_SET = "hbase.token.set";

    private List<ColumnInfo> columnInfo_ = Lists.newArrayList();

    //Use JobConf to store hbase delegation token
    private JobConf m_conf;
    private RecordReader reader;
    private RecordWriter writer;
    private TableOutputFormat outputFormat = null;
    private Scan scan;
    private String contextSignature = null;

    private final CommandLine configuredOptions_;
    private final static Options validOptions_ = new Options();
    private final static CommandLineParser parser_ = new GnuParser();

    private boolean loadRowKey_;
    private String delimiter_;
    private boolean ignoreWhitespace_;
    private final long limit_;
    private final boolean cacheBlocks_;
    private final int caching_;
    private boolean noWAL_;
    private final long minTimestamp_;
    private final long maxTimestamp_;
    private final long timestamp_;

    protected transient byte[] gt_;
    protected transient byte[] gte_;
    protected transient byte[] lt_;
    protected transient byte[] lte_;

    private String regex_;
    private LoadCaster caster_;

    private ResourceSchema schema_;
    private RequiredFieldList requiredFieldList;

    private static void populateValidOptions() {
        Option loadKey = OptionBuilder.hasOptionalArgs(1).withArgName("loadKey").withLongOpt("loadKey").withDescription("Load Key").create();
        validOptions_.addOption(loadKey);
        validOptions_.addOption("gt", true, "Records must be greater than this value " +
                "(binary, double-slash-escaped)");
        validOptions_.addOption("lt", true, "Records must be less than this value (binary, double-slash-escaped)");
        validOptions_.addOption("gte", true, "Records must be greater than or equal to this value");
        validOptions_.addOption("lte", true, "Records must be less than or equal to this value");
        validOptions_.addOption("regex", true, "Record must match this regular expression");
        validOptions_.addOption("cacheBlocks", true, "Set whether blocks should be cached for the scan");
        validOptions_.addOption("caching", true, "Number of rows scanners should cache");
        validOptions_.addOption("limit", true, "Per-region limit");
        validOptions_.addOption("delim", true, "Column delimiter");
        validOptions_.addOption("ignoreWhitespace", true, "Ignore spaces when parsing columns");
        validOptions_.addOption("caster", true, "Caster to use for converting values. A class name, " +
                "HBaseBinaryConverter, or Utf8StorageConverter. For storage, casters must implement LoadStoreCaster.");
        Option noWal = OptionBuilder.hasOptionalArgs(1).withArgName("noWAL").withLongOpt("noWAL").withDescription("Sets the write ahead to false for faster loading. To be used with extreme caution since this could result in data loss (see http://hbase.apache.org/book.html#perf.hbase.client.putwal).").create();
        validOptions_.addOption(noWal);
        validOptions_.addOption("minTimestamp", true, "Record must have timestamp greater or equal to this value");
        validOptions_.addOption("maxTimestamp", true, "Record must have timestamp less then this value");
        validOptions_.addOption("timestamp", true, "Record must have timestamp equal to this value");
    }

    /**
     * Constructor. Construct a HBase Table LoadFunc and StoreFunc to load or store the cells of the
     * provided columns.
     *
     * @param columnList
     *        columnlist that is a presented string delimited by space and/or
     *        commas. To retreive all columns in a column family <code>Foo</code>,
     *        specify a column as either <code>Foo:</code> or <code>Foo:*</code>.
     *        To fetch only columns in the CF that start with <I>bar</I>, specify
     *        <code>Foo:bar*</code>. The resulting tuple will always be the size
     *        of the number of tokens in <code>columnList</code>. Items in the
     *        tuple will be scalar values when a full column descriptor is
     *        specified, or a map of column descriptors to values when a column
     *        family is specified.
     *
     * @throws ParseException when unable to parse arguments
     * @throws IOException
     */
    public HBaseStorage(String columnList) throws ParseException, IOException {
        this(columnList,"");
    }

    /**
     * Constructor. Construct a HBase Table LoadFunc and StoreFunc to load or store.
     * @param columnList
     * @param optString Loader options. Known options:<ul>
     * <li>-loadKey=(true|false)  Load the row key as the first column
     * <li>-gt=minKeyVal
     * <li>-lt=maxKeyVal
     * <li>-gte=minKeyVal
     * <li>-lte=maxKeyVal
     * <li>-regex=match regex on KeyVal
     * <li>-limit=numRowsPerRegion max number of rows to retrieve per region
     * <li>-delim=char delimiter to use when parsing column names (default is space or comma)
     * <li>-ignoreWhitespace=(true|false) ignore spaces when parsing column names (default true)
     * <li>-cacheBlocks=(true|false) Set whether blocks should be cached for the scan (default false).
     * <li>-caching=numRows  number of rows to cache (faster scans, more memory).
     * <li>-noWAL=(true|false) Sets the write ahead to false for faster loading.
     * <li>-minTimestamp= Scan's timestamp for min timeRange
     * <li>-maxTimestamp= Scan's timestamp for max timeRange
     * <li>-timestamp= Scan's specified timestamp
     * <li>-caster=(HBaseBinaryConverter|Utf8StorageConverter) Utf8StorageConverter is the default
     * To be used with extreme caution, since this could result in data loss
     * (see http://hbase.apache.org/book.html#perf.hbase.client.putwal).
     * </ul>
     * @throws ParseException
     * @throws IOException
     */
    public HBaseStorage(String columnList, String optString) throws ParseException, IOException {
        populateValidOptions();
        String[] optsArr = optString.split(" ");
        try {
            configuredOptions_ = parser_.parse(validOptions_, optsArr);
        } catch (ParseException e) {
            HelpFormatter formatter = new HelpFormatter();
            formatter.printHelp( "[-loadKey] [-gt] [-gte] [-lt] [-lte] [-regex] [-columnPrefix] [-cacheBlocks] [-caching] [-caster] [-noWAL] [-limit] [-delim] [-ignoreWhitespace] [-minTimestamp] [-maxTimestamp] [-timestamp]", validOptions_ );
            throw e;
        }

		loadRowKey_ = false;
		if (configuredOptions_.hasOption("loadKey")) {
			String value = configuredOptions_.getOptionValue("loadKey");
			if ("true".equalsIgnoreCase(value) || "".equalsIgnoreCase(value) || value == null ) {//the empty string and null check is for backward compat.
				loadRowKey_ = true;
			}
		}

        delimiter_ = ",";
        if (configuredOptions_.getOptionValue("delim") != null) {
          delimiter_ = configuredOptions_.getOptionValue("delim");
        }

        ignoreWhitespace_ = true;
        if (configuredOptions_.hasOption("ignoreWhitespace")) {
          String value = configuredOptions_.getOptionValue("ignoreWhitespace");
          if (!"true".equalsIgnoreCase(value)) {
            ignoreWhitespace_ = false;
          }
        }

        columnInfo_ = parseColumnList(columnList, delimiter_, ignoreWhitespace_);

        String defaultCaster = UDFContext.getUDFContext().getClientSystemProps().getProperty(CASTER_PROPERTY, STRING_CASTER);
        String casterOption = configuredOptions_.getOptionValue("caster", defaultCaster);
        if (STRING_CASTER.equalsIgnoreCase(casterOption)) {
            caster_ = new Utf8StorageConverter();
        } else if (BYTE_CASTER.equalsIgnoreCase(casterOption)) {
            caster_ = new HBaseBinaryConverter();
        } else {
            try {
              caster_ = (LoadCaster) PigContext.instantiateFuncFromSpec(casterOption);
            } catch (ClassCastException e) {
                LOG.error("Configured caster does not implement LoadCaster interface.");
                throw new IOException(e);
            } catch (RuntimeException e) {
                LOG.error("Configured caster class not found.", e);
                throw new IOException(e);
            }
        }
        LOG.debug("Using caster " + caster_.getClass());

        caching_ = Integer.valueOf(configuredOptions_.getOptionValue("caching", "100"));
        cacheBlocks_ = Boolean.valueOf(configuredOptions_.getOptionValue("cacheBlocks", "false"));
        limit_ = Long.valueOf(configuredOptions_.getOptionValue("limit", "-1"));
        noWAL_ = false;
		if (configuredOptions_.hasOption("noWAL")) {
			String value = configuredOptions_.getOptionValue("noWAL");
			if ("true".equalsIgnoreCase(value) || "".equalsIgnoreCase(value) || value == null) {//the empty string and null check is for backward compat.
				noWAL_ = true;
			}
		}

        if (configuredOptions_.hasOption("minTimestamp")){
            minTimestamp_ = Long.parseLong(configuredOptions_.getOptionValue("minTimestamp"));
        } else {
            minTimestamp_ = 0;
        }

        if (configuredOptions_.hasOption("maxTimestamp")){
            maxTimestamp_ = Long.parseLong(configuredOptions_.getOptionValue("maxTimestamp"));
        } else {
            maxTimestamp_ = Long.MAX_VALUE;
        }

        if (configuredOptions_.hasOption("timestamp")){
            timestamp_ = Long.parseLong(configuredOptions_.getOptionValue("timestamp"));
        } else {
            timestamp_ = 0;
        }

        initScan();
    }

    /**
     * Returns UDFProperties based on <code>contextSignature</code>.
     */
    private Properties getUDFProperties() {
        return UDFContext.getUDFContext()
            .getUDFProperties(this.getClass(), new String[] {contextSignature});
    }

    /**
     * @return <code> contextSignature + "_projectedFields" </code>
     */
    private String projectedFieldsName() {
        return contextSignature + "_projectedFields";
    }

    /**
     *
     * @param columnList
     * @param delimiter
     * @param ignoreWhitespace
     * @return
     */
    private List<ColumnInfo> parseColumnList(String columnList,
                                             String delimiter,
                                             boolean ignoreWhitespace) {
        List<ColumnInfo> columnInfo = new ArrayList<ColumnInfo>();

        // Default behavior is to allow combinations of spaces and delimiter
        // which defaults to a comma. Setting to not ignore whitespace will
        // include the whitespace in the columns names
        String[] colNames = columnList.split(delimiter);
        if(ignoreWhitespace) {
            List<String> columns = new ArrayList<String>();

            for (String colName : colNames) {
                String[] subColNames = colName.split(" ");

                for (String subColName : subColNames) {
                    subColName = subColName.trim();
                    if (subColName.length() > 0) columns.add(subColName);
                }
            }

            colNames = columns.toArray(new String[columns.size()]);
        }

        for (String colName : colNames) {
            columnInfo.add(new ColumnInfo(colName));
        }

        return columnInfo;
    }

    private void initScan() throws IOException{
        scan = new Scan();

        scan.setCacheBlocks(cacheBlocks_);
        scan.setCaching(caching_);

        // Set filters, if any.
        if (configuredOptions_.hasOption("gt")) {
            gt_ = Bytes.toBytesBinary(Utils.slashisize(configuredOptions_.getOptionValue("gt")));
            addRowFilter(CompareOp.GREATER, gt_);
            scan.setStartRow(gt_);
        }
        if (configuredOptions_.hasOption("lt")) {
            lt_ = Bytes.toBytesBinary(Utils.slashisize(configuredOptions_.getOptionValue("lt")));
            addRowFilter(CompareOp.LESS, lt_);
            scan.setStopRow(lt_);
        }
        if (configuredOptions_.hasOption("gte")) {
            gte_ = Bytes.toBytesBinary(Utils.slashisize(configuredOptions_.getOptionValue("gte")));
            scan.setStartRow(gte_);
        }
        if (configuredOptions_.hasOption("lte")) {
            lte_ = Bytes.toBytesBinary(Utils.slashisize(configuredOptions_.getOptionValue("lte")));
            byte[] lt = increment(lte_);
            if (LOG.isDebugEnabled()) {
                LOG.debug(String.format("Incrementing lte value of %s from bytes %s to %s to set stop row",
                          Bytes.toString(lte_), toString(lte_), toString(lt)));
            }

            if (lt != null) {
                scan.setStopRow(increment(lte_));
            }

            // The WhileMatchFilter will short-circuit the scan after we no longer match. The
            // setStopRow call will limit the number of regions we need to scan
            addFilter(new WhileMatchFilter(new RowFilter(CompareOp.LESS_OR_EQUAL, new BinaryComparator(lte_))));
        }
        if (configuredOptions_.hasOption("regex")) {
            regex_ = Utils.slashisize(configuredOptions_.getOptionValue("regex"));
            addFilter(new RowFilter(CompareOp.EQUAL, new RegexStringComparator(regex_)));
        }
        if (configuredOptions_.hasOption("minTimestamp") || configuredOptions_.hasOption("maxTimestamp")){
            scan.setTimeRange(minTimestamp_, maxTimestamp_);
        }
        if (configuredOptions_.hasOption("timestamp")){
            scan.setTimeStamp(timestamp_);
        }

        // if the group of columnInfos for this family doesn't contain a prefix, we don't need
        // to set any filters, we can just call addColumn or addFamily. See javadocs below.
        boolean columnPrefixExists = false;
        for (ColumnInfo columnInfo : columnInfo_) {
            if (columnInfo.getColumnPrefix() != null) {
                columnPrefixExists = true;
                break;
            }
        }

        if (!columnPrefixExists) {
            addFiltersWithoutColumnPrefix(columnInfo_);
        }
        else {
            addFiltersWithColumnPrefix(columnInfo_);
        }
    }

    /**
     * If there is no column with a prefix, we don't need filters, we can just call addColumn and
     * addFamily on the scan
     */
    private void addFiltersWithoutColumnPrefix(List<ColumnInfo> columnInfos) {
        // Need to check for mixed types in a family, so we don't call addColumn
        // after addFamily on the same family
        Map<String, List<ColumnInfo>> groupedMap = groupByFamily(columnInfos);
        for (Entry<String, List<ColumnInfo>> entrySet : groupedMap.entrySet()) {
            boolean onlyColumns = true;
            for (ColumnInfo columnInfo : entrySet.getValue()) {
                if (columnInfo.isColumnMap()) {
                    onlyColumns = false;
                    break;
                }
            }
            if (onlyColumns) {
                for (ColumnInfo columnInfo : entrySet.getValue()) {
                    if (LOG.isDebugEnabled()) {
                        LOG.debug("Adding column to scan via addColumn with cf:name = "
                                + Bytes.toString(columnInfo.getColumnFamily()) + ":"
                                + Bytes.toString(columnInfo.getColumnName()));
                    }
                    scan.addColumn(columnInfo.getColumnFamily(), columnInfo.getColumnName());
                }
            } else {
                String family = entrySet.getKey();
                if (LOG.isDebugEnabled()) {
                    LOG.debug("Adding column family to scan via addFamily with cf:name = "
                            + family);
                }
                scan.addFamily(Bytes.toBytes(family));
            }
        }
    }

    /**
     *  If we have a qualifier with a prefix and a wildcard (i.e. cf:foo*), we need a filter on every
     *  possible column to be returned as shown below. This will become very inneficient for long
     *  lists of columns mixed with a prefixed wildcard.
     *
     *  FilterList - must pass ALL of
     *   - FamilyFilter
     *   - AND a must pass ONE FilterList of
     *    - either Qualifier
     *    - or ColumnPrefixFilter
     *
     *  If we have only column family filters (i.e. cf:*) or explicit column descriptors
     *  (i.e., cf:foo) or a mix of both then we don't need filters, since the scan will take
     *  care of that.
     */
    private void addFiltersWithColumnPrefix(List<ColumnInfo> columnInfos) {
        // we need to apply a CF AND column list filter for each family
        FilterList allColumnFilters = null;
        Map<String, List<ColumnInfo>> groupedMap = groupByFamily(columnInfos);
        for (String cfString : groupedMap.keySet()) {
            List<ColumnInfo> columnInfoList = groupedMap.get(cfString);
            byte[] cf = Bytes.toBytes(cfString);

            // all filters roll up to one parent OR filter
            if (allColumnFilters == null) {
                allColumnFilters = new FilterList(FilterList.Operator.MUST_PASS_ONE);
            }

            // each group contains a column family filter AND (all) and an OR (one of) of
            // the column filters
            FilterList thisColumnGroupFilter = new FilterList(FilterList.Operator.MUST_PASS_ALL);
            thisColumnGroupFilter.addFilter(new FamilyFilter(CompareOp.EQUAL, new BinaryComparator(cf)));
            FilterList columnFilters = new FilterList(FilterList.Operator.MUST_PASS_ONE);
            for (ColumnInfo colInfo : columnInfoList) {
                if (colInfo.isColumnMap()) {

                    if (LOG.isDebugEnabled()) {
                        LOG.debug("Adding family:prefix filters with values " +
                                Bytes.toString(colInfo.getColumnFamily()) + COLON +
                                Bytes.toString(colInfo.getColumnPrefix()));
                    }

                    // add a PrefixFilter to the list of column filters
                    if (colInfo.getColumnPrefix() != null) {
                        columnFilters.addFilter(new ColumnPrefixFilter(
                            colInfo.getColumnPrefix()));
                    }
                }
                else {

                    if (LOG.isDebugEnabled()) {
                        LOG.debug("Adding family:descriptor filters with values " +
                                Bytes.toString(colInfo.getColumnFamily()) + COLON +
                                Bytes.toString(colInfo.getColumnName()));
                    }

                    // add a QualifierFilter to the list of column filters
                    columnFilters.addFilter(new QualifierFilter(CompareOp.EQUAL,
                            new BinaryComparator(colInfo.getColumnName())));
                }
            }
            thisColumnGroupFilter.addFilter(columnFilters);
            allColumnFilters.addFilter(thisColumnGroupFilter);
        }
        if (allColumnFilters != null) {
            addFilter(allColumnFilters);
        }
    }

    private void addRowFilter(CompareOp op, byte[] val) {
        if (LOG.isDebugEnabled()) {
            LOG.debug("Adding filter " + op.toString() +
                    " with value " + Bytes.toStringBinary(val));
        }
        addFilter(new RowFilter(op, new BinaryComparator(val)));
    }

    private void addFilter(Filter filter) {
        FilterList scanFilter = (FilterList) scan.getFilter();
        if (scanFilter == null) {
            scanFilter = new FilterList(FilterList.Operator.MUST_PASS_ALL);
        }
        scanFilter.addFilter(filter);
        scan.setFilter(scanFilter);
    }

   /**
    * Returns the ColumnInfo list so external objects can inspect it.
    * @return List of ColumnInfo objects
    */
    public List<ColumnInfo> getColumnInfoList() {
        return columnInfo_;
    }

   /**
    * Updates the ColumnInfo List. Use this if you need to implement custom projections
    */
    protected void setColumnInfoList(List<ColumnInfo> columnInfoList) {
        this.columnInfo_ = columnInfoList;
    }

   /**
    * Stores the requiredFieldsList as a serialized object so it can be fetched on the cluster. If
    * you plan to overwrite pushProjection, you need to call this with the requiredFieldList so it
    * they can be accessed on the cluster.
    */
    protected void storeProjectedFieldNames(RequiredFieldList requiredFieldList) throws FrontendException {
        try {
            getUDFProperties().setProperty(projectedFieldsName(),
              ObjectSerializer.serialize(requiredFieldList));
        } catch (IOException e) {
            throw new FrontendException(e);
        }
    }

    @Override
    public Tuple getNext() throws IOException {
        try {
            if (reader.nextKeyValue()) {
                ImmutableBytesWritable rowKey = (ImmutableBytesWritable) reader
                .getCurrentKey();
                Result result = (Result) reader.getCurrentValue();

                int tupleSize = columnInfo_.size();

                // use a map of families -> qualifiers with the most recent
                // version of the cell. Fetching multiple vesions could be a
                // useful feature.
                NavigableMap<byte[], NavigableMap<byte[], byte[]>> resultsMap =
                        result.getNoVersionMap();

                if (loadRowKey_){
                    tupleSize++;
                }
                Tuple tuple=TupleFactory.getInstance().newTuple(tupleSize);

                int startIndex=0;
                if (loadRowKey_){
                    tuple.set(0, new DataByteArray(rowKey.get()));
                    startIndex++;
                }
                for (int i = 0;i < columnInfo_.size(); ++i){
                    int currentIndex = startIndex + i;

                    ColumnInfo columnInfo = columnInfo_.get(i);
                    if (columnInfo.isColumnMap()) {
                        // It's a column family so we need to iterate and set all
                        // values found
                        NavigableMap<byte[], byte[]> cfResults =
                                resultsMap.get(columnInfo.getColumnFamily());
                        Map<String, DataByteArray> cfMap =
                                new HashMap<String, DataByteArray>();

                        if (cfResults != null) {
                            for (byte[] quantifier : cfResults.keySet()) {
                                // We need to check against the prefix filter to
                                // see if this value should be included. We can't
                                // just rely on the server-side filter, since a
                                // user could specify multiple CF filters for the
                                // same CF.
                                if (columnInfo.getColumnPrefix() == null ||
                                        columnInfo.hasPrefixMatch(quantifier)) {

                                    byte[] cell = cfResults.get(quantifier);
                                    DataByteArray value =
                                            cell == null ? null : new DataByteArray(cell);
                                    cfMap.put(Bytes.toString(quantifier), value);
                                }
                            }
                        }
                        tuple.set(currentIndex, cfMap);
                    } else {
                        // It's a column so set the value
                        byte[] cell=result.getValue(columnInfo.getColumnFamily(),
                                                    columnInfo.getColumnName());
                        DataByteArray value =
                                cell == null ? null : new DataByteArray(cell);
                        tuple.set(currentIndex, value);
                    }
                }

                if (LOG.isDebugEnabled()) {
                    for (int i = 0; i < tuple.size(); i++) {
                        LOG.debug("tuple value:" + tuple.get(i));
                    }
                }

                return tuple;
            }
        } catch (InterruptedException e) {
            throw new IOException(e);
        }
        return null;
    }

    @Override
    public InputFormat getInputFormat() {
        TableInputFormat inputFormat = new HBaseTableIFBuilder()
        .withLimit(limit_)
        .withGt(gt_)
        .withGte(gte_)
        .withLt(lt_)
        .withLte(lte_)
        .withConf(m_conf)
        .build();
        inputFormat.setScan(scan);
        return inputFormat;
    }

    @Override
    public void prepareToRead(RecordReader reader, PigSplit split) {
        this.reader = reader;
    }

    @Override
    public void setUDFContextSignature(String signature) {
        this.contextSignature = signature;
    }

    @Override
    public void setLocation(String location, Job job) throws IOException {
        Properties udfProps = getUDFProperties();
        job.getConfiguration().setBoolean("pig.noSplitCombination", true);

        m_conf = initializeLocalJobConfig(job);
        String delegationTokenSet = udfProps.getProperty(HBASE_TOKEN_SET);
        if (delegationTokenSet == null) {
            addHBaseDelegationToken(m_conf, job);
            udfProps.setProperty(HBASE_TOKEN_SET, "true");
        }

        String tablename = location;
        if (location.startsWith("hbase://")) {
            tablename = location.substring(8);
        }

        m_conf.set(TableInputFormat.INPUT_TABLE, tablename);

        String projectedFields = udfProps.getProperty( projectedFieldsName() );
        if (projectedFields != null) {
            // update columnInfo_
            pushProjection((RequiredFieldList) ObjectSerializer.deserialize(projectedFields));
        }
        addFiltersWithoutColumnPrefix(columnInfo_);

        if (requiredFieldList != null) {
            Properties p = UDFContext.getUDFContext().getUDFProperties(this.getClass(),
                    new String[] {contextSignature});
            p.setProperty(contextSignature + "_projectedFields", ObjectSerializer.serialize(requiredFieldList));
        }
    }

    @Override
    public List<String> getShipFiles() {
        // Depend on HBase to do the right thing when available, as of HBASE-9165
        try {
            Method addHBaseDependencyJars =
              TableMapReduceUtil.class.getMethod("addHBaseDependencyJars", Configuration.class);
            if (addHBaseDependencyJars != null) {
                Configuration conf = new Configuration();
                addHBaseDependencyJars.invoke(null, conf);
                if (conf.get("tmpjars") != null) {
                    String[] tmpjars = conf.getStrings("tmpjars");
                    List<String> shipFiles = new ArrayList<String>(tmpjars.length);
                    for (String tmpjar : tmpjars) {
                        shipFiles.add(new URL(tmpjar).getPath());
                    }
                    return shipFiles;
                }
            }
        } catch (NoSuchMethodException e) {
            LOG.debug("TableMapReduceUtils#addHBaseDependencyJars not available."
              + " Falling back to previous logic.", e);
        } catch (IllegalAccessException e) {
            LOG.debug("TableMapReduceUtils#addHBaseDependencyJars invocation"
              + " not permitted. Falling back to previous logic.", e);
        } catch (InvocationTargetException e) {
            LOG.debug("TableMapReduceUtils#addHBaseDependencyJars invocation"
              + " failed. Falling back to previous logic.", e);
        } catch (MalformedURLException e) {
            LOG.debug("TableMapReduceUtils#addHBaseDependencyJars tmpjars"
                    + " had malformed url. Falling back to previous logic.", e);
        }

        List<Class> classList = new ArrayList<Class>();
        classList.add(org.apache.hadoop.hbase.client.HTable.class); // main hbase jar or hbase-client
        classList.add(org.apache.hadoop.hbase.mapreduce.TableSplit.class); // main hbase jar or hbase-server
        classList.add(com.google.common.collect.Lists.class); // guava
        classList.add(org.apache.zookeeper.ZooKeeper.class); // zookeeper
        // Additional jars that are specific to v0.95.0+
        addClassToList("org.cloudera.htrace.Trace", classList); // htrace
        addClassToList("org.apache.hadoop.hbase.protobuf.generated.HBaseProtos", classList); // hbase-protocol
        addClassToList("org.apache.hadoop.hbase.TableName", classList); // hbase-common
        addClassToList("org.apache.hadoop.hbase.CompatibilityFactory", classList); // hbase-hadoop-compar
        addClassToList("org.jboss.netty.channel.ChannelFactory", classList); // netty
        return FuncUtils.getShipFiles(classList);
    }

    private void addClassToList(String className, List<Class> classList) {
        try {
            Class klass = Class.forName(className);
            classList.add(klass);
        } catch (ClassNotFoundException e) {
            LOG.debug("Skipping adding jar for class: " + className);
        }
    }

    private JobConf initializeLocalJobConfig(Job job) {
        Properties udfProps = getUDFProperties();
        Configuration jobConf = job.getConfiguration();
        JobConf localConf = new JobConf(jobConf);
        if (udfProps.containsKey(HBASE_CONFIG_SET)) {
            for (Entry<Object, Object> entry : udfProps.entrySet()) {
                localConf.set((String) entry.getKey(), (String) entry.getValue());
            }
        } else {
            Configuration hbaseConf = HBaseConfiguration.create();
            for (Entry<String, String> entry : hbaseConf) {
                // JobConf may have some conf overriding ones in hbase-site.xml
                // So only copy hbase config not in job config to UDFContext
                // Also avoids copying core-default.xml and core-site.xml
                // props in hbaseConf to UDFContext which would be redundant.
                if (jobConf.get(entry.getKey()) == null) {
                    udfProps.setProperty(entry.getKey(), entry.getValue());
                    localConf.set(entry.getKey(), entry.getValue());
                }
            }
            udfProps.setProperty(HBASE_CONFIG_SET, "true");
        }
        return localConf;
    }

    /**
     * Get delegation token from hbase and add it to the Job
     *
     */
    @SuppressWarnings({ "rawtypes", "unchecked" })
    private void addHBaseDelegationToken(Configuration hbaseConf, Job job) {

        if (!UDFContext.getUDFContext().isFrontend()) {
            return;
        }

        if ("kerberos".equalsIgnoreCase(hbaseConf.get(HBASE_SECURITY_CONF_KEY))) {
            // Will not be entering this block for 0.20.2 as it has no security.
            try {
                // getCurrentUser method is not public in 0.20.2
                Method m1 = UserGroupInformation.class.getMethod("getCurrentUser");
                UserGroupInformation currentUser = (UserGroupInformation) m1.invoke(null,(Object[]) null);
                // hasKerberosCredentials method not available in 0.20.2
                Method m2 = UserGroupInformation.class.getMethod("hasKerberosCredentials");
                boolean hasKerberosCredentials = (Boolean) m2.invoke(currentUser, (Object[]) null);
                if (hasKerberosCredentials) {
                    // Class and method are available only from 0.92 security release
                    Class tokenUtilClass = Class
                            .forName("org.apache.hadoop.hbase.security.token.TokenUtil");
                    Method m3 = tokenUtilClass.getMethod("obtainTokenForJob", new Class[] {
                            Configuration.class, UserGroupInformation.class, Job.class });
                    m3.invoke(null, new Object[] { hbaseConf, currentUser, job });
                } else {
                    LOG.info("Not fetching hbase delegation token as no Kerberos TGT is available");
                }
            } catch (ClassNotFoundException cnfe) {
                throw new RuntimeException("Failure loading TokenUtil class, "
                        + "is secure RPC available?", cnfe);
            } catch (RuntimeException re) {
                throw re;
            } catch (Exception e) {
                throw new UndeclaredThrowableException(e,
                        "Unexpected error calling TokenUtil.obtainTokenForJob()");
            }
        }
    }

    @Override
    public String relativeToAbsolutePath(String location, Path curDir)
    throws IOException {
        return location;
    }

    /**
     * Set up the caster to use for reading values out of, and writing to, HBase.
     */
    @Override
    public LoadCaster getLoadCaster() throws IOException {
        return caster_;
    }

    /*
     * StoreFunc Methods
     * @see org.apache.pig.StoreFuncInterface#getOutputFormat()
     */

    @Override
    public OutputFormat getOutputFormat() throws IOException {
        if (outputFormat == null) {
            if (m_conf == null) {
                throw new IllegalStateException("setStoreLocation has not been called");
            } else {
                this.outputFormat = new TableOutputFormat();
                this.outputFormat.setConf(m_conf);
            }
        }
        return outputFormat;
    }

    @Override
    public void checkSchema(ResourceSchema s) throws IOException {
        if (! (caster_ instanceof LoadStoreCaster)) {
            LOG.error("Caster must implement LoadStoreCaster for writing to HBase.");
            throw new IOException("Bad Caster " + caster_.getClass());
        }
        schema_ = s;
        getUDFProperties().setProperty(contextSignature + "_schema",
                                       ObjectSerializer.serialize(schema_));
    }

    // Suppressing unchecked warnings for RecordWriter, which is not parameterized by StoreFuncInterface
    @Override
    public void prepareToWrite(@SuppressWarnings("rawtypes") RecordWriter writer) throws IOException {
        this.writer = writer;
    }

    // Suppressing unchecked warnings for RecordWriter, which is not parameterized by StoreFuncInterface
    @SuppressWarnings("unchecked")
    @Override
    public void putNext(Tuple t) throws IOException {
        ResourceFieldSchema[] fieldSchemas = (schema_ == null) ? null : schema_.getFields();
        byte type = (fieldSchemas == null) ? DataType.findType(t.get(0)) : fieldSchemas[0].getType();
        long ts=System.currentTimeMillis();

        Put put = createPut(t.get(0), type);

        if (LOG.isDebugEnabled()) {
            LOG.debug("putNext -- WAL disabled: " + noWAL_);
            for (ColumnInfo columnInfo : columnInfo_) {
                LOG.debug("putNext -- col: " + columnInfo);
            }
        }

        for (int i=1;i<t.size();++i){
            ColumnInfo columnInfo = columnInfo_.get(i-1);
            if (LOG.isDebugEnabled()) {
                LOG.debug("putNext - tuple: " + i + ", value=" + t.get(i) +
                        ", cf:column=" + columnInfo);
            }

            if (!columnInfo.isColumnMap()) {
                put.add(columnInfo.getColumnFamily(), columnInfo.getColumnName(),
                        ts, objToBytes(t.get(i), (fieldSchemas == null) ?
                        DataType.findType(t.get(i)) : fieldSchemas[i].getType()));
            } else {
                Map<String, Object> cfMap = (Map<String, Object>) t.get(i);
                if (cfMap!=null) {
                    for (String colName : cfMap.keySet()) {
                        if (LOG.isDebugEnabled()) {
                            LOG.debug("putNext - colName=" + colName +
                                      ", class: " + colName.getClass());
                        }
                        // TODO deal with the fact that maps can have types now. Currently we detect types at
                        // runtime in the case of storing to a cf, which is suboptimal.
                        put.add(columnInfo.getColumnFamily(), Bytes.toBytes(colName.toString()), ts,
                                objToBytes(cfMap.get(colName), DataType.findType(cfMap.get(colName))));
                    }
                }
            }
        }

        try {
            if (!put.isEmpty()) {
                writer.write(null, put);
            }
        } catch (InterruptedException e) {
            throw new IOException(e);
        }
    }

    /**
     * Public method to initialize a Put. Used to allow assertions of how Puts
     * are initialized by unit tests.
     *
     * @param key
     * @param type
     * @return new put
     * @throws IOException
     */
    public Put createPut(Object key, byte type) throws IOException {
        Put put = new Put(objToBytes(key, type));

        if(noWAL_) {
            put.setWriteToWAL(false);
        }

        return put;
    }

    @SuppressWarnings("unchecked")
    private byte[] objToBytes(Object o, byte type) throws IOException {
        LoadStoreCaster caster = (LoadStoreCaster) caster_;
        if (o == null) return null;
        switch (type) {
        case DataType.BYTEARRAY: return ((DataByteArray) o).get();
        case DataType.BAG: return caster.toBytes((DataBag) o);
        case DataType.CHARARRAY: return caster.toBytes((String) o);
        case DataType.DOUBLE: return caster.toBytes((Double) o);
        case DataType.FLOAT: return caster.toBytes((Float) o);
        case DataType.INTEGER: return caster.toBytes((Integer) o);
        case DataType.LONG: return caster.toBytes((Long) o);
        case DataType.BIGINTEGER: return caster.toBytes((BigInteger) o);
        case DataType.BIGDECIMAL: return caster.toBytes((BigDecimal) o);
        case DataType.BOOLEAN: return caster.toBytes((Boolean) o);
        case DataType.DATETIME: return caster.toBytes((DateTime) o);

        // The type conversion here is unchecked.
        // Relying on DataType.findType to do the right thing.
        case DataType.MAP: return caster.toBytes((Map<String, Object>) o);

        case DataType.NULL: return null;
        case DataType.TUPLE: return caster.toBytes((Tuple) o);
        case DataType.ERROR: throw new IOException("Unable to determine type of " + o.getClass());
        default: throw new IOException("Unable to find a converter for tuple field " + o);
        }
    }

    @Override
    public String relToAbsPathForStoreLocation(String location, Path curDir)
    throws IOException {
        return location;
    }

    @Override
    public void setStoreFuncUDFContextSignature(String signature) {
        this.contextSignature = signature;
    }

    @Override
    public void setStoreLocation(String location, Job job) throws IOException {
        if (location.startsWith("hbase://")){
            job.getConfiguration().set(TableOutputFormat.OUTPUT_TABLE, location.substring(8));
        }else{
            job.getConfiguration().set(TableOutputFormat.OUTPUT_TABLE, location);
        }

        String serializedSchema = getUDFProperties().getProperty(contextSignature + "_schema");
        if (serializedSchema!= null) {
            schema_ = (ResourceSchema) ObjectSerializer.deserialize(serializedSchema);
        }

        m_conf = initializeLocalJobConfig(job);
        // Not setting a udf property and getting the hbase delegation token
        // only once like in setLocation as setStoreLocation gets different Job
        // objects for each call and the last Job passed is the one that is
        // launched. So we end up getting multiple hbase delegation tokens.
        addHBaseDelegationToken(m_conf, job);
    }

    @Override
    public void cleanupOnFailure(String location, Job job) throws IOException {
    }

    @Override
    public void cleanupOnSuccess(String location, Job job) throws IOException {
    }


    /*
     * LoadPushDown Methods.
     */

    @Override
    public List<OperatorSet> getFeatures() {
        return Arrays.asList(LoadPushDown.OperatorSet.PROJECTION);
    }

    @Override
    public RequiredFieldResponse pushProjection(
            RequiredFieldList requiredFieldList) throws FrontendException {
        List<RequiredField>  requiredFields = requiredFieldList.getFields();
        List<ColumnInfo> newColumns = Lists.newArrayListWithExpectedSize(requiredFields.size());

        if (this.requiredFieldList != null) {
            // in addition to PIG, this is also called by this.setLocation().
            LOG.debug("projection is already set. skipping.");
            return new RequiredFieldResponse(true);
        }

        /* How projection is handled :
         *  - pushProjection() is invoked by PIG on the front end
         *  - pushProjection here both stores serialized projection in the
         *    context and adjusts columnInfo_.
         *  - setLocation() is invoked on the backend and it reads the
         *    projection from context. setLocation invokes this method again
         *    so that columnInfo_ is adjected.
         */

        // colOffset is the offset in our columnList that we need to apply to indexes we get from requiredFields
        // (row key is not a real column)
        int colOffset = loadRowKey_ ? 1 : 0;
        // projOffset is the offset to the requiredFieldList we need to apply when figuring out which columns to prune.
        // (if key is pruned, we should skip row key's element in this list when trimming colList)
        int projOffset = colOffset;
        this.requiredFieldList = requiredFieldList;

        if (requiredFieldList != null && requiredFields.size() > (columnInfo_.size() + colOffset)) {
            throw new FrontendException("The list of columns to project from HBase is larger than HBaseStorage is configured to load.");
        }

        // remember the projection
        storeProjectedFieldNames(requiredFieldList);

        if (loadRowKey_ &&
                ( requiredFields.size() < 1 || requiredFields.get(0).getIndex() != 0)) {
                loadRowKey_ = false;
            projOffset = 0;
        }

        for (int i = projOffset; i < requiredFields.size(); i++) {
            int fieldIndex = requiredFields.get(i).getIndex();
            newColumns.add(columnInfo_.get(fieldIndex - colOffset));
        }

        if (LOG.isDebugEnabled()) {
            LOG.debug("pushProjection After Projection: loadRowKey is " + loadRowKey_) ;
            for (ColumnInfo colInfo : newColumns) {
                LOG.debug("pushProjection -- col: " + colInfo);
            }
        }
        setColumnInfoList(newColumns);
        return new RequiredFieldResponse(true);
    }

    public void ensureAllKeyInstancesInSameSplit() throws IOException {
        /** 
         * no-op because hbase keys are unique 
         * This will also work with things like DelimitedKeyPrefixRegionSplitPolicy
         * if you need a partial key match to be included in the split
         */
        LOG.debug("ensureAllKeyInstancesInSameSplit");
    }

    @Override
    public WritableComparable<TableSplit> getSplitComparable(InputSplit split) throws IOException {
        if (split instanceof TableSplit) {
            return new TableSplitComparable((TableSplit) split);
        } else {
            throw new RuntimeException("LoadFunc expected split of type TableSplit but was " + split.getClass().getName());
        }
    }
 

    /**
     * Class to encapsulate logic around which column names were specified in each
     * position of the column list. Users can specify columns names in one of 4
     * ways: 'Foo:', 'Foo:*', 'Foo:bar*' or 'Foo:bar'. The first 3 result in a
     * Map being added to the tuple, while the last results in a scalar. The 3rd
     * form results in a prefix-filtered Map.
     */
    public class ColumnInfo {

        final String originalColumnName;  // always set
        final byte[] columnFamily; // always set
        final byte[] columnName; // set if it exists and doesn't contain '*'
        final byte[] columnPrefix; // set if contains a prefix followed by '*'

        public ColumnInfo(String colName) {
            originalColumnName = colName;
            String[] cfAndColumn = colName.split(COLON, 2);

            //CFs are byte[1] and columns are byte[2]
            columnFamily = Bytes.toBytes(cfAndColumn[0]);
            if (cfAndColumn.length > 1 &&
                    cfAndColumn[1].length() > 0 && !ASTERISK.equals(cfAndColumn[1])) {
                if (cfAndColumn[1].endsWith(ASTERISK)) {
                    columnPrefix = Bytes.toBytes(cfAndColumn[1].substring(0,
                            cfAndColumn[1].length() - 1));
                    columnName = null;
                }
                else {
                    columnName = Bytes.toBytes(cfAndColumn[1]);
                    columnPrefix = null;
                }
            } else {
              columnPrefix = null;
              columnName = null;
            }
        }

        public byte[] getColumnFamily() { return columnFamily; }
        public byte[] getColumnName() { return columnName; }
        public byte[] getColumnPrefix() { return columnPrefix; }
        public boolean isColumnMap() { return columnName == null; }

        public boolean hasPrefixMatch(byte[] qualifier) {
            return Bytes.startsWith(qualifier, columnPrefix);
        }

        @Override
        public String toString() { return originalColumnName; }
    }

    /**
     * Group the list of ColumnInfo objects by their column family and returns a map of CF to its
     * list of ColumnInfo objects. Using String as key since it implements Comparable.
     * @param columnInfos the columnInfo list to group
     * @return a Map of lists, keyed by their column family.
     */
    static Map<String, List<ColumnInfo>> groupByFamily(List<ColumnInfo> columnInfos) {
        Map<String, List<ColumnInfo>> groupedMap = new HashMap<String, List<ColumnInfo>>();
        for (ColumnInfo columnInfo : columnInfos) {
            String cf = Bytes.toString(columnInfo.getColumnFamily());
            List<ColumnInfo> columnInfoList = groupedMap.get(cf);
            if (columnInfoList == null) {
                columnInfoList = new ArrayList<ColumnInfo>();
            }
            columnInfoList.add(columnInfo);
            groupedMap.put(cf, columnInfoList);
        }
        return groupedMap;
    }

    static String toString(byte[] bytes) {
        if (bytes == null) { return null; }

        StringBuffer sb = new StringBuffer();
        for (int i = 0; i < bytes.length; i++) {
            if (i > 0) { sb.append("|"); }
            sb.append(bytes[i]);
        }
        return sb.toString();
    }

    /**
     * Increments the byte array by one for use with setting stopRow. If all bytes in the array are
     * set to the maximum byte value, then the original array will be returned with a 0 byte appended
     * to it. This is because HBase compares bytes from left to right. If byte array B is equal to
     * byte array A, but with an extra byte appended, A will be < B. For example
     * {@code}A = byte[] {-1}{@code} increments to
     * {@code}B = byte[] {-1, 0}{@code} and {@code}A < B{@code}
     * @param bytes array to increment bytes on
     * @return a copy of the byte array incremented by 1
     */
    static byte[] increment(byte[] bytes) {
        boolean allAtMax = true;
        for(int i = 0; i < bytes.length; i++) {
            if((bytes[bytes.length - i - 1] & 0x0ff) != 255) {
                allAtMax = false;
                break;
            }
        }

        if (allAtMax) {
            return Arrays.copyOf(bytes, bytes.length + 1);
        }

        byte[] incremented = bytes.clone();
        for(int i = bytes.length - 1; i >= 0; i--) {
            boolean carry = false;
            int val = bytes[i] & 0x0ff;
            int total = val + 1;
            if(total > 255) {
                carry = true;
                total %= 256;
            } else if (total < 0) {
                carry = true;
            }
            incremented[i] = (byte)total;
            if (!carry) return incremented;
        }
        return incremented;
    }
}