java source code of MDSHiveLineInputFormat

Project: multiple-dimension-spread (GitHub Link)

multiple-dimension-spread-master
- .github
  - PULL_REQUEST_TEMPLATE.md
- src
  - legacy-maker
    - pom.xml
    - pmd_rulesets.xml
  - arrow
    - src
      - main
        java
        jp
        co
        yahoo
        dataplatform
        mds
        FixedSchemaRootMemoryAllocator.java
        DynamicSchemaRootMemoryAllocator.java
        MDSArrowReader.java
        DynamicArrowLoader.java
        IRootMemoryAllocator.java
        DirectArrowLoader.java
        spread
        column
        ArrowColumnFactory.java
        ArrowStringConnector.java
        ArrowBooleanConnector.java
        ArrowByteConnector.java
        ArrowLongConnector.java
        ArrowIntegerConnector.java
        IArrowPrimitiveConnector.java
        ArrowArrayColumn.java
        ArrowStructColumn.java
        ArrowShortConnector.java
        ArrowFloatConnector.java
        ArrowDoubleConnector.java
        ArrowBytesConnector.java
        ArrowPrimitiveColumn.java
        ArrowSpreadUtil.java
        inmemory
        ArrowShortMemoryAllocator.java
        ArrowUnionMemoryAllocator.java
        ArrowMemoryAllocatorFactory.java
        ArrowStringMemoryAllocator.java
        ArrowIntegerMemoryAllocator.java
        ArrowByteMemoryAllocator.java
        ArrowFixedSchemaArrayMemoryAllocator.java
        ArrowFloatMemoryAllocator.java
        ArrowBooleanMemoryAllocator.java
        ArrowLongMemoryAllocator.java
        ArrowFixedSchemaMemoryAllocatorFactory.java
        ArrowMapMemoryAllocator.java
        ArrowFixedSchemaMapMemoryAllocator.java
        ArrowDoubleMemoryAllocator.java
        ArrowBytesMemoryAllocator.java
        ArrowArrayMemoryAllocator.java
        ArrowFixedSchemaStructMemoryAllocator.java
        IArrowLoader.java
      - test
        resources
        spread
        column
        struct_test_data.json
        array_test_data.json
        java
        jp
        co
        yahoo
        dataplatform
        mds
        spread
        column
        TestArrowByteConnector.java
        TestArrowDoubleConnector.java
        TestArrowFloatConnector.java
        TestArrowArrayConnector.java
        TestArrowStructConnector.java
        TestArrowLongConnector.java
        TestArrowBooleanConnector.java
        TestArrowShortConnector.java
        TestArrowIntegerConnector.java
        inmemory
        TestArrowShortMemoryAllocator.java
        TestArrowIntegerMemoryAllocator.java
        TestArrowStringMemoryAllocator.java
        TestArrowBytesMemoryAllocator.java
        TestArrowByteMemoryAllocator.java
        TestArrowDoubleMemoryAllocator.java
        TestArrowLongMemoryAllocator.java
        TestArrowArrayMemoryAllocator.java
        TestArrowBooleanMemoryAllocator.java
        TestArrowFloatMemoryAllocator.java
    - pom.xml
    - pmd_rulesets.xml
  - hadoop
    - src
      - main
        java
        jp
        co
        yahoo
        dataplatform
        mds
        hadoop
        mapreduce
        MDSCombineSpreadInputFormat.java
        MDSSpreadInputFormat.java
        MDSParserRecordWriter.java
        MDSCombineSpreadReader.java
        MDSParserOutputFormat.java
        MDSSpreadReader.java
    - pom.xml
    - pmd_rulesets.xml
  - pom.xml
  - common
    - src
      - main
        java
        jp
        co
        yahoo
        dataplatform
        mds
        binary
        maker
        UnsafeOptimizeFloatColumnBinaryMaker.java
        DumpArrayColumnBinaryMaker.java
        DumpBytesColumnBinaryMaker.java
        index
        RangeLongIndex.java
        RangeShortIndex.java
        RangeDoubleIndex.java
        RangeIntegerIndex.java
        RangeByteIndex.java
        RangeFloatIndex.java
        RangeStringIndex.java
        SequentialNumberCellIndex.java
        SequentialBooleanCellIndex.java
        BufferDirectSequentialStringCellIndex.java
        SequentialStringCellIndex.java
        BufferDirectSequentialNumberCellIndex.java
        OptimizeStringColumnBinaryMaker.java
        OptimizeFloatColumnBinaryMaker.java
        UnsafeOptimizeLongColumnBinaryMaker.java
        DumpFloatColumnBinaryMaker.java
        RangeDumpDoubleColumnBinaryMaker.java
        OptimizeLongColumnBinaryMaker.java
        IDicManager.java
        UnsafeRangeDumpDoubleColumnBinaryMaker.java
        UnsafeOptimizeDoubleColumnBinaryMaker.java
        DumpUnionColumnBinaryMaker.java
        DumpBooleanColumnBinaryMaker.java
        DumpDoubleColumnBinaryMaker.java
        ConstantColumnBinaryMaker.java
        UnsupportedColumnBinaryMaker.java
        UnsafeOptimizeStringColumnBinaryMaker.java
        RangeDumpFloatColumnBinaryMaker.java
        OptimizeIndexDumpStringColumnBinaryMaker.java
        UnsafeOptimizeDumpLongColumnBinaryMaker.java
        DumpSpreadColumnBinaryMaker.java
        UnsafeRangeDumpFloatColumnBinaryMaker.java
        OptimizeDumpStringColumnBinaryMaker.java
        OptimizeDumpLongColumnBinaryMaker.java
        UnsafeOptimizeDumpStringColumnBinaryMaker.java
        BufferDirectDictionaryLinkCellManager.java
        OptimizeDoubleColumnBinaryMaker.java
        HeaderIndexLazyColumn.java
        IColumnManager.java
        BufferDirectCellManager.java
        IColumnBinaryMaker.java
        LazyColumn.java
        IBytesLink.java
        ColumnBinaryMakerConfig.java
        ColumnBinaryMakerCustomConfigNode.java
        UTF8BytesLinkObj.java
        ColumnBinaryToSchema.java
        optimizer
        NullOptimizer.java
        FindOptimizerFactory.java
        BinaryMakerOptimizer.java
        ByteOptimizer.java
        IOptimizer.java
        LongOptimizer.java
        IntegerOptimizer.java
        IOptimizerFactory.java
        DoubleOptimizer.java
        BinaryMakerOptimizerNode.java
        BooleanOptimizer.java
        FloatOptimizer.java
        ShortOptimizer.java
        StringOptimizer.java
        DefaultOptimizerFactory.java
        ColumnBinaryMakerNameShortCut.java
        FindColumnBinaryMaker.java
        ColumnBinary.java
        InMemoryStorageLoader.java
        blockindex
        DoubleRangeBlockIndex.java
        LongRangeBlockIndex.java
        ByteRangeBlockIndex.java
        RangeBlockIndexNameShortCut.java
        BlockIndexNode.java
        ShortRangeBlockIndex.java
        FloatRangeBlockIndex.java
        UnsupportedBlockIndex.java
        FindBlockIndex.java
        IBlockIndex.java
        IntegerRangeBlockIndex.java
        StringRangeBlockIndex.java
        BlockIndexType.java
        FullRangeBlockIndex.java
        util
        InputStreamUtils.java
        ByteArrayData.java
        NumberUtils.java
        io
        unsafe
        UnsafeUtil.java
        ByteBufferSupporterFactory.java
        UnsafeSupporter.java
        ByteBufferSupporter.java
        IWriteSupporter.java
        IReadSupporter.java
        NumberToBinaryUtils.java
        Pair.java
        CollectionUtils.java
        constants
        ParamaterName.java
        PrimitiveByteLength.java
        compressor
        GzipCompressor.java
        GzipCommonsCompressor.java
        LZMACommonsCompressor.java
        DataType.java
        AbstractCommonsCompressor.java
        ICompressor.java
        BZip2CommonsCompressor.java
        CompressionPolicy.java
        CompressorNameShortCut.java
        FramedSnappyCommonsCompressor.java
        DefaultCompressor.java
        FindCompressor.java
        ZstdCommonsCompressor.java
        DeflateCommonsCompressor.java
        FramedLZ4CommonsCompressor.java
        block
        BlockReadOffset.java
        ReadColumnUtil.java
        IBlockReader.java
        FindBlockMaker.java
        Block.java
        PredicateBlockMaker.java
        BlockSkipPredicateBlockReader.java
        PredicateBlockReader.java
        IBlockMaker.java
        BlockSkipPredicateBlockMaker.java
        ColumnNameNode.java
        ColumnBinaryTree.java
        MDSReader.java
        spread
        expand
        LinkColumn.java
        ExpandSpread.java
        ExpandColumnLink.java
        ExpandNode.java
        ExpandFunction.java
        NotExpandFunction.java
        IExpandFunction.java
        ExpandColumn.java
        ExpandFunctionFactory.java
        Spread.java
        flatten
        FlattenColumn.java
        FlattenFunctionFactory.java
        FlattenFunction.java
        IFlattenFunction.java
        NotFlattenFunction.java
        column
        ICell.java
        PrimitiveColumn.java
        ColumnType.java
        index
        DefaultCellIndex.java
        ICellIndex.java
        ColumnTypeFactory.java
        ArrayColumn.java
        ICellManager.java
        UnionColumn.java
        IColumn.java
        SpreadCell.java
        PrimitiveSchemaFactory.java
        SpreadColumn.java
        SpreadArrayLink.java
        PrimitiveCell.java
        CellManager.java
        NullCell.java
        ColumnFactory.java
        filter
        GeStringCompareFilter.java
        IStringComparator.java
        StringCompareFilterType.java
        RegexpMatchStringFilter.java
        FilterType.java
        BackwardMatchStringFilter.java
        NullFilter.java
        LeStringCompareFilter.java
        INullFilter.java
        BooleanFilter.java
        RangeStringCompareFilter.java
        IStringDictionaryFilter.java
        IStringCompareFilter.java
        IFilter.java
        NumberFilterType.java
        PartialMatchStringFilter.java
        NumberRangeFilter.java
        IStringFilter.java
        LtStringCompareFilter.java
        StringDictionaryFilter.java
        GtStringCompareFilter.java
        NotNullFilter.java
        StringFilterType.java
        PerfectMatchStringFilter.java
        NumberFilter.java
        ForwardMatchStringFilter.java
        SpreadLink.java
        NullColumn.java
        IDictionaryCellManager.java
        ArrayCell.java
        expression
        IndexFactory.java
        IExpressionNode.java
        IExtractNode.java
        AndExpressionNode.java
        StringExtractNode.java
        NotExpressionNode.java
        IExpressionIndex.java
        FilterdExpressionIndex.java
        AllExpressionIndex.java
        ExecuterNode.java
        OrExpressionNode.java
        ListIndexExpressionIndex.java
        analyzer
        SpreadColumnAnalizeResult.java
        SpreadColumnAnalizer.java
        BytesColumnAnalizer.java
        UnionColumnAnalizer.java
        ArrayColumnAnalizer.java
        Analyzer.java
        StringColumnAnalizeResult.java
        ArrayColumnAnalizeResult.java
        IColumnAnalizeResult.java
        IColumnAnalizer.java
        LongColumnAnalizer.java
        BytesColumnAnalizeResult.java
        IntegerColumnAnalizeResult.java
        IntegerColumnAnalizer.java
        UnionColumnAnalizeResult.java
        ByteColumnAnalizer.java
        BooleanColumnAnalizer.java
        DoubleColumnAnalizer.java
        ShortColumnAnalizeResult.java
        ShortColumnAnalizer.java
        FloatColumnAnalizer.java
        ColumnAnalizerFactory.java
        BooleanColumnAnalizeResult.java
        StringColumnAnalizer.java
        LongColumnAnalizeResult.java
        DoubleColumnAnalizeResult.java
        ByteColumnAnalizeResult.java
        FloatColumnAnalizeResult.java
        inmemory
        IMemoryAllocator.java
        NullMemoryAllocator.java
        MDSStatsReader.java
        MDSRecordWriter.java
        stats
        ColumnStats.java
        SpreadSummaryStats.java
        SummaryStats.java
        MDSWriter.java
      - test
        resources
        binary
        TestColumnBinaryMakerCustomConfigNode_2.json
        TestColumnBinaryMakerCustomConfigNode_1.json
        TestColumnBinaryMakerCustomConfigNode_3.json
        spread
        expression
        TestExpression.json
        blackbox
        TestExpandAndFlatten.json
        TestEmptyArray.json
        TestUnionSchema.json
        TestMultiArray.json
        TestParserInput.json
        TestGetPrimitiveObjectArray.json
        java
        jp
        co
        yahoo
        dataplatform
        mds
        binary
        maker
        TestOptimizeIndexDumpStringColumnBinaryMaker.java
        TestDumpFloatColumnBinaryMaker.java
        index
        TestRangeStringIndex.java
        TestRangeByteIndex.java
        TestRangeIntegerIndex.java
        TestRangeDoubleIndex.java
        TestBufferDirectSequentialNumberCellIndexLong.java
        TestRangeLongIndex.java
        TestRangeFloatIndex.java
        TestRangeShortIndex.java
        TestBufferDirectSequentialNumberCellIndex.java
        TestBufferDirectSequentialNumberCellIndexShort.java
        TestSequentialBooleanCellIndex.java
        TestBufferDirectSequentialStringCellIndex.java
        TestBufferDirectSequentialNumberCellIndexByte.java
        TestBufferDirectSequentialNumberCellIndexFloat.java
        TestBufferDirectSequentialNumberCellIndexInteger.java
        TestLazyColumn.java
        TestConstantColumnBinaryMaker.java
        TestDumpArrayColumnBinaryMaker.java
        TestOptimizeStringColumnBinaryMaker.java
        TestOptimizeDumpStringColumnBinaryMaker.java
        TestRangeDumpDoubleColumnBinaryMaker.java
        TestOptimizeLongColumnBinaryMaker.java
        TestUnsafeOptimizeDumpStringColumnBinaryMaker.java
        TestUnsafeOptimizeStringColumnBinaryMaker.java
        TestUnsafeOptimizeDoubleColumnBinaryMaker.java
        TestUnsafeOptimizeFloatColumnBinaryMaker.java
        TestDumpBytesColumnBinaryMaker.java
        TestUnsupportedColumnBinaryMaker.java
        TestUnsafeOptimizeLongColumnBinaryMaker.java
        TestDumpBooleanColumnBinaryMaker.java
        TestOptimizeDumpLongColumnBinaryMaker.java
        TestDumpSpreadColumnBinaryMaker.java
        TestUnsafeOptimizeDumpLongColumnBinaryMaker.java
        TestDumpUnionColumnBinaryMaker.java
        TestDumpDoubleColumnBinaryMaker.java
        TestFindColumnBinaryMaker.java
        TestColumnBinaryMakerConfig.java
        TestColumnBinaryTree.java
        TestColumnBinaryMakerCustomConfigNode.java
        TestColumnBinary.java
        blockindex
        TestBlockIndexNode.java
        TestStringRangeBlockIndex.java
        TestFloatRangeBlockIndex.java
        TestByteRangeBlockIndex.java
        TestLongRangeBlockIndex.java
        TestFindBlockIndex.java
        TestShortRangeBlockIndex.java
        TestUnsupportedBlockIndex.java
        TestDoubleRangeBlockIndex.java
        TestRangeBlockIndexNameShortCut.java
        DummyBlockIndex.java
        TestIntegerRangeBlockIndex.java
        util
        TestCollectionUtils.java
        io
        unsafe
        TestUnsafeSupporter.java
        compressor
        TestCompressor.java
        block
        TestColumnNameNode.java
        TestBlockReadOffset.java
        TestColumnBinaryTree.java
        TestBlock.java
        spread
        expand
        TestNotExpandFunction.java
        TestExpandFunction.java
        TestExpandFunctionFactory.java
        TestSpread.java
        column
        TestNullCell.java
        TestArrayColumn.java
        TestNullColumn.java
        filter
        TestBackwardMatchStringFilter.java
        TestPerfectMatchStringFilter.java
        TestRangeStringCompareFilter.java
        TestPartialMatchStringFilter.java
        TestBooleanFilter.java
        TestRegexpMatchStringFilter.java
        TestNumberFilter.java
        TestNotNullFilter.java
        TestNullFilter.java
        TestForwardMatchStringFilter.java
        expression
        TestExpression.java
        analyzer
        TestFloatColumnAnalizeResult.java
        TestAnalyzer.java
        TestBooleanColumnAnalizeResult.java
        TestLongColumnAnalizeResult.java
        TestDoubleColumnAnalizeResult.java
        TestStringColumnAnalizeResult.java
        TestByteColumnAnalizeResult.java
        TestSpreadColumnAnalizer.java
        TestIntegerColumnAnalizeResult.java
        TestShortColumnAnalizeResult.java
        TestBytesColumnAnalizeResult.java
        blackbox
        TestConstNumberCellIndex.java
        TestBytePrimitiveColumn.java
        TestConstBooleanCellIndex.java
        TestStringBlockIndex.java
        TestIntegerPrimitiveColumn.java
        TestDoublePrimitiveColumn.java
        TestUnionSchema.java
        TestConstStringCellIndex.java
        TestEmptyArray.java
        TestFloatPrimitiveColumn.java
        TestExpandAndFlatten.java
        TestShortPrimitiveColumn.java
        TestPrimitiveSchema.java
        TestNumberCellIndex.java
        TestStringPrimitiveColumn.java
        TestNullCellIndex.java
        TestBooleanPrimitiveColumn.java
        TestGetPrimitiveObjectArray.java
        TestBooleanCellIndex.java
        TestStringCellIndex.java
        TestNumberBlockIndex.java
        TestMultiArray.java
        TestLongPrimitiveColumn.java
        stats
        TestSpreadSummaryStats.java
        TestColumnStats.java
    - pom.xml
    - pmd_rulesets.xml
  - example
    - src
      - main
        resources
        sample_expand_json.txt
        sample_json.txt
        java
        jp
        co
        yahoo
        dataplatform
        mds
        example
        binary
        SimpleIntegerColumnBinaryMaker.java
        io
        MDSSchemaFileReadWrite.java
        MakeMDSFileStep1.java
        spread
        UseSpreadStep3.java
        expand
        UseExpandSpread1.java
        UseSpreadStep4.java
        LoadDataToSpreadStep1.java
        UseSpreadStep1.java
        UseSpreadStep2.java
      - test
        java
        jp
        co
        yahoo
        dataplatform
        mds
        example
        io
        TestMakeMDSFileStep1.java
        spread
        TestUseSpreadStep1.java
        TestUseSpreadStep2.java
        TestUseSpreadStep3.java
        expand
        TestUseExpandSpread1.java
        TestLoadDataToSpreadStep1.java
        TestUseSpreadStep4.java
    - pom.xml
    - pmd_rulesets.xml
  - hive
    - src
      - main
        java
        jp
        co
        yahoo
        dataplatform
        mds
        hadoop
        hive
        MDSListObjectInspector.java
        MDSMapObjectInspector.java
        MDSColumnTypeUtil.java
        MDSStructObjectInspector.java
        pushdown
        CompareHiveExpr.java
        UnsupportHiveExpr.java
        BooleanHiveExpr.java
        BetweenHiveExpr.java
        InHiveExpr.java
        HiveExprNotNode.java
        RegexpHiveExpr.java
        NotEqualsHiveExpr.java
        HiveExprAndNode.java
        NotNullHiveExpr.java
        CreateExtractNodeUtil.java
        HiveExprOrNode.java
        EqualsHiveExpr.java
        IHiveExprNode.java
        NullHiveExpr.java
        HiveExprFactory.java
        MDSObjectInspectorFactory.java
        io
        ColumnAndIndex.java
        PrimitiveToWritableConverter.java
        MDSHiveRecordWriter.java
        HadoopJobReporter.java
        HiveVectorizedReaderSetting.java
        MDSHiveDirectVectorizedReader.java
        MDSHiveLineReader.java
        IReaderSetting.java
        SpreadCounter.java
        HiveReaderSetting.java
        vector
        FloatPrimitiveSetter.java
        ShortPrimitiveSetter.java
        ColumnVectorAssignorFactory.java
        IntegerPrimitiveSetter.java
        DoublePrimitiveSetter.java
        INumberPrimitiveSetter.java
        LongPrimitiveSetter.java
        DoubleColumnVectorAssignor.java
        LongColumnVectorAssignor.java
        BytePrimitiveSetter.java
        IDecimalPrimitiveSetter.java
        BytesColumnVectorAssignor.java
        IColumnVectorAssignor.java
        MDSHiveLineInputFormat.java
        DummyJobReporter.java
        MDSHiveParserOutputFormat.java
        IJobReporter.java
        IVectorizedReaderSetting.java
        ParserWritable.java
        MDSSerde.java
        UnionField.java
      - test
        resources
        io
        out
        dummy.txt
        TestMDSHiveDirectVectorizedReader_plan.xml
        TestMDSHiveRecordWriter.json
        java
        jp
        co
        yahoo
        dataplatform
        mds
        hadoop
        hive
        TestMDSListObjectInspector.java
        TestMDSObjectInspectorFactory.java
        TestMDSSerde.java
        TestMDSStructObjectInspector.java
        pushdown
        TestBooleanHiveExpr.java
        TestInHiveExpr.java
        TestCreateExtractNodeUtil.java
        io
        TestMDSHiveLineReader.java
        TestMDSHiveLineInputFormat.java
        TestHadoopJobReporter.java
        vector
        TestColumnVectorAssignorFactory.java
        TestBytesColumnVectorAssignor.java
        TestShortPrimitiveSetter.java
        TestLongPrimitiveSetter.java
        TestLongColumnVectorAssignor.java
        TestDoubleColumnVectorAssignor.java
        TestBytePrimitiveSetter.java
        TestFloatPrimitiveSetter.java
        TestDoublePrimitiveSetter.java
        TestIntegerPrimitiveSetter.java
        TestMDSHiveParserOutputFormat.java
        TestHiveReaderSetting.java
        TestMDSHiveRecordWriter.java
        TestParserWritable.java
        TestMDSMapObjectInspector.java
        TestUnionField.java
    - pom.xml
    - pmd_rulesets.xml
  - tools
    - src
      - main
        java
        jp
        co
        yahoo
        dataplatform
        mds
        tools
        MergeTool.java
        MDSTool.java
        StoragePerformanceTool.java
        SchemaTool.java
        ColumnMakerPerformanceResult.java
        LineJsonStreamWriter.java
        SchemaUtil.java
        FileUtil.java
        StreamWriterFactory.java
        CpuTimeUtil.java
        WriterTool.java
        StreamReaderFactory.java
        LineJsonStreamReader.java
        ConvertArrowFormatTool.java
        ConvertArrowFormatToMDS.java
        ReaderTool.java
        StatsTool.java
        ColumnStatsTool.java
        StoragePerformanceTarget.java
      - test
        java
        jp
        co
        yahoo
        dataplatform
        mds
        tools
        TestConvertArrowFormatTool.java
    - pom.xml
    - pmd_rulesets.xml
  - schema
    - src
      - main
        java
        jp
        co
        yahoo
        dataplatform
        mds
        schema
        formatter
        MDSSchemaStreamWriter.java
        MDSSchemaFileWriter.java
        parser
        PrimitiveConverter.java
        MDSSchemaReader.java
        MDSSchemaFileReader.java
        MDSSpreadParser.java
        MDSParserFactory.java
        MDSArrayParser.java
        ISettableIndexParser.java
        MDSSchemaSpreadReader.java
        MDSNullParser.java
      - test
        resources
        formatter
        TestMDSSchemaStreamWriter.json
        parser
        TestParserAll.json
        java
        jp
        co
        yahoo
        dataplatform
        mds
        schema
        formatter
        TestMDSSchemaStreamWriter.java
        parser
        TestParserAll.java
        TestMDSSchemaSpreadReader.java
    - pom.xml
    - pmd_rulesets.xml
- .circleci
  - config.yml
- pom.xml
- README.md
- bin
  - mds_deliver
    - pom.xml.template
    - deliver_jar.sh
    - hdfs.sh.template
    - get_jar.sh
    - versions.sh.template
    - README.md
    - .gitignore
  - mds.sh
  - setup.sh
- etc
  - pom.xml.template
  - dependency_pom.xml.template
- .gitignore
- docs
  - getting_started_hive.md
  - images
    - README.md
  - to_use
    - java.md
    - cli.md
  - develop
    - statistics
      - data_size.md
    - arrow
      - overview.md
    - binary
      - column_binary.md
    - overview.md
    - developing_mds.md
- LICENSE.txt

/**
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 * with the License.  You may obtain a copy of the License at
 * <p/>
 * http://www.apache.org/licenses/LICENSE-2.0
 * <p/>
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
package jp.co.yahoo.dataplatform.mds.hadoop.hive.io;

import java.io.IOException;
import java.io.InputStream;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.mapred.InputSplit;
import org.apache.hadoop.mapred.FileSplit;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapred.Reporter;
import org.apache.hadoop.mapred.FileInputFormat;
import org.apache.hadoop.mapred.RecordReader;

import org.apache.hadoop.hive.ql.exec.vector.VectorizedInputFormatInterface;

public class MDSHiveLineInputFormat extends FileInputFormat<NullWritable,ColumnAndIndex> implements VectorizedInputFormatInterface{

  private static final long MIN_SPLIT_BLOCK_SIZE = 1024 * 1024 * 512;
  private static final Logger LOG = LoggerFactory.getLogger( MDSHiveLineInputFormat.class );
  private final SpreadCounter spreadCounter = new SpreadCounter();

/*
  public MDSHiveLineInputFormat(){
    super();
  }
*/

  @Override
  public InputSplit[] getSplits( final JobConf job , final int numSplits ) throws IOException{
    super.setMinSplitSize( MIN_SPLIT_BLOCK_SIZE );
    return super.getSplits( job , numSplits );
  }

  @Override
  public RecordReader<NullWritable,ColumnAndIndex> getRecordReader( final InputSplit split, final JobConf job, final Reporter reporter ) throws IOException {
    FileSplit fileSplit = (FileSplit)split;
    Path path = fileSplit.getPath();
    FileSystem fs = path.getFileSystem( job );
    long fileLength = fs.getLength( path );
    long start = fileSplit.getStart();
    long length = fileSplit.getLength();
    InputStream in = fs.open( path );
    IJobReporter jobReporter = new HadoopJobReporter( reporter );
    jobReporter.setStatus( String.format( "Read file : %s" , path.toString() ) );
    HiveReaderSetting hiveConfig = new HiveReaderSetting( fileSplit , job );
    if ( hiveConfig.isVectorMode() ){
      IVectorizedReaderSetting vectorizedSetting = new HiveVectorizedReaderSetting( fileSplit , job , hiveConfig );
      return (RecordReader)new MDSHiveDirectVectorizedReader( in , fileLength , start , length , vectorizedSetting , jobReporter );
    }
    else{
      return new MDSHiveLineReader( in , fileLength , start , length , hiveConfig , jobReporter , spreadCounter );
    }
  }

}