java source code of MRInput

tez-master
- NOTICE.txt
- tez-build-tools
  - src
    - main
      - resources
        checkstyle
        checkstyle.xml
        suppressions.xml
  - pom.xml
- tez-mapreduce
  - src
    - main
      - proto
        MRRuntimeProtos.proto
      - resources
        META-INF
        NOTICE.txt
        services
        org.apache.hadoop.mapreduce.protocol.ClientProtocolProvider
        LICENSE.txt
      - javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        hadoop
        mapred
        split
        TezGroupedSplit.java
        TezMapredSplitsGrouper.java
        SplitLocationProvider.java
        SplitSizeEstimator.java
        TezGroupedSplitsInputFormat.java
        mapreduce
        split
        TezMapReduceSplitsGrouper.java
        SplitMetaInfoReaderTez.java
        TezGroupedSplit.java
        SplitLocationProvider.java
        SplitLocationProviderMapReduce.java
        SplitSizeEstimator.java
        TezGroupedSplitsInputFormat.java
        tez
        dag
        api
        client
        MRDAGClient.java
        client
        MRTezClient.java
        common
        MRFrameworkConfigs.java
        mapreduce
        committer
        MROutputCommitter.java
        processor
        MRTaskReporter.java
        MRTask.java
        reduce
        ReduceProcessor.java
        map
        MapProcessor.java
        SimpleMRProcessor.java
        hadoop
        MRHelpers.java
        MRJobConfig.java
        MRInputHelpers.java
        TezTypeConverters.java
        MRConfig.java
        IDConverter.java
        mapred
        MRCounters.java
        JobContextImpl.java
        MRReporter.java
        package-info.java
        TaskAttemptContextImpl.java
        InputSplitInfoDisk.java
        MultiStageMRConfToTezTranslator.java
        package-info.java
        MultiStageMRConfigUtil.java
        InputSplitInfo.java
        DeprecatedKeys.java
        mapreduce
        JobContextImpl.java
        MapContextImpl.java
        TezNullOutputCommitter.java
        package-info.java
        TaskInputOutputContextImpl.java
        TaskAttemptContextImpl.java
        InputSplitInfoMem.java
        client
        ClientServiceDelegate.java
        YARNRunner.java
        ResourceMgrDelegate.java
        package-info.java
        YarnTezClientProtocolProvider.java
        ClientCache.java
        NotRunningJob.java
        DAGJobStatus.java
        partition
        MRPartitioner.java
        combine
        MRCombiner.java
        output
        MultiMROutput.java
        MROutputLegacy.java
        MROutput.java
        common
        Utils.java
        MRInputAMSplitGenerator.java
        MRInputSplitDistributor.java
        lib
        MRInputUtils.java
        MRReaderMapred.java
        package-info.java
        MRReader.java
        MRReaderMapReduce.java
        input
        base
        MRInputBase.java
        MRInputLegacy.java
        MRInput.java
        MultiMRInput.java
        grouper
        SplitLocationProviderWrapper.java
        SplitLocationProviderWrapperMapred.java
        SplitSizeEstimatorWrapperMapReduce.java
        GroupedSplitContainer.java
        MapReduceSplitContainer.java
        SplitSizeEstimatorWrapperMapred.java
        MapredSplitContainer.java
        TezSplitGrouper.java
        SplitSizeEstimatorWrapper.java
        SplitContainer.java
    - test
      - resources
        log4j.properties
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        hadoop
        mapred
        split
        TestGroupedSplits.java
        tez
        mapreduce
        processor
        reduce
        TestReduceProcessor.java
        map
        TestMapProcessor.java
        MapUtils.java
        hadoop
        TestMRHelpers.java
        TestDeprecatedKeys.java
        TestMRInputHelpers.java
        TestConfigTranslationMRToTez.java
        combine
        TestMRCombiner.java
        TezTestUtils.java
        output
        TestMROutput.java
        TestMROutputLegacy.java
        TestMROutputConfigBuilder.java
        TestMultiMROutput.java
        common
        TestMRInputAMSplitGenerator.java
        TestMRInputSplitDistributor.java
        lib
        TestKVReadersWithMR.java
        TestUmbilical.java
        input
        TestMultiMRInput.java
        MultiMRInputForTest.java
        MRInputForTest.java
        TestMRInput.java
  - pom.xml
  - findbugs-exclude.xml
- hadoop-shim
  - src
    - main
      - java
        org
        apache
        tez
        hadoop
        shim
        HadoopShimsLoader.java
        DefaultHadoopShim.java
        HadoopShim.java
        HadoopShimProvider.java
    - test
      - resources
        log4j.properties
      - java
        org
        apache
        tez
        hadoop
        shim
        TestHadoopShimsLoader.java
        DummyShimProvider.java
  - pom.xml
  - findbugs-exclude.xml
- tez-tests
  - src
    - main
      - resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        mapreduce
        examples
        MRRSleepJob.java
        processor
        FilterByWordOutputProcessor.java
        FilterByWordInputProcessor.java
        BroadcastAndOneToOneExample.java
        TestOrderedWordCount.java
        helpers
        SplitsInClientOptionParser.java
        FilterLinesByWordOneToOne.java
        SecondarySort.java
        Sort.java
        UnionExample.java
        RandomTextWriter.java
        Join.java
        CartesianProduct.java
        RPCLoadGen.java
        MultipleCommitsExample.java
        RandomWriter.java
        MapredWordCount.java
        BroadcastLoadGen.java
        FilterLinesByWord.java
        ExampleDriver.java
    - test
      - resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        test
        FaultToleranceTestRunner.java
        TestLocalMode.java
        TestDAGRecovery2.java
        AMShutdownController.java
        TestSecureShuffle.java
        TestTaskErrorsUsingLocalMode.java
        RecoveryServiceWithEventHandlingHook.java
        dag
        ThreeLevelsFailingDAG.java
        SixLevelsFailingDAG.java
        TwoLevelsFailingDAG.java
        SimpleReverseVTestDAG.java
        SimpleVTestDAG.java
        MultiAttemptDAG.java
        TestPipelinedShuffle.java
        TestDAGRecovery.java
        TestMiniTezCluster.java
        SimpleTestDAG.java
        TestDriver.java
        TestTezJobs.java
        TestFaultTolerance.java
        TestInput.java
        TestProcessor.java
        TestOutput.java
        TestExceptionPropagation.java
        TestRecovery.java
        TestAMRecovery.java
        SimpleTestDAG3Vertices.java
        MiniTezCluster.java
        mapreduce
        TestMRRJobsDAGApi.java
        TestMRRJobs.java
  - pom.xml
  - findbugs-exclude.xml
- tez-examples
  - src
    - main
      - resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        examples
        SimpleSessionExample.java
        WordCount.java
        JoinValidate.java
        SortMergeJoinExample.java
        TezExampleBase.java
        JoinDataGen.java
        HashJoinExample.java
        OrderedWordCount.java
        CartesianProduct.java
        ExampleDriver.java
    - test
      - resources
        META-INF
        NOTICE.txt
        LICENSE.txt
  - pom.xml
  - findbugs-exclude.xml
- tez-runtime-internals
  - src
    - main
      - proto
        RuntimeEvents.proto
      - resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        common
        ProtoConverters.java
        TezLocalResource.java
        TezConverterUtils.java
        TezTaskUmbilicalProtocol.java
        ContainerTask.java
        ContainerContext.java
        runtime
        internals
        api
        TaskReporterInterface.java
        task
        EndReason.java
        ContainerReporter.java
        TezTaskRunner2.java
        ErrorReporter.java
        TezChild.java
        TaskRunner2Callable.java
        TaskReporter.java
        TaskRunner2Result.java
        RuntimeTask.java
        InputReadyTracker.java
        api
        impl
        TezHeartbeatResponse.java
        TezMergedInputContextImpl.java
        TezHeartbeatRequest.java
        EventType.java
        TezCountersDelegate.java
        TezProcessorContextImpl.java
        TezEvent.java
        EventMetaData.java
        TaskStatistics.java
        GroupInputSpec.java
        TaskSpec.java
        TezOutputContextImpl.java
        IOStatistics.java
        TezUmbilical.java
        TezInputContextImpl.java
        InputSpec.java
        OutputSpec.java
        ExecutionContextImpl.java
        TezTaskContextImpl.java
        events
        TaskAttemptCompletedEvent.java
        TaskAttemptFailedEvent.java
        TaskAttemptKilledEvent.java
        TaskStatusUpdateEvent.java
        common
        security
        JobTokenSelector.java
        resources
        MemoryDistributor.java
        ScalingAllocator.java
        objectregistry
        ObjectRegistryImpl.java
        LogicalIOProcessorRuntimeTask.java
        metrics
        FileSystemStatisticUpdater.java
        TaskCounterUpdater.java
    - test
      - resources
        log4j.properties
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        runtime
        task
        TaskExecutionTestHelpers.java
        TestContainerExecution.java
        TestTaskReporter.java
        TestTezTaskRunner2.java
        TestTaskExecution2.java
        api
        impl
        TestTezEvent.java
        TestTaskSpec.java
        TestProcessorContext.java
        common
        resources
        TestMemoryDistributor.java
        objectregistry
        TestObjectRegistry.java
        TestLogicalIOProcessorRuntimeTask.java
        TestInputReadyTracker.java
  - pom.xml
  - findbugs-exclude.xml
- tez-dag
  - src
    - main
      - proto
        HistoryEvents.proto
      - resources
        tez-container-log4j.properties
        tez-dag-version-info.properties
        META-INF
        NOTICE.txt
        LICENSE.txt
      - javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        dag
        utils
        ProtoUtils.java
        TaskSpecificLaunchCmdOption.java
        TezBuilderUtils.java
        Graph.java
        Simple2LevelVersionComparator.java
        TezRuntimeChildJVM.java
        api
        client
        VertexStatusBuilder.java
        ProgressBuilder.java
        DAGClientHandler.java
        rpc
        DAGClientAMProtocolBlockingPBServerImpl.java
        DAGClientServer.java
        DAGStatusBuilder.java
        oldrecords
        TaskAttemptState.java
        AMInfo.java
        TaskReport.java
        TaskState.java
        TaskAttemptReport.java
        history
        utils
        DAGUtils.java
        TezEventUtils.java
        HistoryEvent.java
        DAGHistoryEvent.java
        HistoryEventType.java
        SummaryEvent.java
        RecoveryConverters.java
        recovery
        RecoveryService.java
        HistoryEventHandler.java
        logging
        impl
        HistoryEventJsonConversion.java
        SimpleHistoryLoggingService.java
        DevNullHistoryLoggingService.java
        HistoryLoggingService.java
        events
        DAGCommitStartedEvent.java
        VertexStartedEvent.java
        AMLaunchedEvent.java
        ContainerStoppedEvent.java
        TaskStartedEvent.java
        VertexGroupCommitFinishedEvent.java
        VertexGroupCommitStartedEvent.java
        ContainerLaunchedEvent.java
        VertexConfigurationDoneEvent.java
        VertexCommitStartedEvent.java
        DAGRecoveredEvent.java
        VertexInitializedEvent.java
        VertexFinishedEvent.java
        TaskFinishedEvent.java
        AppLaunchedEvent.java
        DAGFinishedEvent.java
        TaskAttemptStartedEvent.java
        DAGSubmittedEvent.java
        DAGStartedEvent.java
        DAGKillRequestEvent.java
        TaskAttemptFinishedEvent.java
        DAGInitializedEvent.java
        AMStartedEvent.java
        app
        security
        authorize
        TezAMPolicyProvider.java
        package-info.java
        RecoveryParser.java
        TaskAttemptEventInfo.java
        DAGAppMaster.java
        dag
        impl
        TaskImpl.java
        AMUserCodeException.java
        TezRootInputInitializerContextImpl.java
        OneToOneEdgeManager.java
        DAGSchedulerNaturalOrder.java
        OneToOneEdgeManagerOnDemand.java
        DAGImpl.java
        BroadcastEdgeManager.java
        Edge.java
        TaskReportImpl.java
        RootInputVertexManager.java
        ImmediateStartVertexManager.java
        OutputCommitterContextImpl.java
        ScatterGatherEdgeManager.java
        package-info.java
        VertexManager.java
        ServicePluginInfo.java
        TaskAttemptImplHelpers.java
        TaskAttemptImpl.java
        VertexStats.java
        VertexImpl.java
        DAGSchedulerNaturalOrderControlled.java
        StateChangeNotifier.java
        Task.java
        DAGState.java
        VertexTerminationCause.java
        VertexStateUpdateListener.java
        speculation
        legacy
        TaskRuntimeEstimator.java
        DataStatistics.java
        LegacyTaskRuntimeEstimator.java
        LegacySpeculator.java
        forecast
        SimpleExponentialSmoothing.java
        package-info.java
        StartEndTimesBase.java
        SimpleExponentialTaskRuntimeEstimator.java
        DAGTerminationCause.java
        Vertex.java
        RootInputInitializerManager.java
        TaskStateInternal.java
        package-info.java
        DAGReport.java
        event
        VertexEventTaskAttemptCompleted.java
        VertexEventSourceVertexStarted.java
        CallableEvent.java
        TaskAttemptEventContainerTerminating.java
        DAGAppMasterEvent.java
        VertexEventRootInputFailed.java
        TaskAttemptEvent.java
        TaskEvent.java
        DAGEvent.java
        DAGAppMasterEventDagCleanup.java
        DAGAppMasterEventDAGFinished.java
        DAGAppMasterEventType.java
        DAGEventCommitCompleted.java
        TaskAttemptEventSubmitted.java
        SpeculatorEventType.java
        TaskAttemptEventStartedRemotely.java
        DAGEventSchedulerUpdate.java
        TaskAttemptEventNodeFailed.java
        DAGEventRecoverEvent.java
        DiagnosableEvent.java
        DAGAppMasterEventUserServiceFatalError.java
        TaskAttemptEventSchedule.java
        DAGEventInternalError.java
        VertexEventRecoverVertex.java
        VertexEventSourceTaskAttemptCompleted.java
        TaskAttemptEventContainerTerminated.java
        TaskEventScheduleTask.java
        TaskAttemptEventContainerTerminatedBySystem.java
        VertexEventInputDataInformation.java
        TaskEventType.java
        DAGEventVertexReRunning.java
        TaskEventTAKilled.java
        DAGEventStartDag.java
        TaskEventTASucceeded.java
        DAGEventCounterUpdate.java
        TaskAttemptEventType.java
        VertexEventRouteEvent.java
        DAGEventType.java
        DAGEventTerminateDag.java
        DAGEventVertexCompleted.java
        package-info.java
        CallableEventType.java
        VertexEventRootInputInitialized.java
        RecoveryEvent.java
        VertexEventTermination.java
        TaskAttemptEventAttemptKilled.java
        SpeculatorEvent.java
        VertexEvent.java
        DAGEventDiagnosticsUpdate.java
        TaskAttemptEventOutputFailed.java
        DAGAppMasterEventSchedulingServiceError.java
        TaskAttemptEventKillRequest.java
        TaskAttemptEventTezEventUpdate.java
        TaskEventTAFailed.java
        TaskAttemptEventTerminationCauseEvent.java
        VertexEventTaskReschedule.java
        TaskAttemptEventStatusUpdate.java
        VertexEventManagerUserCodeError.java
        TaskEventTALaunched.java
        VertexEventType.java
        TaskEventTermination.java
        VertexEventCommitCompleted.java
        VertexEventNullEdgeInitialized.java
        VertexEventTaskCompleted.java
        SpeculatorEventTaskAttemptStatusUpdate.java
        TaskAttemptEventAttemptFailed.java
        TaskEventTAUpdate.java
        DAG.java
        TaskTerminationCause.java
        DAGScheduler.java
        TaskStateUpdateListener.java
        TaskAttemptStateInternal.java
        VertexState.java
        TaskAttempt.java
        TaskCommunicatorContextImpl.java
        ServicePluginLifecycleAbstractService.java
        TezTaskCommunicatorImpl.java
        web
        WebUIService.java
        AMWebController.java
        TezLocalTaskCommunicatorImpl.java
        TaskCommunicatorWrapper.java
        AppContext.java
        ClusterInfo.java
        HeartbeatHandlerBase.java
        TaskCommunicatorManagerInterface.java
        TezDagVersionInfo.java
        package-info.java
        rm
        ContainerAllocator.java
        AMSchedulerEventTAStateUpdated.java
        ContainerLauncherEventType.java
        AMSchedulerEventTALaunchRequest.java
        AMSchedulerEventTAEnded.java
        TezAMRMClientAsync.java
        TaskSchedulerContextImplWrapper.java
        TaskSchedulerManager.java
        node
        AMNodeImpl.java
        AMNodeEventNodeCountUpdated.java
        AMNodeEventContainerCompleted.java
        AMNodeEventTaskAttemptEnded.java
        AMNodeEventTaskAttemptSucceeded.java
        AMNodeTracker.java
        AMNodeEventType.java
        AMNode.java
        AMNodeEventContainerAllocated.java
        PerSourceNodeTracker.java
        AMNodeState.java
        AMNodeEventStateChanged.java
        AMNodeEvent.java
        ExtendedNodeId.java
        AMSchedulerEventType.java
        DagAwareYarnTaskScheduler.java
        ContainerLauncherEvent.java
        ContainerLauncherLaunchRequestEvent.java
        package-info.java
        AMSchedulerEventDeallocateContainer.java
        ContainerLauncherStopRequestEvent.java
        LocalTaskSchedulerService.java
        AMSchedulerEvent.java
        container
        AMContainerMap.java
        AMContainerEventAssignTA.java
        AMContainerImpl.java
        AMContainerEventCompleted.java
        AMContainerEventLaunched.java
        AMContainerEventLaunchRequest.java
        ContainerContextMatcher.java
        AMContainer.java
        AMContainerEvent.java
        AMContainerEventNodeFailed.java
        AMContainerEventStopFailed.java
        AMContainerTask.java
        AMContainerHelpers.java
        AMContainerState.java
        AMContainerEventType.java
        AMContainerEventTASucceeded.java
        AMContainerEventStopRequest.java
        AMContainerEventLaunchFailed.java
        AMSchedulerEventNodeBlacklistUpdate.java
        TaskSchedulerWrapper.java
        YarnTaskSchedulerService.java
        TaskSchedulerContextImpl.java
        YarnTaskSchedulerServiceError.java
        ContainerLauncherContextImpl.java
        TaskCommunicatorManager.java
        DAGAppMasterState.java
        TaskHeartbeatHandler.java
        ContainerContext.java
        ContainerHeartbeatHandler.java
        launcher
        DagDeleteRunnable.java
        TezLocalCacheManager.java
        TezContainerLauncherImpl.java
        ContainerOp.java
        package-info.java
        ContainerLauncherManager.java
        DeletionTracker.java
        DeletionTrackerImpl.java
        ContainerLauncherWrapper.java
        LocalContainerLauncher.java
        serviceplugins
        api
        TaskCommunicator.java
        TaskHeartbeatRequest.java
        TaskHeartbeatResponse.java
        TaskCommunicatorContext.java
        state
        StateMachineTez.java
        OnStateChangedCallback.java
        Utils.java
        client
        LocalClient.java
    - test
      - resources
        log4j.properties
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        dag
        utils
        TestSimple2LevelVersionComparator.java
        TestTaskSpecificLaunchCmdOption.java
        helpers
        DagInfoImplForTest.java
        api
        client
        TestDAGClientHandler.java
        rpc
        TestDAGClientAMProtocolBlockingPBServerImpl.java
        TestVertexStatusBuilder.java
        TestDAGClientServer.java
        history
        utils
        TestDAGUtils.java
        TestHistoryEventType.java
        recovery
        TestRecoveryService.java
        TestHistoryEventHandler.java
        logging
        impl
        TestHistoryEventJsonConversion.java
        events
        TestHistoryEventsProtoConversion.java
        app
        MockTezClient.java
        dag
        impl
        TestDAGScheduler.java
        TestImmediateStartVertexManager.java
        TestEdge.java
        TestCommit.java
        TestDAGRecovery.java
        TestRootInputVertexManager.java
        TestVertexStats.java
        TestVertexImpl2.java
        TestTaskImpl.java
        TestDAGImpl.java
        TestTaskAttempt.java
        CallableEventDispatcher.java
        TestVertexManager.java
        TestDAGSchedulerNaturalOrderControlled.java
        speculation
        legacy
        TestDataStatistics.java
        app
        TestTezTaskCommunicatorManager.java
        TestStateChangeNotifier.java
        TestRootInputInitializerManager.java
        PluginWrapperTestHelpers.java
        TestMockDAGAppMaster.java
        web
        TestAMWebController.java
        TestTaskCommunicatorManager.java
        TestTaskCommunicatorWrapper.java
        TestRecoveryParser.java
        MockLocalClient.java
        TestSpeculation.java
        TestMemoryWithEvents.java
        TestTaskCommunicatorManager2.java
        TestTaskCommunicatorContextImpl.java
        TestTaskCommunicatorManager1.java
        MockClock.java
        rm
        TestTaskSchedulerWrapper.java
        TestDagAwareYarnTaskScheduler.java
        node
        TestAMNodeTracker.java
        TestTaskSchedulerHelpers.java
        TestTezAMRMClient.java
        container
        TestAMContainerMap.java
        TestAMContainer.java
        TestContainerReuse.java
        TestLocalTaskScheduler.java
        TestTaskScheduler.java
        TestLocalTaskSchedulerService.java
        TestTaskSchedulerManager.java
        TestDAGAppMaster.java
        TestPreemption.java
        MockDAGAppMaster.java
        launcher
        TestContainerLauncherManager.java
        TestContainerLauncherWrapper.java
        TestDeletionTracker.java
        TestTezLocalCacheManager.java
        test
        ControlledScheduledExecutorService.java
        GraceShuffleVertexManagerForTest.java
        EdgeManagerForTest.java
        VertexManagerPluginForTest.java
  - pom.xml
  - findbugs-exclude.xml
- tez-plugins
  - tez-history-parser
    - src
      - main
        java
        org
        apache
        tez
        history
        ATSImportTool.java
        parser
        utils
        Utils.java
        ATSData.java
        SimpleHistoryParser.java
        datamodel
        TaskInfo.java
        Event.java
        BaseInfo.java
        EdgeInfo.java
        Constants.java
        VertexInfo.java
        BaseParser.java
        AdditionalInputOutputDetails.java
        VersionInfo.java
        TaskAttemptInfo.java
        DagInfo.java
        Container.java
        ProtoHistoryParser.java
        ATSFileParser.java
      - test
        java
        org
        apache
        tez
        history
        TestHistoryParser.java
    - pom.xml
    - findbugs-exclude.xml
  - pom.xml
  - tez-yarn-timeline-history-with-acls
    - src
      - main
        java
        org
        apache
        tez
        dag
        history
        ats
        acls
        ATSHistoryACLPolicyManager.java
      - test
        java
        org
        apache
        tez
        dag
        history
        ats
        acls
        TestATSHistoryWithACLs.java
    - pom.xml
    - findbugs-exclude.xml
  - tez-aux-services
    - src
      - main
        java
        org
        apache
        tez
        auxservices
        FadvisedChunkedFile.java
        IndexCache.java
        FadvisedFileRegion.java
        ShuffleHandler.java
      - test
        java
        org
        apache
        tez
        auxservices
        TestShuffleHandler.java
        TestIndexCache.java
        TestShuffleHandlerJobs.java
    - pom.xml
    - findbugs-exclude.xml
  - tez-yarn-timeline-cache-plugin
    - src
      - main
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
        javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
        java
        org
        apache
        tez
        dag
        history
        logging
        ats
        TimelineCachePluginImpl.java
      - test
        java
        org
        apache
        tez
        dag
        history
        logging
        ats
        TestTimelineCachePluginImpl.java
    - pom.xml
    - findbugs-exclude.xml
  - tez-yarn-timeline-history
    - src
      - main
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
        javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
        java
        org
        apache
        tez
        dag
        history
        logging
        ats
        HistoryEventTimelineConversion.java
        ATSHistoryLoggingService.java
      - test
        resources
        log4j.properties
        META-INF
        NOTICE.txt
        LICENSE.txt
        java
        org
        apache
        tez
        dag
        history
        logging
        ats
        TestATSHistoryLoggingService.java
        TestATSHistoryWithMiniCluster.java
        TestHistoryEventTimelineConversion.java
        tests
        MiniTezClusterWithTimeline.java
    - pom.xml
    - findbugs-exclude.xml
  - tez-yarn-timeline-history-with-fs
    - src
      - main
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
        javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
        java
        org
        apache
        tez
        dag
        history
        ats
        acls
        ATSV15HistoryACLPolicyManager.java
        logging
        ats
        ATSV15HistoryLoggingService.java
      - test
        java
        org
        apache
        tez
        dag
        history
        ats
        acls
        TestATSHistoryV15.java
        logging
        ats
        TestATSV15HistoryLoggingService.java
    - pom.xml
    - findbugs-exclude.xml
  - tez-protobuf-history-plugin
    - src
      - main
        proto
        HistoryLogger.proto
        java
        org
        apache
        tez
        dag
        history
        logging
        proto
        ProtoMessageReader.java
        ProtoMessageWriter.java
        HistoryEventProtoJsonConversion.java
        ProtoMessageWritable.java
        DagManifesFileScanner.java
        TezProtoLoggers.java
        HistoryEventProtoConverter.java
        ProtoHistoryLoggingService.java
        DatePartitionedLogger.java
      - test
        java
        org
        apache
        tez
        dag
        history
        logging
        proto
        TestProtoHistoryLoggingService.java
        TestDagManifestFileScanner.java
        TestHistoryEventProtoConverter.java
    - pom.xml
    - findbugs-exclude.xml
- tez-tools
  - tez-tfile-parser
    - src
      - main
        java
        org
        apache
        tez
        tools
        TFileLoader.java
        TFileRecordReader.java
    - pom.xml
    - README.txt
  - analyzers
    - job-analyzer
      - src
        main
        java
        org
        apache
        tez
        analyzer
        utils
        SVGUtils.java
        Utils.java
        Analyzer.java
        Result.java
        plugins
        SkewAnalyzer.java
        ShuffleTimeAnalyzer.java
        SlowestVertexAnalyzer.java
        SlowTaskIdentifier.java
        CriticalPathAnalyzer.java
        SlowNodeAnalyzer.java
        LocalityAnalyzer.java
        SpillAnalyzerImpl.java
        TaskAssignmentAnalyzer.java
        VertexLevelCriticalPathAnalyzer.java
        TaskAttemptResultStatisticsAnalyzer.java
        TezAnalyzerBase.java
        ContainerReuseAnalyzer.java
        AnalyzerDriver.java
        TaskConcurrencyAnalyzer.java
        OneOnOneEdgeAnalyzer.java
        CSVResult.java
        test
        java
        org
        apache
        tez
        analyzer
        TestAnalyzer.java
      - pom.xml
      - findbugs-exclude.xml
    - pom.xml
  - pom.xml
  - tez-javadoc-tools
    - src
      - main
        java
        org
        apache
        tez
        tools
        javadoc
        util
        XmlWriter.java
        Writer.java
        HtmlWriter.java
        doclet
        ConfigStandardDoclet.java
        model
        Config.java
        ConfigProperty.java
    - pom.xml
    - findbugs-exclude.xml
  - tez-log-split
    - logsplit.py
    - README.md
    - tez-log-splitter.sh
  - counter-diff
    - counter-diff.py
    - README.md
  - swimlanes
    - amlogparser.py
    - swimlane.py
    - README.md
    - yarn-swimlanes.sh
- hadoop-shim-impls
  - hadoop-shim-2.7
    - src
      - main
        resources
        META-INF
        services
        org.apache.tez.hadoop.shim.HadoopShimProvider
        java
        org
        apache
        tez
        hadoop
        shim
        HadoopShim27.java
        HadoopShim25_26_27Provider.java
      - test
        java
        org
        apache
        tez
        hadoop
        shim
        TestHadoop25_26_27ShimProvider.java
    - pom.xml
    - findbugs-exclude.xml
  - pom.xml
  - hadoop-shim-2.8
    - src
      - main
        resources
        META-INF
        services
        org.apache.tez.hadoop.shim.HadoopShimProvider
        java
        org
        apache
        tez
        hadoop
        shim
        HadoopShim28Provider.java
        HadoopShim28.java
      - test
        java
        org
        apache
        tez
        hadoop
        shim
        TestHadoopShim28Provider.java
        TestHadoopShim28.java
    - pom.xml
    - findbugs-exclude.xml
  - findbugs-exclude.xml
- pom.xml
- tez-api
  - src
    - main
      - proto
        Events.proto
        DAGClientAMProtocol.proto
        DAGApiRecords.proto
      - resources
        tez-api-version-info.properties
        META-INF
        NOTICE.txt
        services
        org.apache.hadoop.security.SecurityInfo
        LICENSE.txt
      - javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        dag
        api
        TezReflectionException.java
        TezConfiguration.java
        VertexManagerPlugin.java
        HistoryLogLevel.java
        VertexManagerPluginContext.java
        InputDescriptor.java
        SessionNotReady.java
        client
        TimelineReaderFactory.java
        DAGClient.java
        DAGStatus.java
        VertexStatus.java
        DAGClientInternal.java
        StatusGetOpts.java
        DAGClientTimelineImpl.java
        rpc
        DAGClientAMProtocolBlockingPB.java
        package-info.java
        DAGClientRPCImpl.java
        DagStatusSource.java
        DAGClientImpl.java
        Progress.java
        TezConfigurationConstants.java
        DagTypeConverters.java
        Edge.java
        DataSinkDescriptor.java
        VertexGroup.java
        Vertex.java
        TezException.java
        InputInitializerDescriptor.java
        EdgeManagerPluginDescriptor.java
        NamedEntityDescriptor.java
        GroupInputEdge.java
        EdgeProperty.java
        Scope.java
        ConfigurationScope.java
        EdgeManagerPlugin.java
        VertexLocationHint.java
        OutputCommitterDescriptor.java
        DAGSubmissionTimedOut.java
        event
        VertexStateUpdateParallelismUpdated.java
        VertexStateUpdate.java
        VertexState.java
        EntityDescriptor.java
        TezConstants.java
        EdgeManagerPluginOnDemand.java
        DAG.java
        UserPayload.java
        DataSourceDescriptor.java
        ProcessorDescriptor.java
        TaskLocationHint.java
        OutputDescriptor.java
        PreWarmVertex.java
        EdgeManagerPluginContext.java
        TezUncheckedException.java
        DAGNotRunningException.java
        VertexManagerPluginDescriptor.java
        SessionNotRunning.java
        RootInputLeafOutput.java
        serviceplugins
        api
        ContainerEndReason.java
        TaskSchedulerContext.java
        TaskAttemptEndReason.java
        ContainerLauncherDescriptor.java
        TaskScheduler.java
        ContainerLauncherOperationBase.java
        ServicePluginContextBase.java
        TaskSchedulerDescriptor.java
        ContainerLauncherContext.java
        ContainerStopRequest.java
        ServicePluginErrorDefaults.java
        ContainerLauncher.java
        ServicePluginError.java
        TaskCommunicatorDescriptor.java
        ContainerLaunchRequest.java
        ServicePluginException.java
        DagInfo.java
        ServicePluginsDescriptor.java
        client
        AMConfiguration.java
        TezApiVersionInfo.java
        FrameworkClient.java
        TezYarnClient.java
        CallerContext.java
        TezAppMasterStatus.java
        TezClient.java
        TezClientUtils.java
        common
        security
        Master.java
        DAGAccessControls.java
        JobTokenIdentifier.java
        TokenCache.java
        HistoryACLPolicyException.java
        ACLConfigurationParser.java
        DAGClientSecurityInfo.java
        ACLManager.java
        JobTokenSecretManager.java
        ACLType.java
        HistoryACLPolicyManager.java
        TezYARNUtils.java
        Preconditions.java
        ATSConstants.java
        TezClassLoader.java
        JavaOptsChecker.java
        counters
        AggregateFrameworkCounter.java
        TezCounter.java
        AggregateTezCounter.java
        GenericCounter.java
        CounterGroupFactory.java
        AbstractCounters.java
        AggregateTezCounters.java
        CounterGroupBase.java
        CounterGroup.java
        FileSystemCounter.java
        JobCounter.java
        AbstractCounterGroup.java
        AbstractCounter.java
        AggregateTezCounterDelegate.java
        Limits.java
        FileSystemCounterGroup.java
        DAGCounter.java
        LimitExceededException.java
        FrameworkCounterGroup.java
        TezCounters.java
        TaskCounter.java
        ServicePluginLifecycle.java
        TezCommonUtils.java
        ReflectionUtils.java
        TezUtils.java
        VersionInfo.java
        annotation
        ConfigurationClass.java
        ConfigurationProperty.java
        GuavaShim.java
        ProgressHelper.java
        ContainerSignatureMatcher.java
        RPCUtil.java
        runtime
        api
        Reader.java
        LogicalIOProcessor.java
        MergedInputContext.java
        TaskFailureType.java
        LogicalInput.java
        VertexIdentifier.java
        Event.java
        Input.java
        ObjectRegistry.java
        OutputContext.java
        ProcessorContext.java
        Writer.java
        TaskIdentifier.java
        InputInitializer.java
        InputContext.java
        OutputStatistics.java
        LogicalIOProcessorFrameworkInterface.java
        OutputCommitter.java
        OutputStatisticsReporter.java
        ProcessorFrameworkInterface.java
        LogicalOutputFrameworkInterface.java
        AbstractLogicalIOProcessor.java
        InputSpecUpdate.java
        LogicalInputFrameworkInterface.java
        Processor.java
        Output.java
        AbstractLogicalInput.java
        InputInitializerContext.java
        DagIdentifier.java
        InputStatisticsReporter.java
        ExecutionContext.java
        OutputFrameworkInterface.java
        TaskAttemptIdentifier.java
        InputFrameworkInterface.java
        VertexStatistics.java
        InputStatistics.java
        AbstractLogicalOutput.java
        MemoryUpdateCallback.java
        MergedLogicalInput.java
        LogicalOutput.java
        ProgressFailedException.java
        OutputCommitterContext.java
        TaskContext.java
        events
        InputUpdatePayloadEvent.java
        InputConfigureVertexTasksEvent.java
        VertexManagerEvent.java
        CompositeDataMovementEvent.java
        InputFailedEvent.java
        InputInitializerEvent.java
        DataMovementEvent.java
        CustomProcessorEvent.java
        InputDataInformationEvent.java
        CompositeRoutedDataMovementEvent.java
        InputReadErrorEvent.java
    - test
      - resources
        tez-site.xml
        log4j.properties
        test3-version-info.properties
        META-INF
        NOTICE.txt
        LICENSE.txt
        test1-version-info.properties
        test2-version-info.properties
      - java
        org
        apache
        tez
        dag
        api
        TestDagTypeConverters.java
        TestEntityDescriptor.java
        client
        TestATSHttpClient.java
        rpc
        TestDAGClient.java
        TestTimelineReaderFactory.java
        TestDAG.java
        TestHistoryLogLevel.java
        TestTaskLocationHint.java
        TestDAGVerify.java
        TestDAGPlan.java
        TestTezConfiguration.java
        client
        TestTezClientUtils.java
        TestTezClient.java
        common
        security
        TestACLManager.java
        TestACLConfigurationParser.java
        TestTokenCache.java
        TestDAGAccessControls.java
        TestTezCommonUtils.java
        TestTezYARNUtils.java
        TestJavaOptsChecker.java
        TestVersionInfo.java
        TestRPCUtil.java
        TestReflectionUtils.java
        runtime
        api
        event
        TestCompositeDataMovementEvent.java
  - pom.xml
  - findbugs-exclude.xml
- BUILDING.txt
- build-tools
  - test-patch.sh
  - docker
    - Dockerfile
    - tez_env_checks.sh
  - install-protobuf.sh
  - smart-apply-patch.sh
- tez-common
  - src
    - main
      - resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        dag
        utils
        package-info.java
        RelocalizationUtils.java
        history
        logging
        EntityTypes.java
        records
        TezTaskID.java
        TaskIdentifierImpl.java
        TaskAttemptIdentifierImpl.java
        DagIdentifierImpl.java
        TezDAGID.java
        TezTaskAttemptID.java
        TezVertexID.java
        package-info.java
        TaskAttemptTerminationCause.java
        VertexIdentifierImpl.java
        TezID.java
        common
        TezAbstractEvent.java
        TezExecutors.java
        Preconditions.java
        AsyncDispatcher.java
        DagContainerLauncher.java
        AsyncDispatcherConcurrent.java
        TezUtilsInternal.java
        TezContainerLogAppender.java
        package-info.java
        CallableWithNdc.java
        io
        NonSyncDataOutputStream.java
        NonSyncByteArrayOutputStream.java
        NonSyncByteArrayInputStream.java
        EnvironmentUpdateUtils.java
        GcTimeUpdater.java
        RunnableWithNdc.java
        TezLog4jConfigurator.java
        TezSharedExecutor.java
        util
        TezMxBeanResourceCalculator.java
        StopWatch.java
        FastNumberFormat.java
        runtime
        common
        resources
        InitialMemoryRequestContext.java
        package-info.java
        InitialMemoryAllocator.java
    - test
      - resources
        log4j.properties
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        dag
        records
        TestTezIds.java
        common
        DrainDispatcher.java
        MockDNSToSwitchMapping.java
        TestTezSharedExecutor.java
        TestAsyncDispatcherConcurrent.java
        TestAsyncDispatcher.java
        TestTezUtils.java
        TestEnvironmentUpdateUtils.java
        util
        TestStopWatch.java
        TestNumberFormat.java
        TestTezMxBeanResourceCalculator.java
  - pom.xml
  - findbugs-exclude.xml
- tez-ui
  - src
    - main
      - resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - webapp
        .ember-cli
        bower.json
        bower-shrinkwrap.json
        public
        assets
        images
        yarn.lock
        ember-cli-build.js
        testem.json
        .editorconfig
        .jshintrc
        config
        environment.js
        default-app-conf.js
        build-info.js
        configs.env
        blueprints
        entity
        files
        app
        entities
        __name__.js
        index.js
        entity-test
        files
        tests
        unit
        entities
        __name__-test.js
        index.js
        .jshintrc
        .bowerrc
        WEB-INF
        wro.xml
        web.xml
        README.md
        package.json
        tests
        integration
        components
        home-table-controls-test.js
        em-table-tasks-log-link-cell-test.js
        em-swimlane-process-name-test.js
        pagination-ui-test.js
        em-swimlane-consolidated-process-test.js
        em-swimlane-test.js
        error-bar-test.js
        em-tooltip-test.js
        date-formatter-test.js
        em-swimlane-process-line-test.js
        em-swimlane-ruler-test.js
        query-timeline-test.js
        tab-n-refresh-test.js
        dags-page-search-test.js
        em-table-status-cell-test.js
        queries-page-search-test.js
        zip-download-modal-test.js
        em-swimlane-event-bar-test.js
        stats-link-test.js
        table-controls-test.js
        em-swimlane-event-test.js
        em-swimlane-blocking-event-test.js
        em-swimlane-vertex-name-test.js
        column-selector-test.js
        em-swimlane-process-visual-test.js
        caller-info-test.js
        helpers
        resolver.js
        start-app.js
        destroy-app.js
        module-for-acceptance.js
        test-helper.js
        .jshintrc
        index.html
        unit
        utils
        process-test.js
        virtual-anchor-test.js
        processor-test.js
        process-definition-test.js
        counter-column-definition-test.js
        download-dag-zip-test.js
        misc-test.js
        vertex-process-test.js
        services
        loader-test.js
        env-test.js
        pollster-test.js
        local-storage-test.js
        hosts-test.js
        initializers
        loader-test.js
        env-test.js
        local-storage-test.js
        jquery-test.js
        entities-test.js
        hosts-test.js
        models
        abstract-test.js
        ahs-app-test.js
        vertex-test.js
        dag-test.js
        attempt-test.js
        dag-am-test.js
        dag-info-test.js
        vertex-am-test.js
        am-test.js
        task-am-test.js
        app-rm-test.js
        hive-query-test.js
        timed-test.js
        app-test.js
        task-test.js
        timeline-test.js
        attempt-am-test.js
        am-timeline-test.js
        rm-test.js
        controllers
        abstract-test.js
        home
        queries-test.js
        index-test.js
        vertex-test.js
        dag-test.js
        dag
        index
        index-test.js
        vertices-test.js
        tasks-test.js
        counters-test.js
        attempts-test.js
        index-test.js
        swimlane-test.js
        graphical-test.js
        attempt-test.js
        task
        counters-test.js
        attempts-test.js
        index-test.js
        counters-table-test.js
        home-test.js
        attempt
        counters-test.js
        index-test.js
        query-test.js
        multi-table-test.js
        query
        index-test.js
        configs-test.js
        timeline-test.js
        app-test.js
        task-test.js
        parent-test.js
        page-test.js
        app
        dags-test.js
        index-test.js
        configs-test.js
        table-test.js
        vertex
        tasks-test.js
        counters-test.js
        attempts-test.js
        index-test.js
        configs-test.js
        application-test.js
        entities
        dag-test.js
        vertex-am-test.js
        am-test.js
        task-am-test.js
        entity-test.js
        attempt-am-test.js
        serializers
        loader-test.js
        ahs-app-test.js
        vertex-test.js
        dag-test.js
        attempt-test.js
        dag-am-test.js
        dag-info-test.js
        vertex-am-test.js
        am-test.js
        task-am-test.js
        app-rm-test.js
        hive-query-test.js
        app-test.js
        task-test.js
        timeline-test.js
        attempt-am-test.js
        rm-test.js
        routes
        abstract-test.js
        multi-am-pollster-test.js
        home
        queries-test.js
        index-test.js
        vertex-test.js
        dag-test.js
        dag
        index
        index-test.js
        vertices-test.js
        tasks-test.js
        counters-test.js
        attempts-test.js
        index-test.js
        swimlane-test.js
        graphical-test.js
        attempt-test.js
        task
        counters-test.js
        attempts-test.js
        index-test.js
        home-test.js
        attempt
        counters-test.js
        index-test.js
        am-pollster-test.js
        query-test.js
        query
        index-test.js
        configs-test.js
        timeline-test.js
        pollster-test.js
        app-test.js
        task-test.js
        app
        dags-test.js
        index-test.js
        configs-test.js
        single-am-pollster-test.js
        vertex
        tasks-test.js
        counters-test.js
        attempts-test.js
        index-test.js
        configs-test.js
        application-test.js
        server-side-ops-test.js
        mixins
        name-test.js
        auto-counter-column-test.js
        adapters
        abstract-test.js
        loader-test.js
        ahs-app-test.js
        vertex-test.js
        dag-test.js
        attempt-test.js
        dag-am-test.js
        dag-info-test.js
        vertex-am-test.js
        am-test.js
        task-am-test.js
        app-rm-test.js
        hive-query-test.js
        app-test.js
        task-test.js
        timeline-test.js
        attempt-am-test.js
        rm-test.js
        transforms
        object-test.js
        app
        utils
        vertex-process.js
        counter-column-definition.js
        misc.js
        virtual-anchor.js
        process.js
        processor.js
        download-dag-zip.js
        process-definition.js
        services
        env.js
        local-storage.js
        loader.js
        pollster.js
        hosts.js
        initializers
        jquery.js
        env.js
        local-storage.js
        loader.js
        hosts.js
        entities.js
        models
        task-am.js
        am-timeline.js
        abstract.js
        dag-info.js
        app-rm.js
        app.js
        hive-query.js
        vertex.js
        dag-am.js
        dag.js
        attempt.js
        rm.js
        am.js
        vertex-am.js
        timed.js
        task.js
        ahs-app.js
        timeline.js
        attempt-am.js
        templates
        home
        index.hbs
        queries.hbs
        dag
        index.hbs
        vertices.hbs
        tasks.hbs
        index
        index.hbs
        counters.hbs
        graphical.hbs
        attempts.hbs
        swimlane.hbs
        query.hbs
        application.hbs
        task
        index.hbs
        counters.hbs
        attempts.hbs
        attempt
        index.hbs
        counters.hbs
        components
        em-table-status-cell.hbs
        table-controls.hbs
        em-swimlane-event.hbs
        em-swimlane-process-visual.hbs
        query-timeline.hbs
        column-selector.hbs
        em-swimlane-ruler.hbs
        queries-page-search.hbs
        em-swimlane-vertex-name.hbs
        em-tooltip.hbs
        error-bar.hbs
        em-table-tasks-log-link-cell.hbs
        em-swimlane-event-bar.hbs
        zip-download-modal.hbs
        em-swimlane-consolidated-process.hbs
        em-swimlane.hbs
        dags-page-search.hbs
        em-swimlane-process-name.hbs
        tab-n-refresh.hbs
        date-formatter.hbs
        caller-info.hbs
        em-swimlane-blocking-event.hbs
        pagination-ui.hbs
        home-table-controls.hbs
        stats-link.hbs
        em-swimlane-process-line.hbs
        query
        index.hbs
        configs.hbs
        timeline.hbs
        home.hbs
        vertex.hbs
        attempt.hbs
        task.hbs
        app
        index.hbs
        configs.hbs
        dags.hbs
        app.hbs
        vertex
        index.hbs
        tasks.hbs
        counters.hbs
        configs.hbs
        attempts.hbs
        dag.hbs
        loading.hbs
        simple-modal.hbs
        components
        table-controls.js
        zip-download-modal.js
        em-swimlane-ruler.js
        stats-link.js
        em-swimlane.js
        em-swimlane-consolidated-process.js
        caller-info.js
        em-tooltip.js
        em-table-status-cell.js
        pagination-ui.js
        dags-page-search.js
        column-selector.js
        em-swimlane-event-bar.js
        em-swimlane-process-name.js
        home-table-controls.js
        em-table-tasks-log-link-cell.js
        tab-n-refresh.js
        em-swimlane-vertex-name.js
        em-swimlane-process-line.js
        em-swimlane-event.js
        em-swimlane-blocking-event.js
        date-formatter.js
        em-swimlane-process-visual.js
        query-timeline.js
        queries-page-search.js
        error-bar.js
        app.js
        controllers
        home
        queries.js
        index.js
        query.js
        dag
        index
        index.js
        attempts.js
        vertices.js
        graphical.js
        tasks.js
        counters.js
        index.js
        swimlane.js
        page.js
        task
        attempts.js
        counters.js
        index.js
        counters-table.js
        home.js
        attempt
        counters.js
        index.js
        abstract.js
        app.js
        table.js
        query
        configs.js
        timeline.js
        index.js
        multi-table.js
        vertex.js
        parent.js
        application.js
        dag.js
        attempt.js
        task.js
        app
        dags.js
        configs.js
        index.js
        vertex
        attempts.js
        configs.js
        tasks.js
        counters.js
        index.js
        router.js
        styles
        caller-info.less
        details-page.less
        dags-page-search.less
        app.less
        shared.less
        em-swimlane.less
        page-layout.less
        query-timeline.less
        table-controls.less
        vertex-configs-page.less
        queries-page-search.less
        em-table-status-cell.less
        swimlane-page.less
        zip-download-modal.less
        column-selector.less
        em-tooltip.less
        colors.less
        date-formatter.less
        em-swimlane-vertex-name.less
        tab-n-refresh.less
        tooltip.less
        home-table-controls.less
        error-bar.less
        index.html
        entities
        task-am.js
        dag.js
        am.js
        vertex-am.js
        entity.js
        attempt-am.js
        errors
        unlinked-promise.js
        serializers
        task-am.js
        dag-info.js
        app-rm.js
        app.js
        hive-query.js
        vertex.js
        dag-am.js
        loader.js
        dag.js
        attempt.js
        rm.js
        am.js
        vertex-am.js
        task.js
        ahs-app.js
        timeline.js
        attempt-am.js
        routes
        home
        queries.js
        index.js
        query.js
        dag
        index
        index.js
        attempts.js
        vertices.js
        graphical.js
        tasks.js
        counters.js
        index.js
        swimlane.js
        task
        attempts.js
        counters.js
        index.js
        home.js
        attempt
        counters.js
        index.js
        abstract.js
        multi-am-pollster.js
        app.js
        query
        configs.js
        timeline.js
        index.js
        vertex.js
        application.js
        dag.js
        attempt.js
        single-am-pollster.js
        am-pollster.js
        server-side-ops.js
        pollster.js
        task.js
        app
        dags.js
        configs.js
        index.js
        vertex
        attempts.js
        configs.js
        tasks.js
        counters.js
        index.js
        mixins
        name.js
        auto-counter-column.js
        adapters
        task-am.js
        abstract.js
        dag-info.js
        app-rm.js
        app.js
        hive-query.js
        vertex.js
        dag-am.js
        loader.js
        dag.js
        attempt.js
        rm.js
        am.js
        vertex-am.js
        task.js
        ahs-app.js
        timeline.js
        attempt-am.js
        transforms
        object.js
        .watchmanconfig
        .gitignore
  - pom.xml
  - README.md
  - findbugs-exclude.xml
- Tez_DOAP.rdf
- tez-ext-service-tests
  - src
    - test
      - proto
        TezDaemonProtocol.proto
      - resources
        log4j.properties
      - java
        org
        apache
        tez
        dag
        app
        TezTestServiceCommunicator.java
        taskcomm
        TezTestServiceTaskCommunicatorImpl.java
        TezTestServiceTaskCommunicatorWithErrors.java
        rm
        TezTestServiceTaskSchedulerServiceWithErrors.java
        TezTestServiceTaskSchedulerService.java
        ErrorPluginConfiguration.java
        launcher
        TezTestServiceContainerLauncherWithErrors.java
        TezTestServiceContainerLauncher.java
        TezTestServiceNoOpContainerLauncher.java
        shufflehandler
        IndexCache.java
        ShuffleHandler.java
        examples
        JoinValidateConfigured.java
        util
        ProtoConverters.java
        service
        impl
        TezTestServiceProtocolServerImpl.java
        TezTestServiceProtocolClientImpl.java
        TezTestService.java
        ContainerRunnerImpl.java
        TezTestServiceConfConstants.java
        MiniTezTestServiceCluster.java
        ContainerRunner.java
        TezTestServiceProtocolBlockingPB.java
        tests
        TestExtServicesWithLocalMode.java
        TestExternalTezServices.java
        ExternalTezServiceTestHelper.java
        TestExternalTezServicesErrors.java
  - pom.xml
  - findbugs-exclude.xml
- .travis.yml
- README.md
- KEYS
- tez-runtime-library
  - src
    - main
      - proto
        FairShufflePayloads.proto
        ShufflePayloads.proto
        CartesianProductPayload.proto
      - resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        hadoop
        io
        FileChunk.java
        tez
        dag
        library
        vertexmanager
        VertexManagerWithConcurrentInput.java
        FairShuffleEdgeManager.java
        DestinationTaskInputsProperty.java
        FairShuffleVertexManager.java
        ShuffleVertexManager.java
        FairEdgeConfiguration.java
        ShuffleVertexManagerBase.java
        InputReadyVertexManager.java
        edgemanager
        SilentEdgeManager.java
        common
        TezRuntimeFrameworkConfigs.java
        runtime
        library
        utils
        LocalProgress.java
        BufferUtils.java
        DATA_RANGE_IN_MB.java
        FastByteComparisons.java
        Grouper.java
        resources
        WeightedScalingMemoryDistributor.java
        processor
        SleepProcessor.java
        PreWarmProcessor.java
        SimpleProcessor.java
        hadoop
        compat
        NullProgressable.java
        output
        package-info.java
        UnorderedKVOutput.java
        OrderedPartitionedKVOutput.java
        UnorderedPartitionedKVOutput.java
        api
        KeyValueWriter.java
        TezRuntimeConfiguration.java
        KeyValuesReader.java
        KeyValueWriterWithBasePath.java
        IOInterruptedException.java
        KeyValuesWriter.java
        KeyValueReader.java
        Partitioner.java
        common
        security
        SecureShuffleUtils.java
        task
        local
        output
        TezTaskOutput.java
        package-info.java
        TezTaskOutputFiles.java
        ConfigUtils.java
        ValuesIterator.java
        TezRuntimeUtils.java
        combine
        Combiner.java
        InputAttemptIdentifier.java
        sort
        impl
        TezSpillRecord.java
        TezRawKeyValueIterator.java
        dflt
        package-info.java
        DefaultSorter.java
        PipelinedSorter.java
        IFileOutputStream.java
        ExternalSorter.java
        package-info.java
        TezIndexRecord.java
        IFile.java
        TezMerger.java
        IFileInputStream.java
        InputIdentifier.java
        Constants.java
        comparator
        ProxyComparator.java
        TezBytesComparator.java
        writers
        BaseUnorderedPartitionedKVWriter.java
        package-info.java
        UnorderedPartitionedKVWriter.java
        CompositeInputAttemptIdentifier.java
        readers
        UnorderedKVReader.java
        MemoryUpdateCallbackHandler.java
        shuffle
        impl
        SimpleFetchedInputAllocator.java
        ShuffleManager.java
        package-info.java
        ShuffleInputEventHandlerImpl.java
        InputHost.java
        FetchedInputAllocator.java
        DiskFetchedInput.java
        FetcherCallback.java
        FetchResult.java
        ShuffleEventHandler.java
        orderedgrouped
        Shuffle.java
        InMemoryReader.java
        MapHost.java
        ShuffleScheduler.java
        ShuffleHeader.java
        InMemoryWriter.java
        package-info.java
        ShuffleInputEventHandlerOrderedGrouped.java
        FetchedInputAllocatorOrderedGrouped.java
        FetcherOrderedGrouped.java
        ExceptionReporter.java
        MergeManager.java
        MergeThread.java
        MapOutput.java
        ShuffleUtils.java
        HostPort.java
        Fetcher.java
        MemoryFetchedInput.java
        FetchedInput.java
        package-info.java
        LocalDiskFetchedInput.java
        FetchedInputCallback.java
        serializer
        TezBytesWritableSerialization.java
        cartesianproduct
        CartesianProductEdgeManagerReal.java
        CartesianProductFilter.java
        CartesianProductVertexManagerReal.java
        CartesianProductEdgeManagerPartitioned.java
        CartesianProductEdgeManager.java
        CartesianProductCombination.java
        FairCartesianProductEdgeManager.java
        FairCartesianProductVertexManager.java
        CartesianProductVertexManager.java
        CartesianProductConfig.java
        CartesianProductVertexManagerPartitioned.java
        CartesianProductFilterDescriptor.java
        partitioner
        RoundRobinPartitioner.java
        HashPartitioner.java
        exceptions
        FetcherReadTimeoutException.java
        InputAlreadyClosedException.java
        input
        ConcatenatedMergedKeyValuesInput.java
        OrderedGroupedKVInput.java
        package-info.java
        OrderedGroupedInputLegacy.java
        OrderedGroupedMergedKVInput.java
        ConcatenatedMergedKeyValueInput.java
        UnorderedKVInput.java
        conf
        UnorderedKVEdgeConfig.java
        UnorderedPartitionedKVEdgeConfig.java
        UnorderedPartitionedKVOutputConfig.java
        Utils.java
        UnorderedKVOutputConfig.java
        OrderedGroupedKVInputConfig.java
        package-info.java
        OrderedPartitionedKVOutputConfig.java
        BaseConfigBuilder.java
        OrderedPartitionedKVEdgeConfig.java
        HadoopKeyValuesBasedBaseEdgeConfig.java
        UnorderedKVInputConfig.java
        http
        BaseHttpConnection.java
        HttpConnectionParams.java
        SSLFactory.java
        HttpConnection.java
        async
        netty
        TezBodyDeferringAsyncHandler.java
        AsyncHttpConnection.java
    - test
      - resources
        tez-site.xml
        log4j.properties
        TestIFile_concatenated_compressed.bin
        META-INF
        NOTICE.txt
        LICENSE.txt
      - java
        org
        apache
        tez
        dag
        library
        vertexmanager
        TestShuffleVertexManagerUtils.java
        TestVertexManagerWithConcurrentInput.java
        TestInputReadyVertexManager.java
        TestShuffleVertexManagerBase.java
        TestFairShuffleVertexManager.java
        TestShuffleVertexManager.java
        runtime
        library
        testutils
        RandomTextGenerator.java
        KVDataGen.java
        output
        OutputTestHelpers.java
        TestOnFileUnorderedKVOutput.java
        TestUnorderedPartitionedKVOutput2.java
        TestOnFileSortedOutput.java
        TestOrderedPartitionedKVOutput2.java
        TestUnorderedKVOutput2.java
        api
        TestTezRuntimeConfiguration.java
        common
        TestValuesIterator.java
        sort
        impl
        dflt
        TestDefaultSorter.java
        TestTezMerger.java
        TestIFile.java
        TestPipelinedSorter.java
        comparator
        TestProxyComparator.java
        writers
        TestUnorderedPartitionedKVWriter.java
        readers
        TestUnorderedKVReader.java
        shuffle
        impl
        TestSimpleFetchedInputAllocator.java
        TestShuffleManager.java
        TestShuffleInputEventHandlerImpl.java
        TestShuffleUtils.java
        orderedgrouped
        TestShuffleScheduler.java
        TestMergeManager.java
        TestShuffleInputEventHandlerOrderedGrouped.java
        TestFetcher.java
        TestShuffle.java
        TestFetcher.java
        TestInputIdentifiers.java
        cartesianproduct
        TestGrouper.java
        TestFairCartesianProductEdgeManager.java
        TestFairCartesianProductVertexManager.java
        TestCartesianProductCombination.java
        TestCartesianProductVertexManager.java
        TestCartesianProductConfig.java
        TestCartesianProductEdgeManagerPartitioned.java
        TestCartesianProductVertexManagerPartitioned.java
        TestCartesianProductEdgeManager.java
        input
        TestOrderedGroupedKVInput.java
        TestSortedGroupedMergedInput.java
        conf
        TestOrderedPartitionedKVOutputConfig.java
        TestUnorderedPartitionedKVEdgeConfig.java
        TestUnorderedPartitionedKVOutputConfig.java
        TestUnorderedKVEdgeConfig.java
        TestOrderedGroupedMergedKVInputConfig.java
        TestOrderedPartitionedKVEdgeConfig.java
        TestUnorderedKVOutputConfig.java
        TestUnorderedKVInputConfig.java
        common
        resources
        TestWeightedScalingMemoryDistributor.java
        http
        TestHttpConnection.java
  - pom.xml
  - findbugs-exclude.xml
- .gitignore
- docs
  - src
    - site
      - resources
        images
        pmc
        tez.rdf
      - markdown
        shuffle-handler.md
        tez-ui.md
        tez_yarn_timeline.md
        install.md
        index.md
        user_guides.md
        by-laws.md
        localmode.md
        releases
        apache-tez-0-6-2.md
        apache-tez-0-8-0-alpha.md
        apache-tez-0-6-0.md
        apache-tez-0-8-1-alpha.md
        index.md
        apache-tez-0-8-4.md
        apache-tez-0-5-4.md
        apache-tez-0-8-2.md
        apache-tez-0-7-1.md
        apache-tez-0-5-2.md
        apache-tez-0-7-0.md
        apache-tez-0-8-5.md
        apache-tez-0-6-1.md
        apache-tez-0-5-0.md
        apache-tez-0-9-2.md
        apache-tez-0-9-0.md
        apache-tez-0-8-3.md
        apache-tez-0-5-1.md
        apache-tez-0-9-1.md
        apache-tez-0-5-3.md
        tez_acls.md
        tez_ui_user_data.md
        install_pre_0_5_0.md
        talks.md
        privacy-policy.md
      - site.xml
      - custom
        project-info-report.properties
  - pom.xml
- INSTALL.md
- LICENSE.txt
- tez-dist
  - src
    - main
      - javadoc
        resources
        META-INF
        NOTICE.txt
        LICENSE.txt
      - assembly
        tez-dist-minimal.xml
        tez-dist.xml
  - pom.xml
  - dist-files
    - minimal
      - LICENSE-CDDLv1.1-GPLv2_withCPE
      - LICENSE
      - LICENSE-SIL_OpenFontLicense-v1.1
      - LICENSE-BSD-3clause
      - NOTICE
      - LICENSE-MIT
    - full
      - LICENSE-CDDLv1.1-GPLv2_withCPE
      - LICENSE
      - LICENSE-SIL_OpenFontLicense-v1.1
      - LICENSE-BSD-3clause
      - NOTICE
      - LICENSE-MIT
      - LICENSE-CDDLv1.0

/**
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 * with the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
package org.apache.tez.mapreduce.input;

import javax.annotation.Nullable;

import java.io.IOException;
import java.net.URI;
import java.util.Collection;
import java.util.List;
import java.util.concurrent.locks.Condition;
import java.util.concurrent.locks.ReentrantLock;

import com.google.protobuf.ByteString;

import org.apache.tez.runtime.api.ProgressFailedException;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.apache.hadoop.classification.InterfaceAudience.Private;
import org.apache.hadoop.classification.InterfaceAudience.Public;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.mapred.InputFormat;
import org.apache.hadoop.mapreduce.InputSplit;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.split.JobSplit.TaskSplitIndex;
import org.apache.hadoop.mapreduce.split.JobSplit.TaskSplitMetaInfo;
import org.apache.hadoop.security.Credentials;
import org.apache.tez.common.TezUtils;
import org.apache.tez.common.counters.TaskCounter;
import org.apache.tez.dag.api.DataSourceDescriptor;
import org.apache.tez.dag.api.InputDescriptor;
import org.apache.tez.dag.api.InputInitializerDescriptor;
import org.apache.tez.dag.api.TezUncheckedException;
import org.apache.tez.dag.api.UserPayload;
import org.apache.tez.dag.api.VertexLocationHint;
import org.apache.tez.mapreduce.common.MRInputAMSplitGenerator;
import org.apache.tez.mapreduce.common.MRInputSplitDistributor;
import org.apache.tez.mapreduce.hadoop.InputSplitInfo;
import org.apache.tez.mapreduce.hadoop.MRHelpers;
import org.apache.tez.mapreduce.hadoop.MRInputHelpers;
import org.apache.tez.mapreduce.hadoop.MRJobConfig;
import org.apache.tez.mapreduce.input.base.MRInputBase;
import org.apache.tez.mapreduce.lib.MRInputUtils;
import org.apache.tez.mapreduce.lib.MRReader;
import org.apache.tez.mapreduce.lib.MRReaderMapReduce;
import org.apache.tez.mapreduce.lib.MRReaderMapred;
import org.apache.tez.mapreduce.protos.MRRuntimeProtos;
import org.apache.tez.mapreduce.protos.MRRuntimeProtos.MRSplitProto;
import org.apache.tez.runtime.api.Event;
import org.apache.tez.runtime.api.Input;
import org.apache.tez.runtime.api.InputContext;
import org.apache.tez.runtime.api.events.InputDataInformationEvent;
import org.apache.tez.runtime.library.api.KeyValueReader;
import org.apache.tez.runtime.library.api.TezRuntimeConfiguration;

import org.apache.tez.common.Preconditions;
import com.google.common.collect.Lists;

/**
 * {@link MRInput} is an {@link Input} which provides key/values pairs
 * for the consumer.
 *
 * It is compatible with all standard Apache Hadoop MapReduce 
 * {@link InputFormat} implementations.
 * 
 * This class is not meant to be extended by external projects.
 */
@Public
public class MRInput extends MRInputBase {

  @Private public static final String TEZ_MAPREDUCE_DAG_INDEX = "tez.mapreduce.dag.index";
  @Private public static final String TEZ_MAPREDUCE_DAG_NAME = "tez.mapreduce.dag.name";
  @Private public static final String TEZ_MAPREDUCE_VERTEX_INDEX = "tez.mapreduce.vertex.index";
  @Private public static final String TEZ_MAPREDUCE_VERTEX_NAME = "tez.mapreduce.vertex.name";
  @Private public static final String TEZ_MAPREDUCE_TASK_INDEX = "tez.mapreduce.task.index";
  @Private public static final String TEZ_MAPREDUCE_TASK_ATTEMPT_INDEX = "tez.mapreduce.task.attempt.index";
  @Private public static final String TEZ_MAPREDUCE_INPUT_INDEX = "tez.mapreduce.input.index";
  @Private public static final String TEZ_MAPREDUCE_INPUT_NAME = "tez.mapreduce.input.name";
  @Private public static final String TEZ_MAPREDUCE_APPLICATION_ID = "tez.mapreduce.application.id";
  @Private public static final String TEZ_MAPREDUCE_UNIQUE_IDENTIFIER = "tez.mapreduce.unique.identifier";
  @Private public static final String TEZ_MAPREDUCE_DAG_ATTEMPT_NUMBER = "tez.mapreduce.dag.attempt.number";
  @Private public static final String TEZ_MAPREDUCE_DAG_ID= "tez.mapreduce.dag.id";
  @Private public static final String TEZ_MAPREDUCE_VERTEX_ID = "tez.mapreduce.vertex.id";
  @Private public static final String TEZ_MAPREDUCE_TASK_ID = "tez.mapreduce.task.id";
  @Private public static final String TEZ_MAPREDUCE_TASK_ATTEMPT_ID = "tez.mapreduce.task.attempt.id";



  /**
   * Helper class to configure {@link MRInput}
   *
   */
  public static class MRInputConfigBuilder {
    final Configuration conf;
    final Class<?> inputFormat;
    final boolean inputFormatProvided;
    boolean useNewApi;
    boolean groupSplitsInAM = true;
    boolean sortSplitsInAM = true;
    boolean generateSplitsInAM = true;
    String inputClassName = MRInput.class.getName();
    boolean getCredentialsForSourceFilesystem = true;
    String inputPaths = null;
    InputInitializerDescriptor customInitializerDescriptor = null;

    MRInputConfigBuilder(Configuration conf, Class<?> inputFormatParam) {
      this.conf = conf;
      if (inputFormatParam != null) {
        inputFormatProvided = true;
        this.inputFormat = inputFormatParam;
        if (org.apache.hadoop.mapred.InputFormat.class.isAssignableFrom(inputFormatParam)) {
          useNewApi = false;
        } else if (org.apache.hadoop.mapreduce.InputFormat.class.isAssignableFrom(inputFormatParam)) {
          useNewApi = true;
        } else {
          throw new TezUncheckedException("inputFormat must be assignable from either " +
              "org.apache.hadoop.mapred.InputFormat or " +
              "org.apache.hadoop.mapreduce.InputFormat" +
              " Given: " + inputFormatParam.getName());
        }
      } else {
        inputFormatProvided = false;
        useNewApi = conf.getBoolean(MRJobConfig.NEW_API_MAPPER_CONFIG, true);
        try {
          if (useNewApi) {
            this.inputFormat = conf.getClassByName(conf.get(MRJobConfig.INPUT_FORMAT_CLASS_ATTR));
            Preconditions.checkState(org.apache.hadoop.mapreduce.InputFormat.class
                .isAssignableFrom(this.inputFormat));
          } else {
            this.inputFormat = conf.getClassByName(conf.get("mapred.input.format.class"));
            Preconditions.checkState(org.apache.hadoop.mapred.InputFormat.class
                .isAssignableFrom(this.inputFormat));
          }
        } catch (ClassNotFoundException e) {
          throw new TezUncheckedException(e);
        }
        initializeInputPath();
      }
    }
    
    MRInputConfigBuilder setInputClassName(String className) {
      this.inputClassName = className;
      return this;
    }

    private MRInputConfigBuilder setInputPaths(String inputPaths) {
      if (!(org.apache.hadoop.mapred.FileInputFormat.class.isAssignableFrom(inputFormat) || 
          FileInputFormat.class.isAssignableFrom(inputFormat))) {
        throw new TezUncheckedException("When setting inputPaths the inputFormat must be " + 
            "assignable from either org.apache.hadoop.mapred.FileInputFormat or " +
            "org.apache.hadoop.mapreduce.lib.input.FileInputFormat. " +
            "Otherwise use the non-path configBuilder." +
            " Given: " + inputFormat.getName());
      }
      conf.set(FileInputFormat.INPUT_DIR, inputPaths);
      this.inputPaths = inputPaths;
      return this;
    }

    private void initializeInputPath() {
      Preconditions.checkState(inputFormatProvided == false,
          "Should only be invoked when no inputFormat is provided");
      if (org.apache.hadoop.mapred.FileInputFormat.class.isAssignableFrom(inputFormat) ||
          FileInputFormat.class.isAssignableFrom(inputFormat)) {
        inputPaths = conf.get(FileInputFormat.INPUT_DIR);
      }
    }

    /**
     * Set whether splits should be grouped (default true)
     * @param value whether to group splits in the AM or not
     * @return {@link org.apache.tez.mapreduce.input.MRInput.MRInputConfigBuilder}
     */
    public MRInputConfigBuilder groupSplits(boolean value) {
      groupSplitsInAM = value;
      return this;
    }

    /**
     * Set whether splits should be sorted (default true)
     * @param value whether to sort splits in the AM or not
     * @return {@link org.apache.tez.mapreduce.input.MRInput.MRInputConfigBuilder}
     */
    public MRInputConfigBuilder sortSplits(boolean value) {
      sortSplitsInAM = value;
      return this;
    }

    /**
     * Set whether splits should be generated in the Tez App Master (default true)
     * @param value whether to generate splits in the AM or not
     * @return {@link org.apache.tez.mapreduce.input.MRInput.MRInputConfigBuilder}
     */
    public MRInputConfigBuilder generateSplitsInAM(boolean value) {
      generateSplitsInAM = value;
      return this;
    }

    /**
     * Get the credentials for the inputPaths from their {@link FileSystem}s
     * Use the method to turn this off when not using a {@link FileSystem}
     * or when {@link Credentials} are not supported
     * @param value whether to get credentials or not. (true by default)
     * @return {@link org.apache.tez.mapreduce.input.MRInput.MRInputConfigBuilder}
     */
    public MRInputConfigBuilder getCredentialsForSourceFileSystem(boolean value) {
      getCredentialsForSourceFilesystem = value;
      return this;
    }

    /**
     * This method is intended to be used in case a custom {@link org.apache.tez.runtime.api.InputInitializer}
     * is being used along with MRInput. If a custom descriptor is used, the config builder will not be
     * able to setup location hints, parallelism, etc, and configuring the {@link
     * org.apache.tez.dag.api.Vertex} on which this Input is used is the responsibility of the user.
     *
     * Credential fetching can be controlled via the {@link #getCredentialsForSourceFilesystem} method.
     * Whether grouping is enabled or not can be controlled via {@link #groupSplitsInAM} method.
     *
     * @param customInitializerDescriptor the initializer descriptor
     * @return {@link org.apache.tez.mapreduce.input.MRInput.MRInputConfigBuilder}
     */
    public MRInputConfigBuilder setCustomInitializerDescriptor(
        InputInitializerDescriptor customInitializerDescriptor) {
      this.customInitializerDescriptor = customInitializerDescriptor;
      return this;
    }

    /**
     * Create the {@link DataSourceDescriptor}
     *
     * @return {@link DataSourceDescriptor}
     */
    public DataSourceDescriptor build() {
      if (org.apache.hadoop.mapred.FileInputFormat.class.isAssignableFrom(inputFormat) ||
          FileInputFormat.class.isAssignableFrom(inputFormat)) {
        if (inputPaths == null) {
          throw new TezUncheckedException(
              "InputPaths must be specified for InputFormats based on " +
                  FileInputFormat.class.getName() + " or " +
                  org.apache.hadoop.mapred.FileInputFormat.class.getName());
        }
      }
      try {
        if (this.customInitializerDescriptor != null) {
          return createCustomDataSource();
        } else {
          if (generateSplitsInAM) {
            return createGeneratorDataSource();
          } else {
            return createDistributorDataSource();
          }
        }
      } catch (Exception e) {
        throw new TezUncheckedException(e);
      }
    }
    
    private DataSourceDescriptor createDistributorDataSource() throws IOException {
      InputSplitInfo inputSplitInfo;
      setupBasicConf(conf);
      try {
        inputSplitInfo = MRInputHelpers.generateInputSplitsToMem(conf, false, true, 0);
      } catch (Exception e) {
        throw new TezUncheckedException(e);
      }
      MRHelpers.translateMRConfToTez(conf);

      UserPayload payload = MRInputHelpersInternal.createMRInputPayload(conf,
          inputSplitInfo.getSplitsProto());
      Credentials credentials = null;
      if (getCredentialsForSourceFilesystem && inputSplitInfo.getCredentials() != null) {
        credentials = inputSplitInfo.getCredentials();
      }
      DataSourceDescriptor ds = DataSourceDescriptor.create(
          InputDescriptor.create(inputClassName).setUserPayload(payload),
          InputInitializerDescriptor.create(MRInputSplitDistributor.class.getName()),
          inputSplitInfo.getNumTasks(), credentials,
          VertexLocationHint.create(inputSplitInfo.getTaskLocationHints()), null);
      if (conf.getBoolean(TezRuntimeConfiguration.TEZ_RUNTIME_CONVERT_USER_PAYLOAD_TO_HISTORY_TEXT,
          TezRuntimeConfiguration.TEZ_RUNTIME_CONVERT_USER_PAYLOAD_TO_HISTORY_TEXT_DEFAULT)) {
        ds.getInputDescriptor().setHistoryText(TezUtils.convertToHistoryText(conf));
      }

      return ds;
    }

    private DataSourceDescriptor createCustomDataSource() throws IOException {
      setupBasicConf(conf);

      MRHelpers.translateMRConfToTez(conf);

      Collection<URI> uris = maybeGetURIsForCredentials();

      UserPayload payload = MRInputHelpersInternal.createMRInputPayload(
          conf, groupSplitsInAM, sortSplitsInAM);

      DataSourceDescriptor ds = DataSourceDescriptor
          .create(InputDescriptor.create(inputClassName).setUserPayload(payload),
              customInitializerDescriptor, null);

      if (conf.getBoolean(TezRuntimeConfiguration.TEZ_RUNTIME_CONVERT_USER_PAYLOAD_TO_HISTORY_TEXT,
          TezRuntimeConfiguration.TEZ_RUNTIME_CONVERT_USER_PAYLOAD_TO_HISTORY_TEXT_DEFAULT)) {
        ds.getInputDescriptor().setHistoryText(TezUtils.convertToHistoryText(conf));
      }

      if (uris != null) {
        ds.addURIsForCredentials(uris);
      }
      return ds;
    }

    private DataSourceDescriptor createGeneratorDataSource() throws IOException {
      setupBasicConf(conf);
      MRHelpers.translateMRConfToTez(conf);
      
      Collection<URI> uris = maybeGetURIsForCredentials();

      UserPayload payload = MRInputHelpersInternal.createMRInputPayload(
          conf, groupSplitsInAM, sortSplitsInAM);

      DataSourceDescriptor ds = DataSourceDescriptor.create(
          InputDescriptor.create(inputClassName).setUserPayload(payload),
          InputInitializerDescriptor.create(MRInputAMSplitGenerator.class.getName()), null);

      if (conf.getBoolean(TezRuntimeConfiguration.TEZ_RUNTIME_CONVERT_USER_PAYLOAD_TO_HISTORY_TEXT,
          TezRuntimeConfiguration.TEZ_RUNTIME_CONVERT_USER_PAYLOAD_TO_HISTORY_TEXT_DEFAULT)) {
        ds.getInputDescriptor().setHistoryText(TezUtils.convertToHistoryText(conf));
      }

      if (uris != null) {
        ds.addURIsForCredentials(uris);
      }
      return ds;
    }

    private void setupBasicConf(Configuration inputConf) {
      if (inputFormatProvided) {
        inputConf.setBoolean(MRJobConfig.NEW_API_MAPPER_CONFIG, useNewApi);
        if (useNewApi) {
          inputConf.set(MRJobConfig.INPUT_FORMAT_CLASS_ATTR, inputFormat.getName());
        } else {
          inputConf.set("mapred.input.format.class", inputFormat.getName());
        }
      }
    }

    private Collection<URI> maybeGetURIsForCredentials() {
      if (getCredentialsForSourceFilesystem && inputPaths != null) {
        try {
          List<URI> uris = Lists.newLinkedList();
          for (String inputPath : inputPaths.split(",")) {
            Path path = new Path(inputPath);
            FileSystem fs;
            fs = path.getFileSystem(conf);
            Path qPath = fs.makeQualified(path);
            uris.add(qPath.toUri());
          }
          return uris;
        } catch (IOException e) {
          throw new TezUncheckedException(e);
        }
      }
      return null;
    }

  }

  /**
   * Create an {@link org.apache.tez.mapreduce.input.MRInput.MRInputConfigBuilder} </p>
   * The preferred usage model is to provide all of the parameters, and use methods to configure
   * the Input.
   * <p/>
   * For legacy applications, which may already have a fully configured {@link Configuration}
   * instance, the inputFormat can be specified as null
   *
   * @param conf        Configuration for the {@link MRInput}. This configuration instance will be
   *                    modified in place
   * @param inputFormat InputFormat derived class. This can be null. If the InputFormat specified
   *                    is
   *                    null, the provided configuration should be complete.
   * @return {@link org.apache.tez.mapreduce.input.MRInput.MRInputConfigBuilder}
   */
  public static MRInputConfigBuilder createConfigBuilder(Configuration conf,
                                                         @Nullable Class<?> inputFormat) {
    return new MRInputConfigBuilder(conf, inputFormat);
  }

  /**
   * Create an {@link org.apache.tez.mapreduce.input.MRInput.MRInputConfigBuilder} 
   * for {@link org.apache.hadoop.mapreduce.lib.input.FileInputFormat}
   * or {@link org.apache.hadoop.mapred.FileInputFormat} format based InputFormats.
   * <p/>
   * The preferred usage model is to provide all of the parameters, and use methods to configure
   * the Input.
   * <p/>
   * For legacy applications, which may already have a fully configured {@link Configuration}
   * instance, the inputFormat and inputPath can be specified as null
   *
   * @param conf        Configuration for the {@link MRInput}. This configuration instance will be
   *                    modified in place
   * @param inputFormat InputFormat derived class. This can be null. If the InputFormat specified
   *                    is
   *                    null, the provided configuration should be complete.
   * @param inputPaths  Comma separated input paths
   * @return {@link org.apache.tez.mapreduce.input.MRInput.MRInputConfigBuilder}
   */
  public static MRInputConfigBuilder createConfigBuilder(Configuration conf,
                                                         @Nullable Class<?> inputFormat,
                                                         @Nullable String inputPaths) {
    MRInputConfigBuilder configurer = new MRInputConfigBuilder(conf, inputFormat);
    if (inputPaths != null) {
      return configurer.setInputPaths(inputPaths);
    }
    return configurer;
  }

  private static final Logger LOG = LoggerFactory.getLogger(MRInput.class);
  
  private final ReentrantLock rrLock = new ReentrantLock();
  private final Condition rrInited = rrLock.newCondition();
  
  private volatile boolean eventReceived = false;

  private boolean readerCreated = false;

  protected MRReader mrReader;

  protected TaskSplitIndex splitMetaInfo = new TaskSplitIndex();

  // Potential counters - #splits, #totalSize, #actualyBytesRead
  
  @Private
  volatile boolean splitInfoViaEvents;

  public MRInput(InputContext inputContext, int numPhysicalInputs) {
    super(inputContext, numPhysicalInputs);
  }

  @Override
  public List<Event> initialize() throws IOException {
    super.initialize();
    getContext().inputIsReady();
    this.splitInfoViaEvents = jobConf.getBoolean(MRJobConfig.MR_TEZ_SPLITS_VIA_EVENTS,
        MRJobConfig.MR_TEZ_SPLITS_VIA_EVENTS_DEFAULT);
    LOG.info(getContext().getSourceVertexName() + " using newmapreduce API=" + useNewApi +
        ", split via event=" + splitInfoViaEvents + ", numPhysicalInputs=" +
        getNumPhysicalInputs());
    initializeInternal();
    return null;
  }

  @Override
  public void start() {
    Preconditions.checkState(getNumPhysicalInputs() == 0 || getNumPhysicalInputs() == 1,
        "Expecting 0 or 1 physical input for MRInput");
  }

  @Private
  void initializeInternal() throws IOException {
    // Primarily for visibility
    rrLock.lock();
    try {
      
      if (splitInfoViaEvents) {
        if (useNewApi) {
          mrReader = new MRReaderMapReduce(jobConf, getContext().getCounters(), inputRecordCounter,
              getContext().getApplicationId().getClusterTimestamp(), getContext()
                  .getTaskVertexIndex(), getContext().getApplicationId().getId(), getContext()
                  .getTaskIndex(), getContext().getTaskAttemptNumber(), getContext());
        } else {
          mrReader = new MRReaderMapred(jobConf, getContext().getCounters(), inputRecordCounter, 
              getContext());
        }
      } else {
        TaskSplitMetaInfo thisTaskMetaInfo = MRInputUtils.getSplits(jobConf,
            getContext().getTaskIndex());
        TaskSplitIndex splitMetaInfo = new TaskSplitIndex(thisTaskMetaInfo.getSplitLocation(),
            thisTaskMetaInfo.getStartOffset());
        long splitLength = -1;
        if (useNewApi) {
          org.apache.hadoop.mapreduce.InputSplit newInputSplit = MRInputUtils
              .getNewSplitDetailsFromDisk(splitMetaInfo, jobConf, getContext().getCounters()
                  .findCounter(TaskCounter.SPLIT_RAW_BYTES));
          try {
            splitLength = newInputSplit.getLength();
          } catch (InterruptedException e) {
            LOG.warn("Got interrupted while reading split length: ", e);
          }
          mrReader = new MRReaderMapReduce(jobConf, newInputSplit, getContext().getCounters(),
              inputRecordCounter, getContext().getApplicationId().getClusterTimestamp(),
              getContext().getTaskVertexIndex(), getContext().getApplicationId().getId(),
              getContext().getTaskIndex(), getContext().getTaskAttemptNumber(), getContext());
        } else {
          org.apache.hadoop.mapred.InputSplit oldInputSplit = MRInputUtils
              .getOldSplitDetailsFromDisk(splitMetaInfo, jobConf, getContext().getCounters()
                  .findCounter(TaskCounter.SPLIT_RAW_BYTES));
          splitLength = oldInputSplit.getLength();
          mrReader =
              new MRReaderMapred(jobConf, oldInputSplit, getContext().getCounters(),
                  inputRecordCounter, getContext());
        }
        if (splitLength != -1) {
          getContext().getCounters().findCounter(TaskCounter.INPUT_SPLIT_LENGTH_BYTES)
              .increment(splitLength);
        }
      }
    } finally {
      rrLock.unlock();
    }
    LOG.info("Initialized MRInput: " + getContext().getSourceVertexName());
  }

  /**
   * Returns a {@link KeyValueReader} that can be used to read 
   * Map Reduce compatible key value data. An exception will be thrown if next()
   * is invoked after false, either from the framework or from the underlying InputFormat
   */
  @Override
  public KeyValueReader getReader() throws IOException {
    Preconditions
        .checkState(readerCreated == false,
            "Only a single instance of record reader can be created for this input.");
    readerCreated = true;
    if (getNumPhysicalInputs() == 0) {
      return new KeyValueReader() {
        @Override
        public boolean next() throws IOException {
          getContext().notifyProgress();
          return false;
        }

        @Override
        public Object getCurrentKey() throws IOException {
          return null;
        }

        @Override
        public Object getCurrentValue() throws IOException {
          return null;
        }
      };
    }
    rrLock.lock();
    try {
      if (!mrReader.isSetup())
        checkAndAwaitRecordReaderInitialization();
    } finally {
      rrLock.unlock();
    }

    return mrReader;
  }

  @Override
  public void handleEvents(List<Event> inputEvents) throws Exception {
    if (getNumPhysicalInputs() == 0) {
      throw new IllegalStateException(
          "Unexpected event. MRInput has been setup to receive 0 events");
    }
    if (eventReceived || inputEvents.size() != 1) {
      throw new IllegalStateException(
          "MRInput expects only a single input. Received: current eventListSize: "
              + inputEvents.size() + "Received previous input: "
              + eventReceived);
    }
    Event event = inputEvents.iterator().next();
    Preconditions.checkArgument(event instanceof InputDataInformationEvent,
        getClass().getSimpleName()
            + " can only handle a single event of type: "
            + InputDataInformationEvent.class.getSimpleName());

    processSplitEvent((InputDataInformationEvent) event);
  }

  @Override
  public List<Event> close() throws IOException {
    mrReader.close();
    long inputRecords = getContext().getCounters()
        .findCounter(TaskCounter.INPUT_RECORDS_PROCESSED).getValue();
    getContext().getStatisticsReporter().reportItemsProcessed(inputRecords);

    return null;
  }

  /**
   * {@link MRInput} sets some additional parameters like split location when using
   * the new API. This methods returns the list of additional updates, and
   * should be used by Processors using the old MapReduce API with {@link MRInput}.
   * 
   * @return the additional fields set by {@link MRInput}
   */
  public Configuration getConfigUpdates() {
    if (!useNewApi) {
      return ((MRReaderMapred) mrReader).getConfigUpdates();
    } else {
      return null;
    }
  }

  @Override
  public float getProgress() throws ProgressFailedException, InterruptedException {
    try {
      return (mrReader != null) ? mrReader.getProgress() : 0.0f;
    } catch (IOException e) {
      throw new ProgressFailedException("getProgress encountered IOException ", e);
    }
  }

  void processSplitEvent(InputDataInformationEvent event)
      throws IOException {
    rrLock.lock();
    try {
      initFromEventInternal(event);
      if (LOG.isDebugEnabled()) {
        LOG.debug(getContext().getSourceVertexName() + " notifying on RecordReader initialized");
      }
      rrInited.signal();
    } finally {
      rrLock.unlock();
    }
  }
  
  void checkAndAwaitRecordReaderInitialization() throws IOException {
    assert rrLock.getHoldCount() == 1;
    rrLock.lock();
    try {
      if (LOG.isDebugEnabled()) {
        LOG.debug(getContext().getSourceVertexName() + " awaiting RecordReader initialization");
      }
      rrInited.await();
    } catch (Exception e) {
      throw new IOException(
          "Interrupted waiting for RecordReader initiailization");
    } finally {
      rrLock.unlock();
    }
  }

  @Private
  void initFromEvent(InputDataInformationEvent initEvent)
      throws IOException {
    rrLock.lock();
    try {
      initFromEventInternal(initEvent);
    } finally {
      rrLock.unlock();
    }
  }
  
  private void initFromEventInternal(InputDataInformationEvent initEvent) throws IOException {
    if (LOG.isDebugEnabled()) {
      LOG.debug(getContext().getSourceVertexName() + " initializing RecordReader from event");
    }
    Preconditions.checkState(initEvent != null, "InitEvent must be specified");
    MRSplitProto splitProto = MRSplitProto.parseFrom(ByteString.copyFrom(initEvent.getUserPayload()));
    Object splitObj = null;
    long splitLength = -1;
    if (useNewApi) {
      InputSplit split = MRInputUtils.getNewSplitDetailsFromEvent(splitProto, jobConf);
      splitObj = split;
      try {
        splitLength = split.getLength();
      } catch (InterruptedException e) {
        LOG.warn("Thread interrupted while getting split length: ", e);
      }
      if (LOG.isDebugEnabled()) {
        LOG.debug(getContext().getSourceVertexName() + " split Details -> SplitClass: " +
            split.getClass().getName() + ", NewSplit: " + split + ", length: " + splitLength);
      }

    } else {
      org.apache.hadoop.mapred.InputSplit split =
          MRInputUtils.getOldSplitDetailsFromEvent(splitProto, jobConf);
      splitObj = split;
      splitLength = split.getLength();
      if (LOG.isDebugEnabled()) {
        LOG.debug(getContext().getSourceVertexName() + " split Details -> SplitClass: " +
            split.getClass().getName() + ", OldSplit: " + split + ", length: " + splitLength);
      }
    }
    if (splitLength != -1) {
      getContext().getCounters().findCounter(TaskCounter.INPUT_SPLIT_LENGTH_BYTES)
          .increment(splitLength);
    }
    mrReader.setSplit(splitObj);
    LOG.info(getContext().getSourceVertexName() + " initialized RecordReader from event");
  }

  private static class MRInputHelpersInternal extends MRInputHelpers {

    protected static UserPayload createMRInputPayload(Configuration conf,
        boolean isGrouped, boolean isSorted) throws IOException {
      return MRInputHelpers.createMRInputPayload(conf, null, isGrouped,
          isSorted);
    }

    protected static UserPayload createMRInputPayload(Configuration conf,
        MRRuntimeProtos.MRSplitsProto mrSplitsProto) throws
        IOException {
      return MRInputHelpers.createMRInputPayload(conf, mrSplitsProto, false,
          true);
    }
  }

}