java source code of ExtendedContentIndexingColumnBasedHandler

Project: datawave (GitHub Link)

datawave-master
- .github
  - workflows
    - tests.yml
- type-metadata-hdfs
  - src
    - main
      - resources
        TypeMetadataBridgeContext.xml
        TypeMetadataWriterContext.xml
        TypeMetadataProviderContext.xml
  - pom.xml
- checkstyle.xml
- properties
  - default.properties
  - bamboo.properties
  - dev.properties
- pom.xml
- spotbugs-exclude.xml
- LICENSE
- warehouse
  - ingest-core
    - src
      - main
        protobuf
        RawRecordContainer.proto
        java
        datawave
        iterators
        StatsLinksEdgeCombiner.java
        ValueCombiner.java
        EdgeCombiner.java
        TotalAggregatingIterator.java
        PropogatingIterator.java
        policy
        ExampleIngestPolicyEnforcer.java
        IngestPolicyEnforcer.java
        util
        flag
        FlagMetrics.java
        processor
        AbstractSliceDistributor.java
        DateFolderFlagDistributor.java
        DateFlagDistributor.java
        FlagDistributor.java
        DateUtils.java
        SizeValidator.java
        UnusableFileException.java
        SimpleFlagDistributor.java
        InputFile.java
        FlagMaker.java
        config
        FlagDataTypeConfig.java
        ConfigUtil.java
        FlagMakerConfig.java
        FlagEntryMover.java
        FlagSocket.java
        SimpleMover.java
        IdentityDataType.java
        ingest
        time
        Now.java
        metadata
        MetadataWithMostRecentDate.java
        RawRecordMetadata.java
        package-info.java
        EventMetadata.java
        MetadataCounterGroup.java
        id
        DateIdParser.java
        MetadataIdParser.java
        NamedMetadataIdParser.java
        test
        StandaloneStatusReporterMBean.java
        StandaloneStatusReporter.java
        ParsingInternals.java
        StandaloneTaskAttemptContext.java
        protobuf
        RawRecordContainer.java
        table
        aggregator
        CombinerConfiguration.java
        GlobalIndexUidAggregator.java
        PropogatingCombiner.java
        TextIndexAggregator.java
        DateIndexDateAggregator.java
        config
        ErrorMetadataTableConfigHelper.java
        TableConfigHelper.java
        ErrorShardTableConfigHelper.java
        DateIndexTableConfigHelper.java
        MetadataTableConfigHelper.java
        ProtobufEdgeTableConfigHelper.java
        MetricsSummaryTableConfigHelper.java
        AtomTableConfigHelper.java
        AbstractTableConfigHelper.java
        LoadDateTableConfigHelper.java
        ShardTableConfigHelper.java
        bloomfilter
        ShardKeyFunctor.java
        ShardIndexKeyFunctor.java
        util
        MemoryStarvationStrategy.java
        Identity.java
        ConfigurationFileHelper.java
        GenerateShardSplits.java
        ThreadUtil.java
        GenerateSplitsFile.java
        DiskSpaceStarvationStrategy.java
        ResourceAvailabilityUtil.java
        WeightedValuePruningStrategy.java
        GenerateMultipleNumShardsCacheFile.java
        TimeoutStrategy.java
        AbstractNGramTokenizationStrategy.java
        BloomFilterUtil.java
        AccumuloCliOptions.java
        NGramTokenizationStrategy.java
        BloomFilterWrapper.java
        GenerateEdgeKeyVersionCache.java
        KillJobByRegex.java
        config
        IngestConfiguration.java
        RawRecordContainerImpl.java
        MimeDecoder.java
        IngestConfigurationFactory.java
        data
        RawDataErrorNames.java
        config
        XMLFieldConfigHelper.java
        DataTypeHelperImpl.java
        MaskedFieldHelper.java
        MarkingsHelper.java
        DataTypeHelper.java
        CSVHelper.java
        NormalizedFieldAndValue.java
        FieldConfigHelper.java
        ingest
        CSVIngestHelper.java
        CompositeIngestHelperInterface.java
        FieldNameAliaserNormalizer.java
        IgnorableErrorHelperInterface.java
        MetaDataIngestHelper.java
        VirtualIngest.java
        AtomIngestHelper.java
        EventFieldNormalizerHelper.java
        BaseIngestHelper.java
        TermFrequencyIngestHelperInterface.java
        IndexOnlyIngestHelperInterface.java
        IngestHelperInterface.java
        CompositeIngest.java
        VirtualFieldIngestHelper.java
        FilterIngest.java
        CompositeFieldIngestHelper.java
        ContentBaseIngestHelper.java
        IgnorableFatalErrorHelper.java
        AbstractIngestHelper.java
        AbstractContentIngestHelper.java
        IngestFieldFilter.java
        ErrorShardedIngestHelper.java
        GroupedNormalizedContentInterface.java
        NormalizedContentInterface.java
        BaseNormalizedContent.java
        filter
        KeyValueFilter.java
        DataTypeOverrideHelper.java
        normalizer
        TextNormalizer.java
        package-info.java
        AbstractNormalizer.java
        SimpleGroupFieldNameParser.java
        TypeRegistry.java
        RawRecordContainer.java
        Type.java
        tokenize
        AccentFilter.java
        StandardAnalyzer.java
        TruncateAttribute.java
        TokenizationHelper.java
        Lexer.java
        StandardTokenizer.java
        TokenSearchSynonymFilter.java
        TokenSearch.java
        TruncateAttributeImpl.java
        ITokenizer.java
        DefaultTokenSearch.java
        hash
        StringUID.java
        validation
        FieldValidator.java
        EventValidator.java
        ValidationException.java
        metric
        IngestProcess.java
        IngestInput.java
        package-info.java
        IngestOutput.java
        mapreduce
        TermFilter.java
        MemberShipTest.java
        EventMapper.java
        partition
        ShardIdPartitioner.java
        PartitionLimiter.java
        TabletLocationHashPartitioner.java
        TabletLocationNamePartitioner.java
        LocalityGroupPartitioner.java
        MultiTableRRRangePartitioner.java
        SplitBasedHashPartitioner.java
        RowHashingPartitioner.java
        BalancedShardPartitioner.java
        LimitedKeyPartitioner.java
        LimitedRowPartitioner.java
        DelegatePartitioner.java
        MultiTableRangePartitioner.java
        job
        BulkIngestKey.java
        NonShardedSplitsFile.java
        MultiRFileOutputFormatter.java
        ConstraintChecker.java
        ShardedTableMapFile.java
        MetadataTableSplits.java
        OverridingConfiguration.java
        statsd
        StatsDEnabledMapper.java
        CounterStatsDClient.java
        CounterToStatsDConfiguration.java
        StatsDHelper.java
        StatsDEnabledDataTypeHandler.java
        CBMutationOutputFormatter.java
        reduce
        BulkIngestKeyAggregatingReducer.java
        AggregatingReducer.java
        BulkIngestKeyDedupeCombiner.java
        IngestJob.java
        TablePartitionerOffsets.java
        VisibilityConstraint.java
        ConstraintInitializer.java
        DelegatingPartitioner.java
        TableConfigHelperFactory.java
        metrics
        PassThroughMetricsStore.java
        KeyConverter.java
        Metric.java
        MetricsConfiguration.java
        BaseMetricsReceiver.java
        AggregatingMetricsStore.java
        MetricsStore.java
        KeyValueCountingContextWriter.java
        MetricsService.java
        Counts.java
        MetricsTableConfigHelper.java
        MetricsReceiver.java
        ReusableMetricsLabels.java
        BulkIngestMapFileLoader.java
        writer
        ContextWriter.java
        LiveContextWriter.java
        BulkContextWriter.java
        DedupeContextWriter.java
        AbstractChainedContextWriter.java
        AggregatingContextWriter.java
        TableCachingContextWriter.java
        AbstractContextWriter.java
        ChainedContextWriter.java
        MetadataTableSplitsCacheStatus.java
        PartitionerCache.java
        SafeFileOutputCommitter.java
        BulkIngestCounters.java
        ContextWrappedStatusReporter.java
        handler
        atom
        AtomDataTypeHandler.java
        AtomErrorDataTypeHandler.java
        error
        ErrorDataTypeHandler.java
        ErrorShardedDataTypeHandler.java
        DataTypeHandler.java
        fact
        functions
        MultimapContext.java
        ExtendedDataTypeHandler.java
        dateindex
        DateIndexDataTypeHandler.java
        edge
        ProtobufEdgeDataTypeHandler.java
        EdgeKeyVersioningCache.java
        evaluation
        MultiMapArithmetic.java
        EdgePreconditionJexlContext.java
        EdgePreconditionJexlEvaluation.java
        EdgePreconditionCacheHelper.java
        define
        EdgeDataBundle.java
        EdgeKeyType.java
        VertexValue.java
        EdgeGroup.java
        DurationValue.java
        EdgeDefinition.java
        EdgeDirection.java
        EdgeNode.java
        EdgeDefinitionConfigurationHelper.java
        tokenize
        ExtendedContentIngestHelper.java
        ExtendedContentIndexingColumnBasedHandler.java
        ExtendedContentDataTypeHelper.java
        ContentIndexingColumnBasedHandler.java
        stats
        CardinalityEstimator.java
        summary
        util
        MetricRuleUtil.java
        SummaryDataTypeHandler.java
        CoreSummaryDataTypeHandler.java
        MetricsSummaryFormatter.java
        MetricsSummaryDataTypeHandler.java
        shard
        content
        TermAndZone.java
        BoundedOffsetQueue.java
        ContentIndexCounters.java
        OffsetQueue.java
        AbstractColumnBasedHandler.java
        NumShards.java
        ShardedDataTypeHandler.java
        ShardStatsDataTypeHandler.java
        ShardIdFactory.java
        input
        reader
        EventRecordReader.java
        LfLineReader.java
        AggregatingRecordReader.java
        LineReader.java
        ShardStatsRecordReader.java
        raw
        RawInputFormat.java
        ReaderInitializer.java
        event
        EventSequenceFileInputFormat.java
        EventSequenceFileRecordReader.java
        RecordFilter.java
        EventFixer.java
        EventErrorSummary.java
        LongLineTextInputFormat.java
        ValueReader.java
        PositionAwareLineReader.java
        AbstractEventRecordReader.java
        KeyValueReader.java
        KeyReader.java
        LongLineEventRecordReader.java
        EventInitializer.java
        metrics
        util
        flag
        FlagFile.java
        InputFile.java
      - test
        resources
        datawave
        ingest
        test-field-blacklist.xml
        mapreduce
        partition
        shards.list
        job
        BulkIngestMapFileLoader-type.xml
        full_splits.txt
        full_empty_splits.txt
        all-splits.txt
        trimmed_empty_splits.txt
        IngestJob-test-type.xml
        reduce
        AggregatingReduce-test-config.xml
        metrics
        test-metrics-config.xml
        trimmed_splits.txt
        test-field-whitelist.xml
        log4j.properties
        FlagLoadConfig.json
        fake-datatype-config.xml
        config
        metadata-config.xml
        all-config.xml
        sample-field-config.xml
        EdgeSpringConfig.xml
        edge-ingest-config.xml
        META-INF
        services
        datawave.ingest.config.IngestConfiguration
        MarkingFunctionsContext.xml
        TestFlagMakerConfig.xml
        java
        datawave
        TestBaseIngestHelper.java
        iterators
        PropogatingIteratorSeekTest.java
        SortedMultiMapIterator.java
        PropogatingIteratorTest.java
        TestAbstractContentIngestHelper.java
        util
        flag
        FlagMakerTest.java
        IngestWorker.java
        AbstractFlagConfig.java
        SimpleMoverTest.java
        FlagMakerLoad.java
        FlagEntryMoverTest.java
        IngestConfig.java
        InputFileTest.java
        ingest
        time
        NowTest.java
        metadata
        MetadataWithMostRecentDateTest.java
        MetadataCounterGroupTest.java
        EventMetadataTest.java
        table
        aggregator
        GlobalIndexUidAggregatorTest.java
        DateIndexDateAggregatorTest.java
        config
        MetadataTableConfigHelperTest.java
        AbstractTableConfigHelperTest.java
        ShardTableConfigHelperTest.java
        DateIndexTableConfigHelperTest.java
        LoadDateTableConfigHelperTest.java
        bloomfilter
        ShardIndexKeyFunctorTest.java
        ShardKeyFunctorTest.java
        util
        ResourceAvailabilityUtilTest.java
        NGramTokenizationStrategyTest.java
        config
        TestIngestConfigurationImpl.java
        data
        config
        DataTypeHelperImplTest.java
        NormalizedFieldAndValueTest.java
        MarkingsHelperTest.java
        ingest
        FakeIngestHelper.java
        IngestFieldFilterTest.java
        FieldNameAliaserNormalizerTest.java
        XMLFieldConfigHelperTest.java
        normalizer
        AbstractNormalizerTest.java
        RawRecordContainerImplTest.java
        TestIgnorableHelper.java
        mapreduce
        TablePropertiesMap.java
        SimpleDataTypeHelper.java
        SimpleRawRecord.java
        partition
        TestShardGenerator.java
        LimitedKeyPartitionerTest.java
        MultiTableRangePartitionerTest.java
        SplitBasedHashPartitionerTest.java
        LimitedRowPartitionerTest.java
        TabletLocationNamePartitionerTest.java
        TabletLocationHashPartitionerTest.java
        LocalityGroupPartitionerTest.java
        ShardIdPartitionerTest.java
        RowHashingPartitionerTest.java
        MultiTableRRRangePartitionerTest.java
        BalancedShardPartitionerTest.java
        OverridingConfigurationTest.java
        job
        CBMutationOutputFormatterTest.java
        ContextWriterConstraintTest.java
        MultiRFileOutputFormatterTest.java
        MetadataTableSplitsTest.java
        DelegatingPartitionerTest.java
        TablePartitionerOffsetsTest.java
        ConstraintCheckerTest.java
        NonemptyVisibilityConstraint.java
        statsd
        CounterToStatsDConfigurationTest.java
        StatsDEnabledClassesTest.java
        CounterStatsDClientTest.java
        SafeFileOutputCommitterTest.java
        BulkIngestMapFileLoaderTest.java
        ShardedTableMapFileTest.java
        metrics
        MetricsTableConfigHelperTest.java
        TestEventCountMetricsReceiver.java
        DummyDataTypeHandler.java
        TestKeyValueCountMetricsReceiver.java
        KeyValueCountingContextWriterTest.java
        MetricsTestData.java
        MetricsServiceTest.java
        MetricsConfigurationTest.java
        PartitionerCacheTest.java
        BulkIngestKeyTest.java
        TestContextWriter.java
        SimpleDataTypeHandler.java
        TableConfigHelperFactoryTest.java
        EventMapperTest.java
        TestWritableUtil.java
        handler
        dateindex
        DateIndexDataTypeHandlerTest.java
        DateIndexUtilTest.java
        edge
        ProtobufEdgeDeleteModeTest.java
        tokenize
        ContentIndexingColumnBasedHandlerTest.java
        MockStatusReporter.java
        shard
        content
        TermAndZoneTest.java
        BoundedOffsetQueueTest.java
        ShardedDataTypeHandlerTest.java
        NumShardsTest.java
        input
        reader
        raw
        FakeReader.java
    - pom.xml
    - .gitignore
  - ingest-wikipedia
    - src
      - main
        java
        datawave
        ingest
        wikipedia
        WikipediaPageExtractor.java
        WikipediaDataTypeHandler.java
        WikipediaIngestHelper.java
        ISO_639_Codes.java
        WikipediaHelper.java
        WikipediaEventInputFormat.java
        WikipediaContentHandler.java
        WikipediaRecordReader.java
        WikipediaInputFormat.java
        WikipediaPage.java
        DocWriter.java
      - test
        resources
        config
        ingest
        metadata-config.xml
        wikipedia-config.xml
        all-config.xml
        input
        enwiki-20130305-pages-articles-brief.xml
        java
        datawave
        ingest
        wikipedia
        WikipediaTestBed.java
        WikipediaIngestHelperTest.java
        WikipediaDataTypeHandlerTest.java
        WikipediaRecordReaderTest.java
    - pom.xml
    - README.wikipedia
  - edge-model-configuration-core
    - src
      - main
        resources
        EdgeModelContext.xml
    - pom.xml
  - pom.xml
  - ingest-nyctlc
    - src
      - main
        java
        datawave
        ingest
        nyctlc
        NYCTLCHelper.java
        NYCTLCIngestHelper.java
        NYCTLCInputFormat.java
        NYCTLCReader.java
      - test
        resources
        log4j.properties
        config
        ingest
        nyctlc-config.xml
        metadata-config.xml
        all-config.xml
        input
        nyctlc.csv
        java
        datawave
        ingest
        nyctlc
        mr
        handler
        NYCTLCColumnBasedHandlerTest.java
    - pom.xml
    - README.nyctlc
  - query-core
    - src
      - main
        resources
        DATAWAVE_EDGE.xml
        META-INF
        beans.xml
        java
        datawave
        audit
        SplitSelectorExtractor.java
        DatawaveSelectorExtractor.java
        mr
        bulk
        RecordIterator.java
        MetadataCacheLoader.java
        MultiRfileInputformat.java
        RfileSplitInputFormat.java
        RangeRecordReader.java
        RfileScanner.java
        RfileIterator.java
        RfileResource.java
        split
        TabletSplitSplit.java
        RfileSplit.java
        query
        attributes
        DiacriticContent.java
        TypeAttribute.java
        AttributeFactory.java
        IpAddress.java
        Content.java
        Attributes.java
        Numeric.java
        ValueTuple.java
        Metadata.java
        Geometry.java
        Attribute.java
        AttributeKeepFilter.java
        Cardinality.java
        TimingMetadata.java
        AttributeBag.java
        Longitude.java
        DateContent.java
        PreNormalizedAttribute.java
        Document.java
        PreNormalizedAttributeFactory.java
        FieldValueCardinality.java
        GeoPoint.java
        DocumentKey.java
        Latitude.java
        language
        functions
        QueryFunction.java
        lucene
        Include.java
        GetAllMatches.java
        GroupBy.java
        AbstractEvaluationPhaseFunction.java
        Options.java
        LuceneQueryFunction.java
        Exclude.java
        IsNotNull.java
        EvaluationOnly.java
        IsNull.java
        Unique.java
        Text.java
        Occurrence.java
        jexl
        Loaded.java
        Include.java
        GetAllMatches.java
        GroupBy.java
        JexlQueryFunction.java
        DateFunction.java
        OccurrenceFunction.java
        AbstractEvaluationPhaseFunction.java
        GeoFunction.java
        Options.java
        Geowave.java
        Exclude.java
        IsNotNull.java
        EvaluationOnly.java
        DateFormatUtil.java
        IsNull.java
        MatchesAtLeastCountOf.java
        MatchesInGroupFunction.java
        AtomValuesMatchFunction.java
        Unique.java
        Text.java
        MatchesInGroupLeft.java
        TimeFunction.java
        Jexl.java
        processor
        lucene
        CustomWildcardQueryNodeProcessor.java
        CustomQueryNodeProcessorPipeline.java
        CustomFieldLimiterNodeProcessor.java
        CustomAnalyzerQueryNodeProcessor.java
        TokenizedFieldsAttributeImpl.java
        TokenizedFieldsAttribute.java
        builder
        lucene
        ModifierQueryNodeBuilder.java
        RangeQueryNodeBuilder.java
        BooleanQueryNodeBuilder.java
        FunctionQueryNodeBuilder.java
        SlopQueryNodeBuilder.java
        PhraseQueryNodeBuilder.java
        FieldQueryNodeBuilder.java
        GroupQueryNodeBuilder.java
        AccumuloQueryTreeBuilder.java
        FuzzyQueryNodeBuilder.java
        jexl
        ModifierQueryNodeBuilder.java
        JexlTreeBuilder.java
        RangeQueryNodeBuilder.java
        BooleanQueryNodeBuilder.java
        FunctionQueryNodeBuilder.java
        SlopQueryNodeBuilder.java
        PhraseQueryNodeBuilder.java
        FieldQueryNodeBuilder.java
        GroupQueryNodeBuilder.java
        RegexpQueryNodeBuilder.java
        FuzzyQueryNodeBuilder.java
        tree
        WithinNode.java
        ServerHeadNode.java
        SoftAndNode.java
        QueryNode.java
        Optimization.java
        NotNode.java
        SelectorNode.java
        HardAndNode.java
        OrNode.java
        FunctionNode.java
        RequireNode.java
        AdjNode.java
        parser
        QueryParser.java
        lucene
        AccumuloSyntaxParserTokenManager.java
        Token.java
        FastCharStream.java
        AccumuloSyntaxParser.java
        AcumuloSyntaxParserConstants.java
        AccumuloSyntaxParser.jj
        CharStream.java
        TokenMgrError.java
        EscapeQuerySyntaxImpl.java
        QueryConfigHandler.java
        JavaCharStream.java
        generateSyntaxParser.sh
        LuceneQueryParser.java
        ParseException.java
        LuceneUUIDQueryParser.java
        jexl
        JexlGroupingNode.java
        JexlPhraseNode.java
        LuceneToJexlControlledQueryParser.java
        LuceneToJexlUUIDQueryParser.java
        LuceneToJexlQueryParser.java
        JexlNode.java
        JexlRangeNode.java
        JexlFunctionNode.java
        JexlBooleanNode.java
        ControlledQueryParser.java
        JexlWithinNode.java
        JexlNodeSet.java
        JexlSelectorNode.java
        JexlControlledQueryParser.java
        ParseException.java
        postprocessing
        tf
        ContentFunctionArguments.java
        Function.java
        TFFactory.java
        TermOffsetPopulator.java
        FunctionReferenceVisitor.java
        TermOffsetFunction.java
        EmptyTermFrequencyFunction.java
        index
        lookup
        Union.java
        CreateUidsIterator.java
        EntryParser.java
        DataTypeFilter.java
        IndexInfo.java
        AncestorCreateUidsIterator.java
        AnonymousIterable.java
        IndexStream.java
        RangeStream.java
        ShardRangeStream.java
        ShardLimitingIterator.java
        ScannerStream.java
        AncestorIndexStream.java
        ConcurrentScannerInitializer.java
        TupleToRange.java
        IndexMatchType.java
        IndexMatch.java
        PeekOrdering.java
        Intersection.java
        UidIntersector.java
        TupleComparator.java
        stats
        IndexStatsCombiningIterator.java
        IndexStatsRecord.java
        MinMaxIterator.java
        IndexStatsSummingIterator.java
        IndexStatsClient.java
        iterators
        FieldIndexCountingIterator.java
        FirstAndLastSeenDate.java
        FirstAndLastSeenIterator.java
        search
        WildcardFieldedFilter.java
        Term.java
        RangeFieldedTerm.java
        FieldedTerm.java
        WildcardFieldedTerm.java
        function
        DocumentMetadata.java
        AttributeToCardinality.java
        JexlContextCreator.java
        MaskedValueFilterFactory.java
        GetStartKey.java
        IndexOnlyContextCreator.java
        DescendantCountFunction.java
        CardinalitySummation.java
        KryoCVAwareSerializableSerializer.java
        MinimumEstimation.java
        DocumentPermutation.java
        TLDEquality.java
        AncestorEquality.java
        JexlEvaluation.java
        AbstractVersionFilter.java
        KeyToFieldName.java
        RemoveGroupingContext.java
        Equality.java
        deserializer
        WritableDocumentDeserializer.java
        DocumentDeserializer.java
        KryoDocumentDeserializer.java
        LimitFields.java
        MaskedValueFilterInterface.java
        DescendantCount.java
        DocumentProjection.java
        PrefixEquality.java
        IndexOnlyKeyToDocumentData.java
        NoOpMaskedValueFilter.java
        DocumentCountCardinality.java
        KeyToDocumentData.java
        Permutation.java
        Aggregation.java
        FacetedGrouping.java
        SourcedFunction.java
        NormalizedVersionPredicate.java
        IndexOnlyContextCreatorBuilder.java
        MergeSummarization.java
        LogTiming.java
        ConfiguredFunction.java
        GroupFields.java
        DataTypeAsField.java
        serializer
        NoOpSerializer.java
        WritableDocumentSerializer.java
        ToStringDocumentSerializer.java
        DocumentSerializer.java
        KryoDocumentSerializer.java
        iterator
        SeekableNestedIterator.java
        ResultCountingIterator.java
        EmptyTreeIterable.java
        NestedQueryIterator.java
        SourceManager.java
        logic
        NestedIteratorContextUtil.java
        NegationFilter.java
        OrIterator.java
        ArrayIterator.java
        AndIterator.java
        IndexIteratorBridge.java
        TermFrequencyIndexIterator.java
        IndexIterator.java
        EventToFieldIndexTransform.java
        DocumentAggregatingIterator.java
        DocumentIterator.java
        SeekableIterator.java
        SourceFactory.java
        DocumentDataIterator.java
        EventDataScanNestedIterator.java
        NestedIterator.java
        WrappingIterator.java
        AccumuloTableIterable.java
        builder
        AbstractIteratorBuilder.java
        AndIteratorBuilder.java
        IteratorBuilder.java
        IndexIteratorBuilder.java
        IndexListIteratorBuilder.java
        NegationBuilder.java
        OrIteratorBuilder.java
        IndexFilterIteratorBuilder.java
        TermFrequencyIndexBuilder.java
        IndexRangeIteratorBuilder.java
        CardinalityIteratorBuilder.java
        IvaratorBuilder.java
        IndexRegexIteratorBuilder.java
        NestedQuery.java
        ivarator
        IvaratorCacheDir.java
        IvaratorCacheDirConfig.java
        LoadAverageWatchIterator.java
        UniqueColumnFamilyIterator.java
        QueryInformationIterator.java
        DocumentSpecificTreeIterable.java
        FieldIndexOnlyQueryIterator.java
        LimitedSortedKeyValueIterator.java
        TreeIterable.java
        QueryIterator.java
        aggregation
        DocumentData.java
        Util.java
        GetParentDocument.java
        SourceThreadTrackingIterator.java
        AccumuloTreeIterable.java
        AccumuloFieldIndexIterable.java
        QueryOptions.java
        CloseableListIterable.java
        SourcedOptions.java
        facets
        DynamicFacetIterator.java
        FacetedTableIterator.java
        profile
        QuerySpan.java
        EvaluationTrackingFunction.java
        PipelineQuerySpanCollectionIterator.java
        QuerySpanCollector.java
        SourceTrackingIterator.java
        EvaluationTrackingIterable.java
        FinalDocumentTrackingIterator.java
        EvaluationTrackingNestedIterator.java
        MultiThreadedQuerySpan.java
        EvaluationTrackingIterator.java
        EvaluationTrackingPredicate.java
        pipeline
        Pipeline.java
        PipelinePool.java
        BatchedDocumentIterator.java
        SerialIterator.java
        PipelineFactory.java
        PipelineIterator.java
        ParentQueryIterator.java
        CachingIterator.java
        errors
        UnindexedException.java
        ErrorKey.java
        ErrorReportingIterator.java
        ErrorType.java
        filter
        FieldIndexEntryKeyDataTypeFilter.java
        EventEntryKeyDataTypeFilter.java
        FieldIndexKeyDataTypeFilter.java
        StringToText.java
        DateTypeFilter.java
        EntryKeyIdentity.java
        EdgeFilterIterator.java
        KeyIdentity.java
        EventKeyDataTypeFilter.java
        LoadDateFilter.java
        IndexOnlyFunctionIterator.java
        DocumentSpecificNestedIterator.java
        tables
        BatchResource.java
        ShardIndexQueryTable.java
        ShardQueryLogic.java
        ScannerSession.java
        content
        ContentQueryTable.java
        ScannerFactory.java
        ParentQueryLogic.java
        PartitionedQueryLogic.java
        AccumuloResource.java
        DedupingIterator.java
        IndexQueryLogic.java
        RunningResource.java
        AnyFieldScanner.java
        RangeStreamScanner.java
        chained
        ChainedQueryConfiguration.java
        ChainedQueryTable.java
        iterators
        ChainedQueryIterator.java
        strategy
        FullChainStrategy.java
        ChainStrategy.java
        ResourceQueue.java
        TLDQueryLogic.java
        BatchScannerSession.java
        SessionOptions.java
        AncestorQueryLogic.java
        chunk
        Chunker.java
        edge
        EdgeQueryLogic.java
        DefaultEventQueryBuilder.java
        DefaultEdgeEventQueryLogic.java
        contexts
        EdgeContext.java
        QueryContext.java
        IdentityContext.java
        VisitationContext.java
        CountingShardQueryLogic.java
        QueryMacroFunction.java
        facets
        FacetedVisitor.java
        FacetedConfiguration.java
        FacetIndex.java
        FacetQueryPlanVisitor.java
        FacetTableFunction.java
        FacetedSearchType.java
        FacetedFunction.java
        MergedReadAhead.java
        FacetedQueryLogic.java
        FacetCheck.java
        stats
        StatsListener.java
        ScanSessionStats.java
        term
        TermFrequencyQueryTable.java
        async
        ShutdownEvent.java
        ScannerChunk.java
        SpeculativeScan.java
        SessionArbiter.java
        Scan.java
        event
        VisitorFunction.java
        QueryChunk.java
        RangeDefinition.java
        shard
        FieldIndexCountQueryLogic.java
        CountAggregatingIterator.java
        IndexStatsQueryLogic.java
        discovery
        MultimapSerializer.java
        MultimapType.java
        PatternNormalization.java
        LiteralRangeMultimapType.java
        LiteralRangeMultimapSerializer.java
        TermInfo.java
        DiscoveryIterator.java
        LiteralRangeType.java
        Normalization.java
        DiscoveryTransformer.java
        LiteralNormalization.java
        DiscoveryLogic.java
        IndexMatchingIterator.java
        LiteralRangeSerializer.java
        DiscoveredThing.java
        FindLiteralsAndPatternsVisitor.java
        TermInfoAggregation.java
        DiscoveryQueryConfiguration.java
        scheduler
        PushdownScheduler.java
        SequentialScheduler.java
        Scheduler.java
        PushdownFunction.java
        transformer
        GroupingDocumentTransformer.java
        ParentDocumentTransformer.java
        EventQueryTransformerSupport.java
        FieldMappingTransform.java
        EventQueryDataDecoratorTransformer.java
        EventQueryTransformer.java
        UniqueTransform.java
        EdgeQueryTransformerSupport.java
        DocumentTransform.java
        ContentTransform.java
        DocumentTransformerSupport.java
        ShardIndexQueryTransformer.java
        ShardQueryCountTableTransformer.java
        DocumentTransformerInterface.java
        EdgeQueryTransformer.java
        ContentQueryTransformer.java
        EventQueryTransformerInterface.java
        FacetedTransformer.java
        FieldIndexCountQueryTransformer.java
        GroupingTransform.java
        EventQueryDataDecorator.java
        DocumentTransformer.java
        TermFrequencyQueryTransformer.java
        QueryParameters.java
        Constants.java
        cardinality
        CardinalityRecord.java
        CardinalityConfiguration.java
        CardinalityScanner.java
        CardinalityScannerConfiguration.java
        DateFieldValueCardinalityRecord.java
        CloseableIterable.java
        table
        parser
        TermFrequencyKeyValueFactory.java
        ContentKeyValueFactory.java
        EventKeyValueFactory.java
        util
        Tuples.java
        QueryInformation.java
        HasMarkingFunctions.java
        Tuple2.java
        DateIndexHelperFactory.java
        QueryScannerHelper.java
        metadata
        MockLoader.java
        LoaderKey.java
        DateIndexHelper.java
        regex
        RegexTrie.java
        SortedKeyValueIteratorToIterator.java
        Tuple1.java
        Tuple3.java
        QueryStopwatch.java
        EmptyContext.java
        TypeMetadataWriter.java
        TypeMetadataBridge.java
        sortedset
        RFileKeyOutputStream.java
        MultiSetBackedSortedSet.java
        SortedByteSetBuffer.java
        KeyValueSerializable.java
        FileKeySortedSet.java
        ByteArrayComparator.java
        HdfsBackedSortedSet.java
        SortedSetTempFileHandler.java
        FileSerializableSortedSet.java
        RFileKeyInputStream.java
        FileSortedSet.java
        MergeSortIterator.java
        BufferedFileBackedSortedSet.java
        TraceIterator.java
        cache
        ConnectorCacheId.java
        NormalizerConfigLoader.java
        IndexedFieldLoader.java
        NormalizerLoader.java
        DatatypeLoader.java
        AccumuloLoader.java
        QueryModelLoader.java
        TypeMetadataProvider.java
        MetadataHelperUpdateHdfsListener.java
        Tuple4.java
        IteratorToSortedKeyValueIterator.java
        TupleToEntry.java
        DateIndexTestIngest.java
        MetadataHelperCacheManagementListener.java
        EntryToTuple.java
        TraceIterators.java
        jexl
        DatawaveJexlEngine.java
        functions
        KeyAdjudicator.java
        ContentOrderedEvaluator.java
        QueryFunctionsDescriptor.java
        NormalizationFunctions.java
        IdentityAggregator.java
        EvaluationPhaseFilterFunctions.java
        FunctionJexlNodeVisitor.java
        JexlFunctionArgumentDescriptorFactory.java
        arguments
        JexlArgument.java
        JexlArgumentDescriptor.java
        DefaultJexlArgument.java
        RebuildingJexlArgumentDescriptor.java
        JexlFunctionNamespaceRegistry.java
        CardinalityAggregator.java
        ContentUnorderedEvaluator.java
        QueryFunctions.java
        TermFrequencyList.java
        StringLiteralsOnly.java
        GetFunctionClass.java
        GroupingRequiredFilterFunctionsDescriptor.java
        ContentFunctionEvaluator.java
        EvaluationPhaseFilterFunctionsDescriptor.java
        SeekingAggregator.java
        GeoFunctions.java
        GeoFunctionsDescriptor.java
        GeoWaveFunctions.java
        TermFrequencyAggregator.java
        ContentFunctionsDescriptor.java
        GroupingRequiredFilterFunctions.java
        GeoWaveFunctionsDescriptor.java
        FieldIndexAggregator.java
        ContentFunctions.java
        GetImage.java
        JexlFunctions.java
        JexlASTHelper.java
        DefaultArithmetic.java
        visitors
        BooleanOptimizationRebuildingVisitor.java
        ValidPatternVisitor.java
        IsNotNullIntentVisitor.java
        QueryPruningVisitor.java
        RootNegationCheckVisitor.java
        PruneLessSelectiveFieldsVisitor.java
        GeoWaveQueryInfoVisitor.java
        RangeCoalescingVisitor.java
        EvaluationRendering.java
        PushFunctionsIntoExceededValueRanges.java
        LiteralNodeSubsetVisitor.java
        AllTermsIndexedVisitor.java
        PullupUnexecutableNodesVisitor.java
        BoundedRangeDetectionVisitor.java
        RebuildingVisitor.java
        SatisfactionVisitor.java
        TermCountingVisitor.java
        HasTopLevelNegationVisitor.java
        SetMembershipVisitor.java
        FieldMissingFromSchemaVisitor.java
        PushdownUnexecutableNodesVisitor.java
        CaseSensitivityVisitor.java
        ExecutableExpansionVisitor.java
        JexlStringBuildingVisitor.java
        TreeFlatteningRebuilder.java
        EdgeTableRangeBuildingVisitor.java
        PatternNodeVisitor.java
        FunctionIndexQueryExpansionVisitor.java
        GeoFeatureVisitor.java
        EventDataQueryExpressionVisitor.java
        PushdownLowSelectivityNodesVisitor.java
        PushdownLargeFieldedListsVisitor.java
        IvaratorRequiredVisitor.java
        ParallelIndexExpansion.java
        UniqueExpressionTermsVisitor.java
        FetchDataTypesVisitor.java
        ExecutableDeterminationVisitor.java
        DelegatingArithmetic.java
        DateIndexCleanupVisitor.java
        FixUnindexedNumericTerms.java
        LiteralNodeVisitor.java
        IteratorBuildingVisitor.java
        TreeEqualityVisitor.java
        FixNegativeNumbersVisitor.java
        PushdownNegationVisitor.java
        QueryModelVisitor.java
        SortedUIDsRequiredVisitor.java
        PrintingVisitor.java
        RegexFunctionVisitor.java
        ExpandCompositeTerms.java
        DepthVisitor.java
        DelayedNonEventSubTreeVisitor.java
        QueryPropertyMarkerVisitor.java
        ExpandMultiNormalizedTerms.java
        FunctionNormalizationRebuildingVisitor.java
        RewriteNegationsVisitor.java
        FixUnfieldedTermsVisitor.java
        BaseVisitor.java
        PushdownMissingIndexRangeNodesVisitor.java
        QueryOptionsFromQueryVisitor.java
        RangeConjunctionRebuildingVisitor.java
        TreeFlatteningRebuildingVisitor.java
        VariableNameVisitor.java
        TreeWrappingRebuildingVisitor.java
        RangeExpansionThresholdRebuildingVisitor.java
        ArithmeticJexlEngines.java
        lookups
        IndexLookupMap.java
        LookupTermsFromRegex.java
        IndexLookup.java
        ExceededThresholdException.java
        ShardIndexQueryTableStaticMethods.java
        LookupBoundedRangeForTerms.java
        EmptyIndexLookup.java
        RegexIndexLookup.java
        ValueSet.java
        FieldNameLookup.java
        StatefulArithmetic.java
        DelayedNonEventIndexContext.java
        DatawaveArithmetic.java
        HitListArithmetic.java
        JexlPatternCache.java
        JexlNodeFactory.java
        LiteralRange.java
        JexlRule.java
        nodes
        IndexHoleMarkerJexlNode.java
        QueryPropertyMarker.java
        ExceededTermThresholdMarkerJexlNode.java
        ExceededValueThresholdMarkerJexlNode.java
        ExceededOrThresholdMarkerJexlNode.java
        IndexOnlyJexlContext.java
        DatawaveJexlContext.java
        IndexOnlyLazyFetchingSet.java
        DatawaveInterpreter.java
        planner
        QueryModelProvider.java
        DefaultQueryPlanner.java
        QueryPlan.java
        QueryOptionsSwitch.java
        WiredQueryModelProvider.java
        SeekingQueryPlanner.java
        BooleanChunkingQueryPlanner.java
        comparator
        GeoWaveQueryPlanComparator.java
        DefaultQueryPlanComparator.java
        pushdown
        CostEstimator.java
        PushDownPlanner.java
        PushDownVisitor.java
        rules
        DelayedPredicatePushDown.java
        PushDownRule.java
        FullTableScan.java
        Cost.java
        IsType.java
        ThreadedRangeBundler.java
        rules
        RegexSimplifierTransformRule.java
        RegexPushdownTransformRule.java
        NodeTransformVisitor.java
        NodeTransformRule.java
        IndexQueryPlanner.java
        FacetedQueryPlanner.java
        MetadataHelperQueryModelProvider.java
        QueryPlanner.java
        ThreadedRangeBundlerIterator.java
        statsd
        QueryStatsDClient.java
        config
        Profile.java
        EdgeExtendedSummaryConfiguration.java
        IndexHole.java
        ShardIndexQueryConfiguration.java
        LookupUUIDTune.java
        ShardQueryConfiguration.java
        ContentQueryConfiguration.java
        TermFrequencyQueryConfiguration.java
        EdgeQueryConfiguration.java
        DocumentSerialization.java
        ancestor
        AncestorQueryPlanner.java
        AncestorIndexBuildingVisitor.java
        AncestorRangeStream.java
        AncestorIndexIterator.java
        AncestorChildExpansionIterator.java
        AncestorUidIntersector.java
        AncestorIndexIteratorBuilder.java
        AncestorQueryIterator.java
        enrich
        EnrichingMaster.java
        DataEnricher.java
        data
        parsers
        DatawaveKey.java
        map
        SimpleQueryGeometryHandler.java
        collections
        FunctionalSet.java
        exceptions
        CannotExpandUnfieldedTermFatalException.java
        FullTableScansDisallowedException.java
        TooManyTermsException.java
        DoNotPerformOptimizedQueryException.java
        DatawaveFatalQueryException.java
        EmptyUnfieldedTermExpansionException.java
        LoadAverageWatchException.java
        BooleanLogicFatalQueryException.java
        DatawaveIvaratorMaxResultsException.java
        InvalidFieldIndexQueryFatalQueryException.java
        InvalidDocumentHeader.java
        IllegalRangeArgumentException.java
        InvalidQueryException.java
        NoResultsException.java
        NoSuchDeserializerException.java
        DatawaveQueryException.java
        FieldNotMutableException.java
        edge
        DefaultExtendedEdgeQueryLogic.java
        tld
        TLDQueryIterator.java
        TLDIndexIteratorBuilder.java
        TLD.java
        TLDFieldIndexAggregator.java
        GetStartKeyForRoot.java
        DedupeColumnFamilies.java
        TLDEventDataScanNestedIterator.java
        TLDIndexBuildingVisitor.java
        TLDTermFrequencyAggregator.java
        TLDIndexIterator.java
        model
        util
        LoadModelFromXml.java
        edge
        EdgeQueryModel.java
        composite
        CompositeRange.java
        CompositeUtils.java
        CompositeSeeker.java
        Composite.java
        CompositeTerm.java
        tracking
        ActiveQuerySnapshot.java
        ActiveQuery.java
        ActiveQueryLog.java
        ranges
        RangeFactory.java
        metrics
        ContentQueryMetricsHandler.java
        ContentQueryMetricsIngestHelper.java
        ShardTableQueryMetricHandler.java
        QueryMetricQueryLogic.java
        BaseQueryMetricHandler.java
        MockStatusReporter.java
        AccumuloRecordWriter.java
        predicate
        EventDataQueryFieldFilter.java
        Filter.java
        ValueToAttribute.java
        KeyProjection.java
        TimeFilter.java
        EmptyDocumentFilter.java
        ConfigurableEventDataQueryFilter.java
        PeekingPredicate.java
        EventDataQueryExpressionFilter.java
        ParentEventDataFilter.java
        ConfiguredPredicate.java
        NegationPredicate.java
        TransformingFilter.java
        EventDataQueryFilter.java
        SeekingFilter.java
        Projection.java
        AncestorEventDataFilter.java
        TLDEventDataFilter.java
        ChainableEventDataQueryFilter.java
        ValueToAttributes.java
        parser
        JexlOperatorConstants.java
        EventFields.java
        dashboard
        DashboardQueryLogic.java
        webservice
        edgedictionary
        EdgeDictionaryType.java
        RemoteEdgeDictionary.java
        query
        result
        event
        SimpleEvent.java
        SimpleField.java
        datadictionary
        RemoteDataDictionary.java
        DataDictionaryType.java
        modification
        configuration
        ModificationConfiguration.java
        ModificationServiceConfiguration.java
        MutableMetadataUUIDHandler.java
        MutableMetadataHandler.java
        core
        iterators
        ResultCountingIterator.java
        DescendentFilterIterator.java
        filesystem
        FileSystemCache.java
        GlobalIndexShortCircuitIterator.java
        TermFrequencyIterator.java
        uid
        GlobalIndexUidMappingIterator.java
        ShardUidMappingIterator.java
        UidMapper.java
        UidMappingIterator.java
        FieldIndexDocumentFilter.java
        CompositeSeekingIterator.java
        TimeoutIterator.java
        GlobalIndexDateSummaryIterator.java
        ColumnQualifierRangeIterator.java
        GlobalIndexTermMatchingIterator.java
        DatawaveFieldIndexRegexIteratorJexl.java
        TimeoutExceptionIterator.java
        FairIterator.java
        RangeSplitter.java
        DatawaveFieldIndexFilterIteratorJexl.java
        EnrichingIterator.java
        querylock
        ZookeeperQueryLock.java
        HdfsQueryLock.java
        CombinedQueryLock.java
        QueryLock.java
        DatawaveFieldIndexCachingIteratorJexl.java
        IteratorThreadPoolManager.java
        DatawaveFieldIndexListIteratorJexl.java
        GlobalIndexRangeSamplingIterator.java
        ColumnFamilyRangeIterator.java
        ColumnRangeIterator.java
        DatawaveFieldIndexRangeIteratorJexl.java
        IvaratorException.java
        GlobalIndexFieldSummaryIterator.java
        FieldIndexCountingIteratorPerVisibility.java
        filter
        GlobalIndexDataTypeFilter.java
        GlobalIndexTermMatchingFilter.java
        GlobalIndexDateRangeFilter.java
        CsvKeyFilter.java
        IteratorTimeoutException.java
        org
        apache
        lucene
        queryparser
        flexible
        core
        nodes
        EscapedNodes.java
        NotBooleanQueryNode.java
        FunctionQueryNode.java
        commons
        jexl2
        parser
        ASTUnsatisfiableGENode.java
        JexlNodes.java
        ASTUnsatisfiableERNode.java
        ASTUnsatisfiableLENode.java
        ASTDelayedPredicate.java
        ASTEvaluationOnly.java
        ASTUnknownFieldERNode.java
        ASTUnsatisfiableGTNode.java
        ASTUnsatisfiableLTNode.java
      - test
        resources
        datawave
        query
        EventQueryLogicFactory.xml
        tables
        geo-test-config.xml
        jexl
        functions
        expandedWkt.txt
        ContentFunctionQueryExample.csv
        QueryLogicFactory.xml
        testhadoop.config
        log4j.properties
        TypeMetadataBridgeContext.xml
        MetadataHelperContext.xml
        models
        FakeModelTwo.xml
        FakeModelOne.xml
        CardinalityModel.xml
        TypeMetadataWriterContext.xml
        DATAWAVE_EDGE.xml
        MarkingFunctionsContext.xml
        TypeMetadataProviderContext.xml
        beanRefContext.xml
        database.properties
        CDIProcessor.xml
        EdgeModelContext.xml
        queryBeanRefContext.xml
        input
        max-expansion-cities.csv
        italy-cities.csv
        city-flatten.json
        rome-cities.csv
        null-city.csv
        java-books.csv
        tesla-cars.csv
        london-cities.csv
        paris-cities.csv
        ipaddress.csv
        city-groups.csv
        ford-cars.csv
        usa-cities-dup.csv
        index-hole.csv
        usa-cities.csv
        generic-cities.csv
        multivalue-cities.csv
        java
        datawave
        audit
        SplitSelectorExtractorTest.java
        DatawaveSelectorExtractorTest.java
        helpers
        PrintUtility.java
        mr
        bulk
        RecordIteratorTest.java
        query
        attributes
        AttributeFactoryTest.java
        CompoundJexlQueryTest.java
        IvaratorInterruptTest.java
        DelayedIndexOnlyQueryTest.java
        DataTypeQueryTest.java
        IpAddressQueryTest.java
        language
        parser
        lucene
        TestLuceneUUIDQueryParser.java
        TestLuceneQueryParser.java
        jexl
        JexlControlledQueryParserTest.java
        TestLuceneToJexlParser.java
        TestLuceneToJexlQueryParser.java
        TestLuceneToJexlUUIDQueryParser.java
        TestLuceneToJexlControlledQueryParser.java
        JexlNodeSetTest.java
        IndexHoleQueryTest.java
        RangeQueryTest.java
        index
        lookup
        IndexMatchTest.java
        CreateTLDUidsIteratorTest.java
        RangeStreamTest.java
        CreateUidsIteratorTest.java
        TupleToRangeTest.java
        EntryParserTest.java
        UnionTest.java
        ShardLimitingIteratorTest.java
        IntersectionTest.java
        IndexInfoTest.java
        IfThisTestFailsThenHitTermsAreBroken.java
        FunctionalSetTest.java
        UniqueTest.java
        HitsAreAlwaysIncludedCommonalityTokenTest.java
        MaxExpansionRegexQueryTest.java
        function
        HitsAreAlwaysIncludedTest.java
        AncestorEqualityTest.java
        TLDEqualityTest.java
        PushdownQueryTest.java
        NormalFlattenQueryTest.java
        MiscQueryTest.java
        LuceneQueryTest.java
        ExpansionThresholdQueryTest.java
        iterator
        QueryIteratorTest.java
        logic
        TermFrequencyIndexIteratorTest.java
        AndOrIteratorTest.java
        AndIteratorTest.java
        OrIteratorTest.java
        NegationFilterTest.java
        SourceManagerTest.java
        QueryIteratorIT.java
        ivarator
        IvaratorCacheDirConfigTest.java
        FieldIndexOnlyQueryCompressedOptionsTest.java
        SortedListKeyValueIterator.java
        profile
        QuerySpanTest.java
        QueryOptionsTest.java
        CompositeFunctionsTest.java
        UnindexedNumericQueryTest.java
        TextFunctionQueryTest.java
        tables
        IndexQueryLogicTest.java
        RangeStreamScannerTest.java
        edge
        MockAlternative.java
        TestEdge.java
        BaseEdgeQueryTest.java
        DefaultEdgeEventQueryLogicTest.java
        EdgeQueryFunctionalTest.java
        async
        RangeDefinitionTest.java
        TokensQueryTest.java
        GroupsQueryTest.java
        discovery
        IndexMatchingIteratorTest.java
        DiscoveryLogicTest.java
        DiscoveryIteratorTest.java
        FilterFunctionQueryTest.java
        AnyFieldQueryTest.java
        transformer
        UniqueTransformTest.java
        DocumentTransformerTest.java
        GroupingTest.java
        GroupingTestWithModel.java
        IndexOnlyQueryTest.java
        cardinality
        TestCardinalityWithQuery.java
        TestCardinalityConfiguration.java
        TestCardinalityRecord.java
        TestCardinalityAggregation.java
        testframework
        MaxExpandCityFields.java
        BooksDataManager.java
        CitiesDataType.java
        IpAddrFields.java
        AbstractCityFields.java
        AbstractFunctionalQuery.java
        ShardIdValues.java
        TestFileLoader.java
        MultiValueCityFields.java
        QueryLogicTestHarness.java
        ConfigData.java
        BaseTestManager.java
        AbstractDataManager.java
        AccumuloSetupHelper.java
        ResponseFieldChecker.java
        HadoopTestConfiguration.java
        CSVTestFileLoader.java
        FlattenData.java
        GroupsDataManager.java
        DataTypeHadoopConfig.java
        AbstractDataTypeConfig.java
        cardata
        GenericCarFields.java
        CarDataManager.java
        CarsDataType.java
        AbstractCarFields.java
        FlattenDataManager.java
        BaseRawData.java
        RawData.java
        AbstractFields.java
        FileLoaderFactory.java
        BaseShardIdRange.java
        DataLoader.java
        RawDataManager.java
        FlattenDataType.java
        CityDataManager.java
        IpAddressDataType.java
        JsonTestFileLoader.java
        FieldConfig.java
        GroupsDataType.java
        QueryJexl.java
        BooksDataType.java
        GenericCityFields.java
        AbstractFlattenQuery.java
        GroupsIndexConfiguration.java
        IpAddressDataManager.java
        GroupingAccumuloWriter.java
        RawMetaData.java
        IvaratorYieldingTest.java
        util
        MockMetadataHelper.java
        MockDateIndexHelper.java
        TypeMetadataProviderTest.java
        regex
        RegexTrieTest.java
        VisibilityWiseGuysIngestWithModel.java
        WiseGuysIngest.java
        LimitFieldsTestingIngest.java
        CommonalityTokenTestDataIngest.java
        CompositeTestingIngest.java
        VisibilityWiseGuysIngest.java
        sortedset
        BufferedFileBackedSortedSetTest.java
        BufferedFileBackedKeySortedSetTest.java
        HdfsBackedSortedSetTest.java
        TypeMetadataProviderLoadingCacheTest.java
        DateIndexHelperTest.java
        TypeMetadataTest.java
        JexlNumericQueryTest.java
        jexl
        functions
        EvaluationPhaseFilterFunctionsTest.java
        TermFrequencyAggregatorTest.java
        IdentityAggregatorTest.java
        GeoWaveFunctionsTest.java
        GeoWaveFunctionsDescriptorTest.java
        ContentOrderedEvaluatorTest.java
        GeoFunctionsDescriptorTest.java
        ContentFunctionQueryTest.java
        ContentFunctionsTest.java
        GroupingRequiredFilterFunctionsTest.java
        visitors
        SatisfactionVisitorTest.java
        ExecutableExpansionVisitorTest.java
        RootNegationCheckVisitorTest.java
        DepthVisitorTest.java
        PushdownUnexecutableNodesVisitorTest.java
        QueryPruningVisitorTest.java
        GeoWaveQueryInfoVisitorTest.java
        PushdownNegationVisitorTest.java
        QueryModelVisitorTest.java
        FetchDataTypesVisitorTest.java
        HasTopLevelNegationVisitorTest.java
        BooleanOptimizationRebuildingVisitorTest.java
        HasUnfieldedTermVisitorTest.java
        DateIndexCleanupVisitorTest.java
        HasMethodVisitorTest.java
        ValidPatternVisitorTest.java
        ExpandCompositeTermsTest.java
        CaseSensitivityVisitorTest.java
        IteratorBuildingVisitorTest.java
        RewriteNegationsVisitorTest.java
        RegexFunctionVisitorTest.java
        FieldMissingFromSchemaVisitorTest.java
        DateIndexQueryExpansionVisitorTest.java
        SortedDedupedJexlStringBuildingVisitorTest.java
        AllTermsIndexedVisitorTest.java
        UniqueExpressionTermsVisitorTest.java
        RangeCoalescingVisitorTest.java
        TreeFlatteningRebuildingVisitorTest.java
        ExpandMultiNormalizedTermsTest.java
        TermCountingVisitorTest.java
        EventDataQueryExpressionVisitorTest.java
        ExecutableDeterminationVisitorTest.java
        JexlASTHelperTest.java
        IndexOnlyLazyFetchingSetTest.java
        nodes
        ExceededOrThresholdMarkerJexlNodeTest.java
        QueryPropertyMarkerTest.java
        DatawaveInterpreterTest.java
        QueryTestTableHelper.java
        planner
        CompositeIndexTest.java
        ThreadedRangeBundlerTest.java
        MultiValueCompositeIndexTest.java
        rules
        NodeTransformVisitorTest.java
        GeoSortedQueryDataTest.java
        BooksQueryTest.java
        statsd
        QueryStatsdDClientTest.java
        config
        ShardQueryConfigurationTest.java
        ancestor
        AncestorUidIntersectorTest.java
        AncestorChildExpansionIteratorTest.java
        AncestorQueryIteratorIT.java
        CompositeQueryTest.java
        MaxExpansionQueryTest.java
        data
        parsers
        DatawaveKeyTest.java
        MaxExpansionIndexOnlyQueryTest.java
        CountQueryTest.java
        map
        SimpleQueryGeometryHandlerTest.java
        MixedGeoAndGeoWaveTest.java
        UseOccurrenceToCountInJexlContextTest.java
        GroupedNormalFlattenQueryTest.java
        RegexQueryTest.java
        GroupedFlattenQueryTest.java
        edge
        ExtendedEdgeQueryLogicTest.java
        tld
        TLDFieldIndexAggregatorTest.java
        TLDNormalFlattenQueryTest.java
        TLDTest.java
        TLDQueryIteratorIT.java
        TLDTermFrequencyAggregatorTest.java
        GetStartKeyForRootTest.java
        IvaratorReloadTest.java
        composite
        CompositeUtilsTest.java
        MockAccumuloRecordWriter.java
        tracking
        ActiveQueryLogTest.java
        ranges
        RangeFactoryTest.java
        MultiValueQueryTest.java
        SimpleFlattenQueryTest.java
        predicate
        ChainableEventDataQueryFilterTest.java
        ValueToAttributesTest.java
        TLDEventDataFilterTest.java
        UnevaluatedFieldsQueryTest.java
        FilterFieldsQueryTest.java
        RebuildingScannerTestHelper.java
        core
        iterators
        DataWaveFieldIndexRangeIteratorJexlTest.java
        RangeSplitterTest.java
        DatawaveFieldIndexIteratorJexlTest.java
    - pom.xml
    - .gitignore
  - ingest-scripts
    - src
      - main
        resources
        bin
        util
        recreate-flag-file-from-bulk-load.sh
        split-flag-files.sh
        buildIndexStats.sh
        cleanup_old_files_util.sh
        logging_pdsh.sh
        ingest
        kill-jobs-regex.sh
        map-file-bulk-loader.sh
        start-flag-maker.sh
        seed-index-splits.sh
        bulk-execute.sh
        start-ingest-servers.sh
        check-job-cache.sh
        ingest-libs.sh
        create-shards-since.sh
        start-ingesters.sh
        live-ingest-server.sh
        reset-markers.sh
        live-ingest.sh
        stop-ingest-servers.sh
        create-tomorrows-shards.sh
        start-cleaner.sh
        list-loader.sh
        ingest-env.sh
        start-loader.sh
        execute-ingest.sh
        load-job-cache.sh
        create-edgekey-version-cache.sh
        cleanup-server.py
        stop-ingesters.sh
        generate-splits-file.sh
        list-ingest.sh
        findJars.sh
        bulk-ingest-server.sh
        create-date-index-splits.sh
        create-all-tables.sh
        tables-env.sh
        stop-loader.sh
        live-execute.sh
        job-cache-env.sh
        flag-maker.sh
        bulk-ingest.sh
        send-job-email.sh
        reset-failures.sh
        system
        start-ingest.sh
        stop-all.sh
        stop-ingest.sh
        start-all.sh
        list-all.sh
        list-ingest.sh
        cleanup_old_pdsh_logs.sh
        header.sh
        stop-metrics-ingest.sh
        list-metrics-ingest.sh
        start-metrics-ingest.sh
        metrics
        metrics.sh
        daily-summary.sh
        stop-metrics-ingest.sh
        start-metrics-ingest.sh
        analytic.sh
    - pom.xml
  - ingest-json
    - src
      - main
        java
        datawave
        ingest
        json
        mr
        handler
        ContentJsonColumnBasedHandler.java
        input
        JsonRecordReader.java
        JsonInputFormat.java
        util
        JsonObjectFlattener.java
        JsonObjectFlattenerImpl.java
        config
        helper
        JsonIngestFlattener.java
        JsonDataTypeHelper.java
        JsonIngestHelper.java
      - test
        resources
        log4j.properties
        config
        ingest
        tvmaze-edge-definitions.xml
        tvmaze-ingest-config.xml
        metadata-config.xml
        all-config.xml
        json-ingest-config.xml
        edge-ingest-config.xml
        input
        my.json
        tvmaze-api.json
        tvmaze-seinfeld.json
        flattener-test.json
        java
        datawave
        ingest
        json
        mr
        handler
        ColumnBasedHandlerTestUtil.java
        ContentJsonColumnBasedHandlerTest.java
        MockStatusReporter.java
        input
        JsonRecordReaderTest.java
        util
        JsonObjectFlattenerImplTest.java
        config
        helper
        JsonIngestHelperTest.java
        JsonIngestFlattenerTest.java
    - pom.xml
  - common
    - src
      - main
        java
        datawave
        common
        cl
        OptionBuilder.java
        util
        ArgumentChecker.java
        MultiComparator.java
        concurrent
        BoundedBlockingQueue.java
        io
        Files.java
      - test
        java
        datawave
        common
        cl
        OptionBuilderTest.java
        util
        concurrent
        BoundedBlockingQueueTest.java
        MultiComparatorTest.java
        io
        FilesTest.java
    - pom.xml
    - .gitignore
  - ingest-csv
    - src
      - main
        java
        datawave
        ingest
        csv
        mr
        handler
        ContentCSVColumnBasedHandler.java
        input
        CSVRecordReader.java
        CSVFileInputFormat.java
        CSVReaderBase.java
        config
        helper
        ExtendedCSVIngestHelper.java
        ExtendedCSVHelper.java
      - test
        resources
        log4j.properties
        config
        EdgeSpringConfig.xml
        ingest
        metadata-config.xml
        all-config.xml
        edge-ingest-config.xml
        csv-ingest-config.xml
        input
        my.csv
        java
        datawave
        ingest
        csv
        mr
        handler
        ContentCSVIndexingColumnBasedHandlerTest.java
        ColumnBasedHandlerTestUtil.java
        MockStatusReporter.java
        config
        helper
        ExtendedCSVHelperTest.java
    - pom.xml
  - ingest-configuration
    - src
      - main
        resources
        config
        nyctlc-ingest-config.xml
        myjson-ingest-config.xml
        flag-maker-bulk.xml
        log4j-monitor.xml
        metadata-config.xml
        all-config.xml
        ingest-config.xml
        log4j-metrics.xml
        flag-maker-live.xml
        log4j-flagmaker.xml
        dateindex-ingest-config.xml
        wikipedia-ingest-config.xml
        edge-definitions.xml
        shard-stats-config.xml
        error-ingest-config.xml
        edge-ingest-config.xml
        shard-ingest-config.xml
        container-log4j.properties
        metrics.xml
        configuration.xsl
        mycsv-ingest-config.xml
        META-INF
        services
        datawave.ingest.config.IngestConfiguration
        MarkingFunctionsContext.xml
        JexlFunctionNamespaceRegistryContext.xml
        MaskingFilterContext.xml
        java
        datawave
        ingest
        config
        IngestConfigurationImpl.java
        MimeDecoderImpl.java
    - pom.xml
  - assemble
    - datawave
      - src
        main
        assembly
        dist.xml
      - pom.xml
      - assert
        expected-properties.txt
      - .gitignore
      - doc
        UsefulScripts.html
    - pom.xml
    - webservice
      - src
        main
        java
        datawave
        webservice
        mr
        input
        SecureEventSequenceFileInputFormat.java
        SecureEventSequenceFileRecordReader.java
      - pom.xml
  - balancers
    - src
      - main
        java
        datawave
        ingest
        table
        balancer
        ShardedTableTabletBalancer.java
        ExtentParser.java
        package-info.java
      - test
        java
        datawave
        ingest
        table
        balancer
        ShardedTableTabletBalancerTest.java
    - pom.xml
  - edge-dictionary-core
    - src
      - main
        resources
        META-INF
        beans.xml
        java
        datawave
        webservice
        edgedictionary
        EdgeDictionaryResponseTypeProducer.java
      - test
        resources
        log4j.properties
    - pom.xml
  - core
    - src
      - main
        resources
        CacheContext.xml
        META-INF
        beans.xml
        protobuf
        EdgeData.proto
        Uid.proto
        TermWeight.proto
        compile_protos.sh
        java
        datawave
        configuration
        spring
        SpringBean.java
        iterators
        CountMetadataCombiner.java
        IteratorSettingHelper.java
        filter
        ColumnVisibilityRegexFilter.java
        EdgeColumnQualifierTokenFilter.java
        ColumnVisibilityTokenizingFilter.java
        ColumnFamilyRegexFilter.java
        TokenSpecParser.java
        RegexFilterBase.java
        TokenFilterBase.java
        ColumnVisibilityAndFilter.java
        AgeOffTtlUnits.java
        DateInColQualAgeOffFilter.java
        ConfigurableAgeOffFilter.java
        AgeOffFilterBase.java
        AgeOffConfigParams.java
        ageoff
        MaximumAgeOffFilter.java
        DataTypeAgeOffFilter.java
        FilterRule.java
        FilterOptions.java
        AppliedRule.java
        AgeOffPeriod.java
        FieldAgeOffFilter.java
        TokenTtlTrie.java
        ColumnVisibilityOrFilter.java
        TokenizingFilterBase.java
        ColumnQualifierRegexFilter.java
        policy
        Policy.java
        mr
        bulk
        BulkInputFormat.java
        BulkIteratorEnvironment.java
        split
        FileRangeSplit.java
        RangeSplit.java
        DefaultSplitStrategy.java
        LocationStrategy.java
        SplitStrategy.java
        DefaultLocationStrategy.java
        util
        ObjectFactory.java
        TextUtil.java
        cli
        AccumuloArgs.java
        PasswordConverter.java
        TableName.java
        CounterDump.java
        timely
        TcpClient.java
        UdpClient.java
        AccumuloCounterSource.java
        query
        util
        StringTuple.java
        data
        UUIDType.java
        marking
        MarkingFunctionsFactory.java
        webservice
        query
        util
        LookupUUIDConstants.java
        data
        hash
        SnowflakeUID.java
        UIDBuilder.java
        UID.java
        ZkSnowflakeCache.java
        HashUIDBuilder.java
        HashUID.java
        UIDConstants.java
        SnowflakeUIDBuilder.java
        AbstractUIDBuilder.java
        ingest
        protobuf
        TermWeightPosition.java
        TermWeight.java
        Uid.java
        util
        io
        GzipDetectionUtil.java
        cache
        ReloadableCacheBuilder.java
        watch
        Reloadable.java
        FileSystemWatcher.java
        FileRuleWatcher.java
        CacheId.java
        Loader.java
        data
        config
        ConfigurationHelper.java
        ingest
        AccumuloHelper.java
        mapreduce
        StandaloneStatusReporter.java
        job
        RFileRecordReader.java
        RFileInputFormat.java
        handler
        dateindex
        DateIndexUtil.java
        StandaloneTaskAttemptContext.java
        edge
        protobuf
        EdgeData.java
        util
        EdgeKey.java
        ExtendedHyperLogLogPlus.java
        EdgeValue.java
        EdgeKeyUtil.java
        EdgeKeyDecoder.java
        EdgeValueHelper.java
        model
        EdgeModelAware.java
      - test
        resources
        missing-filter-class.xml
        log4j.properties
        test-root-rules.xml
        test-root-data-type.xml
        EdgeValue.2.x.bytes
        test-root-field.xml
        EdgeValue.3.x.bytes
        test-filter-rules.xml
        test-customized-data-type.xml
        test-customized-field.xml
        test-customized-rules.xml
        java
        datawave
        iterators
        filter
        TokenTtlTrieTest.java
        ConfigurableAgeOffFilterTest.java
        ageoff
        FieldAgeOffFilterTest.java
        util
        cli
        PasswordConverterTest.java
        AccumuloArgsTest.java
        TextUtilTest.java
        data
        hash
        HashUIDTest.java
        SnowflakeUIDTest.java
        UIDTest.java
        ingest
        protobuf
        TermWeightPositionTest.java
        util
        cache
        watch
        TestFilter.java
        TestFieldFilter.java
        FileRuleLoadContentsMergeFiltersTest.java
        TestTrieFilter.java
        TestDataTypeFilter.java
        FileRuleDataTypeMergeTest.java
        FileRuleFieldMergeTest.java
        FileRuleWatcherTest.java
        edge
        util
        EdgeTableTestKeyHelper.java
        EdgeKeyDecoderTest.java
        EdgeValueHelperTest.java
        EdgeValueTest.java
        EdgeKeyTest.java
        ExtendedHyperLogLogPlusTest.java
    - pom.xml
    - .gitignore
  - index-stats
    - src
      - main
        java
        datawave
        mapreduce
        shardStats
        StatsHyperLogReducer.java
        StatsHyperLogMapper.java
        FieldSummary.java
        StatsJob.java
        StatsHyperLogSummary.java
        StatsCounters.java
        HyperLogFieldSummary.java
      - test
        resources
        log4j.properties
        hlParse.sh
        java
        datawave
        mapreduce
        shardStats
        MockReduceDriver.java
        MockMapContext.java
        MockReduceContext.java
        MockMapDriver.java
        StatsHyperLogMapperTest.java
        StatsJobTest.java
        StatsHyperLogReducerTest.java
        MRPair.java
        StatsInit.java
        StatsTestData.java
        StatsHyperLogSummaryTest.java
    - pom.xml
  - regression-testing
    - pom.xml
  - common-test
    - src
      - main
        java
        datawave
        common
        test
        utils
        query
        TestQueries.java
  - ops-tools
    - index-validation
      - src
        main
        java
        datawave
        index
        validation
        AccumuloIndexAgeDisplay.java
        test
        java
        datawave
        index
        validation
        AccumuloIndexAgeDisplayTest.java
      - pom.xml
      - README.txt
      - displayIndexesAge.sh
    - pom.xml
    - config-compare
      - src
        main
        java
        datawave
        configuration
        CompareResult.java
        DataTypeConfigCompare.java
        ConfField.java
        RunCompare.java
        test
        resources
        type2-config.xml
        type1-config.xml
        java
        datawave
        configuration
        DataTypeConfigCompareTest.java
      - pom.xml
      - README.txt
      - compare.sh
  - data-dictionary-core
    - src
      - main
        resources
        META-INF
        beans.xml
        java
        datawave
        webservice
        datadictionary
        DataDictionaryResponseTypeProducer.java
    - pom.xml
  - metrics-core
    - src
      - main
        java
        datawave
        metrics
        keys
        IngestEntryKey.java
        AnalyticEntryKey.java
        InvalidKeyException.java
        XKey.java
        iterators
        LatencyIterator.java
        AnalyticIngestTypeFilter.java
        DataTypeFilter.java
        CountersAggregatingIterator.java
        EventCountIterator.java
        JsonCountersIterator.java
        IngestTypeFilter.java
        MaxAttributeIterator.java
        IngestRateIterator.java
        RowIterator.java
        AnalyticDataTypeFilter.java
        analytic
        FileByteSummaryLoader.java
        HourlyPrecisionHelper.java
        QueryMetricsSummaryLoader.java
        MetricsDailySummaryReducer.java
        MetricsDataFormat.java
        MetricsCorrelatorReducer.java
        IngestMetricsSummaryLoader.java
        Phase.java
        LongArrayWritable.java
        DateConverter.java
        RowPartitioner.java
        FileLatency.java
        util
        Connections.java
        WritableUtil.java
        IntegerAverage.java
        UpgradeCounterValues.java
        config
        MetricsConfig.java
        MetricsOptions.java
        mapreduce
        FlagMakerMetricsMapper.java
        FlagMakerMetricsIngester.java
        IngestMetricsIngester.java
        error
        ProcessingErrorsMapper.java
        ProcessingErrorsReducer.java
        TextSequenceFileCombinerFormat.java
        LoaderMetricsIngester.java
        CombinedSequenceFileRecordReader.java
        util
        JobSetupUtil.java
        EmptyValue.java
        TypeNameConverter.java
        IngestMetricsMapper.java
        NullWritableSequenceFileCombinerFormat.java
        NullRecordReader.java
        LoaderMetricsMapper.java
        MetricsIngester.java
        TextRecordReader.java
      - test
        resources
        log4j.properties
        mapred-site.xml
        metrics.xml
    - pom.xml
    - doc
      - README.txt
- web-services
  - security
    - src
      - main
        resources
        META-INF
        jboss-ejb3.xml
        services
        io.undertow.servlet.ServletExtension
        javax.enterprise.inject.spi.Extension
        beans.xml
        source-templates
        datawave
        security
        cache
        package-info.java
        java
        datawave
        security
        user
        UserOperationsBean.java
        TextMessageBodyWriter.java
        websocket
        WebsocketSecurityConfigurator.java
        WebsocketSecurityInterceptor.java
        authorization
        simple
        DatabaseUserService.java
        test
        TestDatawaveUserService.java
        remote
        RemoteDatawaveUserService.java
        cache
        AccumuloCacheStoreConfiguration.java
        DnList.java
        AccumuloCacheStore.java
        CredentialsCacheBean.java
        AccumuloCacheStoreConfigurationBuilder.java
        system
        ServerSecurityProducer.java
        auth
        DatawaveAuthenticationMechanism.java
        DatawaveCredential.java
        DatawaveServletExtension.java
        login
        DatawaveCertVerifier.java
        DatawaveUsersRolesLoginModule.java
        DatawaveCertRolesLoginModule.java
        ClientCertLoginModule.java
        DatawavePrincipalLoginModule.java
      - test
        resources
        roles.properties
        ca.pkcs12
        log4j.properties
        testUser.pkcs12
        testServer.pkcs12
        users.properties
        TestAuthServiceTestUsers.xml
        testAuthServiceBeanRefContext.xml
        rolesNoIssuer.properties
        dnutils.properties
        springFrameworkBeanRefContext.xml
        java
        datawave
        security
        authorization
        test
        TestDatawaveUserServiceTest.java
        util
        MockDatawaveCertVerifier.java
        MockCallbackHandler.java
        cache
        CredentialsCacheBeanTest.java
        auth
        DatawaveAuthenticationMechanismTest.java
        login
        DatawaveCertVerifierTest.java
        DatawaveUsersRolesLoginModuleTest.java
        DatawavePrincipalLoginModuleTest.java
        DatawaveCertRolesLoginModuleTest.java
        util
        MockInitialContextFactory.java
    - pom.xml
    - .gitignore
  - web-root
    - src
      - main
        webapp
        queryMap.js
        queryMap.css
        screen.css
        WEB-INF
        web.xml
        index.html
    - pom.xml
  - atom
    - src
      - main
        resources
        META-INF
        jboss-ejb3.xml
        beans.xml
        java
        datawave
        webservice
        atom
        jaxrs
        AtomMessageBodyWriter.java
        AtomKeyValueParser.java
        AtomServiceBean.java
      - test
        resources
        log4j.properties
        java
        datawave
        webservice
        atom
        AtomKeyValueParserTest.java
    - pom.xml
  - query-websocket
    - src
      - main
        java
        datawave
        webservice
        websocket
        codec
        QueryResponseMessageJsonEncoder.java
        JsonQueryMessageDecoder.java
        messages
        CreateQueryMessage.java
        CancelMessage.java
        QueryResponseMessage.java
        QueryMessage.java
        QueryWebsocket.java
        webapp
        WEB-INF
        jboss-web.xml
        beans.xml
        web.xml
    - pom.xml
  - dictionary
    - src
      - main
        resources
        META-INF
        jboss-ejb3.xml
        beans.xml
        java
        datawave
        webservice
        dictionary
        DataDictionaryBean.java
        EdgeDictionaryBean.java
    - pom.xml
  - examples
    - client-login
      - src
        main
        resources
        META-INF
        jboss-ejb3.xml
        beans.xml
        java
        datawave
        webservice
        examples
        ClientLoginExampleBean.java
      - pom.xml
      - README
      - .gitignore
    - jms-client
      - src
        main
        resources
        log4j.properties
        jndi.properties
        java
        datawave
        webservice
        streamed
        jms
        client
        StreamDumper.java
      - pom.xml
      - README
    - pom.xml
    - http-client
      - src
        main
        java
        datawave
        webservice
        examples
        JAXBQueryExample.java
        JacksonQueryExample.java
        Options.java
      - pom.xml
      - README.txt
      - bin
        jacksonMetadataQuery.sh
        jaxbMetadataQuery.sh
      - .gitignore
    - query-war
      - src
        main
        webapp
        images
        spinner.gif
        WEB-INF
        jboss-web.xml
        web.xml
        js
        application.js
        json2.js
        index.html
        css
        main.css
        reset.css
      - pom.xml
      - .gitignore
  - pom.xml
  - client
    - src
      - main
        resources
        META-INF
        beans.xml
        source-templates
        datawave
        user
        package-info.java
        webservice
        result
        distributed
        package-info.java
        bulk
        package-info.java
        package-info.java
        results
        edgedictionary
        package-info.java
        mr
        package-info.java
        package-info.java
        ingest
        file
        package-info.java
        datadictionary
        package-info.java
        modification
        package-info.java
        response
        package-info.java
        objects
        package-info.java
        query
        result
        logic
        package-info.java
        metadata
        package-info.java
        rollup
        package-info.java
        package-info.java
        event
        package-info.java
        istat
        package-info.java
        edge
        package-info.java
        util
        package-info.java
        exception
        package-info.java
        package-info.java
        cache
        package-info.java
        metric
        package-info.java
        package-info.java
        model
        package-info.java
        modification
        package-info.java
        protobuf
        query_messages.proto
        metrics_messages.proto
        cachedresult_messages.proto
        compile_protos.sh
        exception_messages.proto
        user_messages.proto
        response_messages.proto
        java
        datawave
        user
        DefaultAuthorizationsList.java
        UserMessages.java
        UserAuthorizations.java
        AuthorizationsListBase.java
        audit
        SelectorExtractor.java
        Constants.java
        webservice
        result
        DefaultMetadataQueryResponse.java
        MetadataQueryResponseBase.java
        BaseQueryResponse.java
        CachedResultsResponse.java
        QueryLogicResponse.java
        QueryWizardStep2Response.java
        QueryWizardResultResponse.java
        bulk
        BulkResultsInfoResponse.java
        BulkResultsInfoResponseList.java
        CachedResultsDescribeResponse.java
        DefaultEventQueryResponse.java
        ResponseMessages.java
        QueryImplListResponse.java
        QueryWizardStep1Response.java
        FacetQueryResponseBase.java
        VoidResponseHtmlMessageBodyWriter.java
        QueryWizardStep3Response.java
        FacetQueryResponse.java
        EventQueryResponseBase.java
        DefaultEdgeQueryResponse.java
        results
        cached
        result
        CachedresultMessages.java
        mr
        MapReduceInfoResponse.java
        JobExecution.java
        WorkflowAlgorithmDescription.java
        ResultFile.java
        MapReduceJobDescription.java
        MapReduceInfoResponseList.java
        ingest
        file
        FileDetails.java
        FileResponseList.java
        modification
        ModificationConfigurationResponse.java
        MutableFieldListResponse.java
        util
        HtmlProviderMessageBodyWriter.java
        AbstractHtmlProviderMessageBodyWriter.java
        ProtostuffMessageBodyWriter.java
        query
        result
        logic
        QueryLogicDescription.java
        rollup
        EdgeSummaryQueryMessage.java
        event
        DefaultFieldCardinality.java
        EventBase.java
        DefaultEvent.java
        DefaultFacets.java
        Metadata.java
        DefaultField.java
        FieldCardinalityBase.java
        FieldBase.java
        FacetsBase.java
        ResponseObjectFactory.java
        istat
        FieldStat.java
        IndexStatsResponse.java
        edge
        EdgeBase.java
        DefaultEdge.java
        EdgeQueryResponseBase.java
        QueryImpl.java
        QueryParametersImpl.java
        Query.java
        QueryParameters.java
        exception
        ExceptionMessages.java
        cachedresults
        CacheableQueryRow.java
        QueryMessages.java
        map
        QueryGeometry.java
        QueryGeometryResponse.java
        cache
        RunningQueries.java
        metric
        QueryMetricsSummaryHtmlResponse.java
        BaseQueryMetric.java
        QueryMetricSummary.java
        QueryMetricListResponse.java
        QueryMetricsDetailListResponse.java
        QueryMetric.java
        MetricsMessages.java
        QueryMetricsSummaryResponse.java
        BaseQueryMetricListResponse.java
        QueryPersistence.java
        model
        Model.java
        FieldMapping.java
        Direction.java
        ModelList.java
        modification
        ModificationRequestBase.java
        ModificationEvent.java
        DefaultUUIDModificationRequest.java
        UUIDEventIdentifier.java
        ModificationEventBase.java
        DefaultModificationRequest.java
        ModificationOperationImpl.java
        ModificationOperation.java
        EventIdentifier.java
        assembly
        dist.xml
      - test
        resources
        log4j.properties
        META-INF
        services
        datawave.data.parser.GeometryParser
        java
        datawave
        user
        UserAuthorizationsTest.java
        DefaultAuthorizationsListTest.java
        webservice
        query
        TestQueryImpl.java
        QueryParametersTest.java
        TestQueryParameters.java
        util
        QueryUncaughtExceptionHandlerTest.java
        data
        ObjectSizeOfTest.java
        metric
        QueryMetricTest.java
    - pom.xml
    - .gitignore
  - rest-api
    - src
      - main
        webapp
        WEB-INF
        jboss-web.xml
        beans.xml
        web.xml
    - pom.xml
  - common
    - src
      - main
        resources
        datawave
        configuration
        spring
        CDIBeanPostProcessor.xml
        META-INF
        jboss-ejb3.xml
        services
        javax.enterprise.inject.spi.Extension
        org.apache.deltaspike.core.api.projectstage.ProjectStageHolder
        beans.xml
        java
        datawave
        configuration
        RefreshableScopeExtension.java
        spring
        SpringCDIExtension.java
        InjectCDIBeanPostProcessor.java
        BeanProvider.java
        ThreadSafeClassPathXmlApplicationContext.java
        DatawaveEmbeddedProjectStageHolder.java
        DatawaveCommonConfigPropertyProducer.java
        RefreshableScopeContext.java
        RefreshEvent.java
        RefreshableScope.java
        RefreshLifecycle.java
        ConfigurationBean.java
        ConfigurationEvent.java
        marking
        SecurityMarkingProducer.java
        webservice
        common
        health
        HealthBean.java
        HealthInfoContributor.java
        DefaultHealthInfoContributor.java
        audit
        DefaultAuditParameterBuilder.java
        AuditService.java
        AuditBean.java
        PrivateAuditConstants.java
        remote
        RemoteAuditor.java
        AuditParameterBuilder.java
        NoOpAuditor.java
        connection
        AccumuloConnectionPool.java
        AccumuloConnectionFactoryBean.java
        AccumuloConnectionFactory.java
        AccumuloConnectionPoolFactory.java
        config
        ConnectionPoolConfiguration.java
        ConnectionPoolsConfiguration.java
        remote
        RemoteHttpService.java
        cache
        AccumuloTableCache.java
        AccumuloTableCacheConfiguration.java
        SharedBooleanListener.java
        SharedTriStateReader.java
        SharedCacheCoordinator.java
        SharedTriStateListener.java
        BaseTableCache.java
        SharedTriState.java
        TableCache.java
        SharedBooleanReader.java
        SharedBoolean.java
        json
        ObjectMapperDecorator.java
        DefaultMapperDecorator.java
        JacksonContextResolver.java
        extjs
        ExtJsResponse.java
        metrics
        MetricsCdiConfiguration.java
      - test
        resources
        log4j.properties
        java
        datawave
        webservice
        common
        audit
        AuditBeanTest.java
        curator
        TestSharedCacheCoordinator.java
        connection
        AccumuloConnectionFactoryTest.java
        cache
        SharedCacheCoordinatorTest.java
    - pom.xml
    - .gitignore
  - deploy
    - configuration
      - src
        main
        resources
        datawave
        security
        TestDatawaveUserServiceConfiguration.xml
        query
        CachedResults.xml
        CachedResults.properties
        QueryMetricsWriter.xml
        QueryMetrics.xml
        QueryExpiration.xml
        CachedResultsCleanup.xml
        QueryLogicFactory.xml
        EdgeQueryLogicFactory.xml
        database.properties
        CachedResultsExpiration.xml
        mapreduce
        MapReduceJobs.xml
        modification
        ExampleModificationServices.xml
        ModificationServices.xml
        MetadataHelperContext.xml
        META-INF
        beans.xml
        MarkingFunctionsContext.xml
        MetadataHelperCacheListenerContext.xml
        JexlFunctionNamespaceRegistryContext.xml
        beanRefContext.xml
      - pom.xml
    - spring-framework-integration
      - src
        test
        resources
        log4j.properties
        test-system-properties.properties
        NoOpMarkingFunctionsContext.xml
        springFrameworkBeanRefContext.xml
        java
        datawave
        springframework
        integration
        WiredQueryExecutorBeanTest.java
      - pom.xml
      - .gitignore
    - pom.xml
    - application
      - src
        main
        application
        META-INF
        jboss-deployment-structure.xml
        wildfly
        overlay
        standalone
        configuration
        h2
        databaseDatawaveUsers.h2.db
        certificates
        testUser.p12
        testServer.p12
        ca.jks
        tools
        queryCreateHisto.py
        cluster_query_summary.sh
        clean_mysql.sh
        modules
        datawave
        webservice
        configuration
        main
        module.xml
        util
        main
        module.xml
        org
        apache
        hadoop
        common
        main
        hadoop-conf
        .gitkeep
        lib
        .gitkeep
        module.xml
        restore-default-wildfly.sh
        setup-wildfly.sh
        add-datawave-configuration.cli
        remove-datawave-configuration.cli
        assert
        expected-properties.txt
        assembly
        dist.xml
      - pom.xml
    - docs
      - src
        main
        webapp
        WEB-INF
        web.xml
      - pom.xml
      - docs
        images
        query_help.html
        js
        app.js
        index.html
        css
        app.css
        dwdocs.css
  - query
    - src
      - main
        resources
        META-INF
        jboss-ejb3.xml
        beans.xml
        java
        datawave
        webservice
        query
        result
        event
        DefaultResponseObjectFactory.java
        configuration
        GenericQueryConfiguration.java
        QueryData.java
        LookupUUIDConfiguration.java
        IdTranslatorConfiguration.java
        logic
        AbstractQueryLogicTransformer.java
        QueryLogic.java
        DatawaveRoleManager.java
        EasyRoleManager.java
        Flushable.java
        QueryLogicFactoryConfiguration.java
        WritesQueryMetrics.java
        WritesResultCardinalities.java
        RoleManager.java
        QueryLogicFactory.java
        QueryLogicTransformer.java
        BaseQueryLogicTransformer.java
        RoleManagerImpl.java
        BaseQueryLogic.java
        composite
        CompositeQueryLogicResultsIterator.java
        CompositeQueryLogicTransformer.java
        CompositeQueryLogic.java
        CompositeQueryLogicResults.java
        QueryLogicFactoryImpl.java
        iterator
        DatawaveTransformIterator.java
        KeyAggregatingTransformIterator.java
        hud
        HudBean.java
        HudQuerySummaryBuilder.java
        HudMetricSummary.java
        HudQuerySummary.java
        HudActiveUser.java
        HudMetricSummaryBuilder.java
        util
        QueryMetricUtil.java
        NextContentCriteria.java
        PostUUIDCriteria.java
        LookupUUIDUtil.java
        UIDQueryCriteria.java
        QueryUtil.java
        QueryMetricsReporter.java
        AbstractUUIDLookupCriteria.java
        QueryParserUtil.java
        GetUUIDCriteria.java
        exception
        EmptyObjectException.java
        runner
        NoOpQueryPredictor.java
        BasicQueryBean.java
        AsyncQueryStatusObserver.java
        QueryExecutorBean.java
        IdTranslatorBean.java
        AccumuloConnectionRequestBean.java
        RunningQuery.java
        QueryExecutor.java
        QueryPredictor.java
        cachedresults
        CacheableLogic.java
        CacheableQueryRowImpl.java
        CacheableQueryRowReader.java
        factory
        Persister.java
        map
        QueryGeometryHandler.java
        interceptor
        QueryMetricsEnrichmentInterceptor.java
        annotation
        EnrichQueryMetrics.java
        cache
        CreatedQueryLogicCacheBean.java
        QueryCache.java
        QueryCacheBean.java
        QueryExpirationBean.java
        QueryExpirationConfiguration.java
        QueryTraceCache.java
        RunningQueryTimingImpl.java
        ClosedQueryCache.java
        AbstractQueryCache.java
        metric
        QueryMetricsBean.java
        QueryMetricHolder.java
        QueryMetricMessage.java
        QueryMetricHandler.java
        QueryMetricsWriter.java
        QueryMetricsWriterConfiguration.java
        NoOpQueryMetricHandler.java
        dashboard
        DashboardBean.java
        DashboardQuery.java
        DashboardFields.java
        DashboardSummary.java
      - test
        resources
        log4j.properties
        TestQueryLogicFactoryWithAuditType.xml
        database.properties
        TestQueryLogicFactory.xml
        java
        datawave
        query
        metrics
        MockQueryMetricHandlerFactory.java
        MockShardTableQueryMetricHandler.java
        webservice
        query
        configuration
        TestLookupUUIDConfiguration.java
        GenericQueryConfigurationMockTest.java
        QueryDataTest.java
        TestBaseQueryLogic.java
        logic
        TestQueryLogic.java
        DatawaveRoleManagerTest.java
        TestLegacyBaseQueryLogicTransformer.java
        composite
        CompositeQueryLogicTest.java
        QueryLogicFactoryBeanTest.java
        iterator
        KeyAggregatingTransformIteratorTest.java
        util
        QueryMetricUtilTest.java
        QueryUtilTest.java
        runner
        ExtendedRunningQueryTest.java
        QueryExecutorBeanTest.java
        RunningQueryTest.java
        interceptor
        QueryMetricsEnrichmentInterceptorTest.java
        cache
        TestQueryLogic.java
        QueryExpirationBeanTest.java
        CreatedQueryLogicCacheBeanTest.java
        RunningQueryTimingImplTest.java
        QueryCacheBeanTest.java
        metric
        TestQueryMetricsBean.java
    - pom.xml
    - .gitignore
  - .gitattributes
  - assert-plugin
    - required-properties.txt
  - map-reduce
    - src
      - main
        resources
        META-INF
        jboss-ejb3.xml
        beans.xml
        java
        datawave
        webservice
        mr
        configuration
        NeedQueryLogicFactory.java
        MapReduceConfiguration.java
        NeedQueryPersister.java
        OozieJobConfiguration.java
        MapReduceJobConfiguration.java
        NeedSecurityDomain.java
        BulkResultsJobConfiguration.java
        NeedAccumuloConnectionFactory.java
        NeedQueryCache.java
        OozieJobConstants.java
        NeedCallerDetails.java
        NeedAccumuloDetails.java
        MapReduceBean.java
        state
        MapReduceStatePersisterBean.java
        bulkresults
        map
        SerializationFormat.java
        ApplicationContextAwareMapper.java
        BulkResultsTableOutputMapper.java
        BulkResultsFileOutputMapper.java
      - test
        resources
        datawave
        mapreduce
        MapReduceJobs.xml
        log4j.properties
        java
        datawave
        webservice
        mr
        state
        MapReduceStatePersisterTest.java
        MapReduceBeanTest.java
    - pom.xml
    - .gitignore
  - map-reduce-embedded
    - src
      - main
        resources
        META-INF
        beans.xml
        java
        datawave
        security
        authorization
        EmbeddedDatawaveUserService.java
        system
        EmbeddedJSSESecurityDomain.java
        EmbeddedServerPrincipalProducer.java
        EmbeddedCallerPrincipalProducer.java
        configuration
        EmbeddedConfigSource.java
        webservice
        common
        connection
        EmbeddedAccumuloConnectionFactory.java
    - pom.xml
  - map-reduce-status
    - src
      - main
        resources
        META-INF
        jboss-ejb3.xml
        beans.xml
        java
        datawave
        webservice
        mr
        status
        MapReduceStatusUpdateBean.java
      - test
        resources
        log4j.properties
    - pom.xml
  - compile_protos.sh
  - model
    - src
      - main
        resources
        META-INF
        jboss-ejb3.xml
        beans.xml
        java
        datawave
        webservice
        query
        model
        ModelKeyParser.java
        ModelBean.java
      - test
        resources
        log4j.properties
        ModelBeanTest_m1.xml
        ModelBeanTest_m2.xml
        java
        datawave
        webservice
        query
        model
        ModelKeyParserTest.java
        ModelBeanTest.java
    - pom.xml
  - cached-results
    - src
      - main
        resources
        META-INF
        jboss-ejb3.xml
        beans.xml
        java
        datawave
        webservice
        results
        cached
        CachedResultsParameters.java
        CachedRunningQuery.java
        CachedResultsBean.java
        query
        database
        CachedResultsCleanupBean.java
        CachedResultsCleanupConfiguration.java
        cache
        CachedResultsExpirationConfiguration.java
        CachedResultsExpirationBean.java
        CachedResultsQueryCacheBean.java
        CachedResultsQueryCache.java
      - test
        resources
        log4j.properties
        java
        datawave
        webservice
        results
        cached
        CachedRunningQueryTest.java
    - pom.xml
    - conf
      - replication_scripts
        cleanup.sh
        export.sh
        import.sh
  - common-util
    - src
      - main
        resources
        META-INF
        services
        javax.enterprise.inject.spi.Extension
        beans.xml
        dnutils.properties
        source-templates
        datawave
        security
        authorization
        package-info.java
        webservice
        common
        result
        package-info.java
        java
        datawave
        security
        authorization
        DatawavePrincipal.java
        DatawaveUserHtmlMessageBodyWriter.java
        util
        DnUtils.java
        AuthorizationsUtil.java
        system
        ServerPrincipal.java
        CallerPrincipal.java
        AuthorizationCache.java
        configuration
        Configuration.java
        ConfigExtension.java
        DatawaveConfigPropertyProducer.java
        DatawavePropertyFileConfigSource.java
        query
        iterator
        QueriesTableAgeOffIterator.java
        webservice
        results
        cached
        CachedResultsConfiguration.java
        common
        result
        AccumuloTableCacheStatus.java
        ConnectionPool.java
        ConnectionFactoryResponse.java
        Connection.java
        TableCache.java
        ConnectionProperty.java
        exception
        PreConditionFailedException.java
        QueryCanceledException.java
        RESTExceptionMapper.java
        DatawaveWebApplicationException.java
        BadRequestException.java
        UnauthorizedException.java
        NoResultsException.java
        NotFoundException.java
        logging
        ThreadLocalLogLevel.java
        ThreadConfigurableLogger.java
        util
        NotEqualPropertyExpressionInterpreter.java
        query
        cache
        ResultsPage.java
        QueryMetricFactory.java
        QueryMetricFactoryImpl.java
        AbstractRunningQuery.java
        metrics
        Constants.java
        accumulo
        iterator
        MatchingKeySkippingIterator.java
        interceptor
        RequiredInterceptor.java
        ResponseInterceptor.java
        annotation
        GenerateQuerySessionId.java
        Required.java
        DateFormat.java
        ClearQuerySessionId.java
        resteasy
        util
        RequiredProcessor.java
        DateFormatter.java
        DateParamConverterProvider.java
        interceptor
        LoggingInterceptor.java
        BaseMethodStatsInterceptor.java
        DatawaveCorsFilter.java
        CreateQuerySessionIDFilter.java
        ClearQuerySessionIDFilter.java
      - test
        resources
        log4j.properties
        dnutils.properties
        java
        datawave
        security
        util
        DnUtilsTest.java
        AuthorizationsUtilTest.java
        common
        result
        ConnectionPoolTest.java
        query
        iterator
        QueriesTableAgeOffIteratorTest.java
        webservice
        common
        exception
        RESTExceptionMapperTest.java
        interceptor
        RequiredInterceptorTest.java
        resteasy
        util
        DateFormatterTest.java
        interceptor
        CreateQuerySessionIDFilterTest.java
    - pom.xml
    - .gitignore
  - .gitignore
  - modification
    - src
      - main
        resources
        META-INF
        jboss-ejb3.xml
        beans.xml
        java
        datawave
        webservice
        modification
        cache
        ModificationCacheMessageBean.java
        ModificationCacheBean.java
        ModificationBean.java
      - test
        resources
        log4j.properties
    - pom.xml
  - accumulo
    - src
      - main
        resources
        META-INF
        jboss-ejb3.xml
        beans.xml
        java
        datawave
        webservice
        operations
        user
        ListUsersBean.java
        LookupBean.java
        StatsBean.java
        ListTablesBean.java
        ListUserPermissionsBean.java
        ListUserAuthorizationsBean.java
        admin
        UpdateBean.java
        TableAdminBean.java
        PermissionsBean.java
        remote
        RemoteLookupService.java
        RemoteAccumuloService.java
        RemoteAdminService.java
        RemoteStatsService.java
    - pom.xml
- .mvn
  - extensions.xml
- .travis.yml
- README.md
- CODEOWNERS
- BUILDME.md
- common-test
  - src
    - main
      - java
        datawave
        test
        helpers
        InterruptibleScanner.java
        MockTableTest.java
        InterruptibleScannerFactory.java
        common
        test
        utils
        query
        RangeFactoryForTests.java
        ProcessUtils.java
        integration
        IntegrationTest.java
        logging
        CommonTestAppender.java
  - pom.xml
  - .gitignore
- .gitlab-ci.yml
- .gitignore
- docs
  - pom.xml
  - enunciate.xml
- contrib
  - datawave-quickstart
    - docker
      - datawave-bootstrap.sh
      - docker-build.sh
      - docker-run.sh
      - docker-entrypoint.sh
      - README.md
      - Dockerfile
      - .dockerignore
    - README.md
    - bin
      - env.sh
      - services
        datawave
        bootstrap-web.sh
        bootstrap.sh
        ingest-examples
        runFMLoadTest.sh
        tvmaze-flagmaker.sh
        tvmaze-api-query.sh
        ingest-tv-shows.sh
        install-ingest.sh
        bootstrap-ingest.sh
        bootstrap-user.sh
        install-web.sh
        test-web
        run.sh
        responses
        EdgeQuery.test
        CreateAndNext.expected
        QueryCloseTest.expected
        QueryMetrics.test
        CreateAndNext.expected
        QueryCloseTest.expected
        NoMetricsResults204.expected
        DiscoveryQuery.test
        CreateQuery.expected
        GetPagedResults.expected
        QueryCloseTest.expected
        GetEffectiveAuthorizations.test
        ListEffectiveAuthsGET.expected
        GetEdgeDictionary.test
        EdgeDictionaryGET.expected
        GetDeployedQueryLogics.test
        ListQueryLogicGET.expected
        EventQueryJexlSyntax.test
        CreateJexlUnfielded.expected
        CreateJexlFielded.expected
        204OnJexlFieldedPage3.expected
        JexlUnfieldedNext.expected
        JexlFieldedPage1.expected
        JexlFieldedPage2.expected
        QueryCloseTest.expected
        ErrorEventQuery.test
        QueryMissingDataError.expected
        QueryCloseTest.expected
        EventQueryJsonGrouped.test
        NoMatchForGroupedSiblings204.expected
        GroupedWithSameGreatgrandparentPage1.expected
        GroupedWithSameGreatgrandparent.expected
        CreateNoMatchForGroupedSiblings.expected
        GroupedWithSameParentPage1.expected
        GroupedWithSameParent.expected
        QueryCloseTest.expected
        EventQueryLuceneSyntax.test
        CreateLuceneFieldedQuery.expected
        LuceneUnfieldedQueryPage1.expected
        204LuceneFieldedQueryPage3.expected
        CreateLuceneUnfieldedQuery.expected
        LuceneFieldedQueryPage2.expected
        QueryCloseTest.expected
        LuceneFieldedQueryPage1.expected
        GetDataDictionary.test
        DataDictionaryGET.expected
        LookupUUID.test
        LookupUnregisteredUidType.expected
        LookupWikipediaByPageId.expected
        LookupWikipediaByPageTitleDNE204.expected
        LookupWikipediaByPageTitle.expected
        EventQuery500Error.test
        IntentionalError.expected
        tests
        EdgeQuery.test
        QueryMetrics.test
        DiscoveryQuery.test
        GetEffectiveAuthorizations.test
        GetDeployedQueryLogics.test
        EventQueryJexlSyntax.test
        ErrorEventQuery.test
        EventQuery400BadRequest.test
        EventQueryJsonGrouped.test
        EventQueryLuceneSyntax.test
        LookupUUID.test
        maven
        bootstrap.sh
        README.md
        hadoop
        bootstrap.sh
        install.sh
        accumulo
        bootstrap.sh
        install.sh
        nifi
        bootstrap.sh
        install.sh
      - common.sh
      - logging.sh
      - query.sh
    - .gitignore
  - README.md

package datawave.ingest.mapreduce.handler.tokenize;

import java.io.IOException;
import java.io.OutputStream;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collection;
import java.util.Collections;
import java.util.HashSet;
import java.util.List;
import java.util.Set;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;
import java.util.regex.Pattern;
import java.util.zip.GZIPOutputStream;

import datawave.ingest.data.RawRecordContainer;
import datawave.ingest.data.config.NormalizedContentInterface;
import datawave.ingest.data.config.NormalizedFieldAndValue;
import datawave.ingest.data.config.ingest.AccumuloHelper;
import datawave.ingest.data.tokenize.DefaultTokenSearch;
import datawave.ingest.data.tokenize.TokenSearch;
import datawave.ingest.data.tokenize.TokenizationHelper;
import datawave.ingest.mapreduce.ContextWrappedStatusReporter;
import datawave.ingest.mapreduce.handler.DataTypeHandler;
import datawave.ingest.mapreduce.handler.ExtendedDataTypeHandler;
import datawave.ingest.mapreduce.handler.shard.AbstractColumnBasedHandler;
import datawave.ingest.mapreduce.handler.shard.ShardedDataTypeHandler;
import datawave.ingest.mapreduce.handler.shard.content.BoundedOffsetQueue;
import datawave.ingest.mapreduce.handler.shard.content.BoundedOffsetQueue.OffsetList;
import datawave.ingest.mapreduce.handler.shard.content.ContentIndexCounters;
import datawave.ingest.mapreduce.handler.shard.content.OffsetQueue;
import datawave.ingest.mapreduce.handler.shard.content.TermAndZone;
import datawave.ingest.mapreduce.job.BulkIngestKey;
import datawave.ingest.mapreduce.job.writer.ContextWriter;
import datawave.ingest.protobuf.TermWeight;
import datawave.ingest.protobuf.Uid;
import datawave.util.TextUtil;

import org.apache.accumulo.core.client.BatchWriter;
import org.apache.accumulo.core.client.BatchWriterConfig;
import org.apache.accumulo.core.client.MutationsRejectedException;
import org.apache.accumulo.core.data.Key;
import org.apache.accumulo.core.data.Mutation;
import org.apache.accumulo.core.data.Value;
import org.apache.accumulo.core.security.ColumnVisibility;
import org.apache.commons.io.output.ByteArrayOutputStream;
import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.StatusReporter;
import org.apache.hadoop.mapreduce.TaskAttemptContext;
import org.apache.hadoop.mapreduce.TaskInputOutputContext;
import org.apache.hadoop.util.bloom.BloomFilter;
import org.apache.log4j.Logger;
import org.apache.lucene.analysis.CharArraySet;
import org.infinispan.commons.util.Base64;

import com.google.common.collect.Multimap;

/**
 * <p>
 * Calling the process method on this DataTypeHandler creates fields representing the tokenized content for text indexing. The process method also calls the
 * processBulk method on the {@link ShardedDataTypeHandler} to create the expected fields for the current {@link RawRecordContainer} object.
 * </p>
 * 
 * <p>
 * This class creates the following Mutations or Key/Values in addition to those created by the {@link ShardedDataTypeHandler}: <br>
 * <br>
 * <table border="1" summary="">
 * <tr>
 * <th>Schema Type</th>
 * <th>Use</th>
 * <th>Row</th>
 * <th>Column Family</th>
 * <th>Column Qualifier</th>
 * <th>Value</th>
 * </tr>
 * <tr>
 * <td>Shard</td>
 * <td>Event Data</td>
 * <td>ShardId</td>
 * <td>DataType\0UID</td>
 * <td>TERM_ZONE\0TERM</td>
 * <td>NULL</td>
 * </tr>
 * <tr>
 * <td>Shard</td>
 * <td>Document content</td>
 * <td>ShardId</td>
 * <td>#ExtendedDataTypeHandler.FULL_CONTENT_COLUMN_FAMILY</td>
 * <td>DataType\0UID</td>
 * <td>Base64 encoded, GZIPed document</td>
 * </tr>
 * </table>
 *
 * <p>
 * The document is not placed into the RawRecordContainer object with the rest of the fields in an attempt to prevent any slow-downs when scanning over the
 * RawRecordContainer objects. Placing them into their own column family also allows a locality group to be set so that they will all be located within the same
 * RFiles and not add additional bloat to the RFiles containing the rest of the shard table.
 *
 * @param <KEYIN>
 * @param <KEYOUT>
 * @param <VALUEOUT>
 */
public abstract class ExtendedContentIndexingColumnBasedHandler<KEYIN,KEYOUT,VALUEOUT> extends AbstractColumnBasedHandler<KEYIN> implements
                ExtendedDataTypeHandler<KEYIN,KEYOUT,VALUEOUT> {
    /*
     * "Offline" mode allows for documents to be written to the context rather than directly to Accumulo. This allows content indexing to run without needing to
     * connect to an active Accumulo instance.
     */
    public static final String OPT_OFFLINE = "content.ingest.documents.offline";
    /*
     * Disabling D column output will prevent document content from being written out in the context or to accumulo.
     */
    public static final String OPT_NO_D_COL = "content.ingest.documents.disable";
    /*
     * base64.dcolumn allows you to turn off base64 gzipped content and store gzipped bytes. If not set, base64 encoding is on by default.
     */
    public static final String OPT_BASE64 = "content.ingest.base64.dcolumn";
    
    private static final Logger log = Logger.getLogger(ExtendedContentIndexingColumnBasedHandler.class);
    
    protected static final String SPACE = " ";
    
    protected ExtendedContentIngestHelper ingestHelper = null;
    
    protected ContentIndexCounters counters = null;
    protected OffsetQueue<Integer> tokenOffsetCache = null;
    protected Set<String> zones = new HashSet<>();
    
    protected boolean eventReplaceMalformedUTF8 = false;
    protected String eventDataTypeName = null;
    protected String eventUid = null;
    protected byte[] shardId = null;
    
    protected boolean offlineDocProcessing = true;
    protected boolean disableDCol = false;
    protected ExecutorService docWriterService;
    protected BatchWriter docWriter;
    
    protected boolean tokenizerTimeWarned = false;
    
    protected boolean useBase64Encoding = true;
    
    protected Set<String> termTypeBlacklist = Collections.emptySet();
    
    protected TokenSearch searchUtil;
    protected CharArraySet stopWords;
    protected Configuration conf;
    
    protected TokenizationHelper tokenHelper = null;
    
    @Override
    public void setup(TaskAttemptContext context) {
        super.setup(context);
        
        conf = context.getConfiguration();
        ingestHelper = (ExtendedContentIngestHelper) getHelper(null);
        tokenHelper = new TokenizationHelper(helper, conf);
        termTypeBlacklist = new HashSet<>(Arrays.asList(tokenHelper.getTermTypeBlacklist()));
        
        counters = new ContentIndexCounters();
        
        offlineDocProcessing = conf.getBoolean(OPT_OFFLINE, true);
        useBase64Encoding = conf.getBoolean(OPT_BASE64, true);
        disableDCol = conf.getBoolean(OPT_NO_D_COL, false);
        
        if (disableDCol) {
            // set this to true so we don't spin up a thread we don't need...
            offlineDocProcessing = true;
            log.info("D Column content storage disabled.");
        }
        
        if (!offlineDocProcessing) {
            docWriterService = Executors.newSingleThreadExecutor();
            try {
                AccumuloHelper accumuloHelper = new AccumuloHelper();
                accumuloHelper.setup(conf);
                
                log.debug("Attempting to create Accumulo connection.");
                docWriter = accumuloHelper.getConnector().createBatchWriter(conf.get("shard.table.name"),
                                new BatchWriterConfig().setMaxLatency(60, TimeUnit.SECONDS).setMaxMemory(100000000L).setMaxWriteThreads(10));
                log.debug("Created connection to Accumulo for asynchronous document storage.");
            } catch (Exception e) {
                log.warn("No document payloads will be written to Accumulo.", e);
                // giving a stub batchwriter means I don't have a bunch of "if(writer != null)"s lying around
                docWriter = new BatchWriter() {
                    @Override
                    public void addMutation(Mutation m) {}
                    
                    @Override
                    public void addMutations(Iterable<Mutation> iterable) throws MutationsRejectedException {}
                    
                    @Override
                    public void flush() throws MutationsRejectedException {}
                    
                    @Override
                    public void close() throws MutationsRejectedException {}
                };
            }
        }
        // The tokens offsets queue is a bounded priority queue that will allow us to cache the
        // highest cardinality offsets up to a predetermined max size
        tokenOffsetCache = new BoundedOffsetQueue<>(tokenHelper.getTokenOffsetCacheMaxSize());
        
        stopWords = tokenHelper.getStopWords();
        
        // TODO: refactor explicit DefaultTokenSearch usage here and get class from config
        searchUtil = TokenSearch.Factory.newInstance(DefaultTokenSearch.class.getCanonicalName(), stopWords, false);
        tokenHelper.configureSearchUtil(searchUtil);
        
        log.info("ExtendedContentIndexingColumnBasedHandler configured.");
    }
    
    /**
     * This method will block until all of the documents have been written to Accumulo, or a timeout has been reached.
     * 
     * TODO make the timeout configurable
     */
    @Override
    public void close(TaskAttemptContext context) {
        super.close(context);
        if (!offlineDocProcessing) {
            try {
                log.info("Attempting to flush document writer.");
                this.docWriterService.shutdown();
                this.docWriterService.awaitTermination(1, TimeUnit.MINUTES);
                this.docWriter.close();
            } catch (InterruptedException | MutationsRejectedException e) {
                log.error("Unable to terminate document writing service!", e);
            }
        }
    }
    
    @Override
    public long process(KEYIN key, RawRecordContainer event, Multimap<String,NormalizedContentInterface> eventFields,
                    TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context, ContextWriter<KEYOUT,VALUEOUT> contextWriter)
                    throws IOException, InterruptedException {
        
        // Hold some event-specific variables to avoid re-processing
        this.shardId = getShardId(event);
        
        if (tokenHelper.isVerboseShardCounters()) {
            context.getCounter("EVENT_SHARD_ID", new String(this.shardId)).increment(1);
        }
        
        this.eventDataTypeName = event.getDataType().outputName();
        this.eventUid = event.getId().toString();
        
        // write the standard set of keys
        Multimap<BulkIngestKey,Value> keys = super.processBulk(key, event, eventFields, new ContextWrappedStatusReporter(context));
        long count = keys.size();
        contextWriter.write(keys, context);
        
        StatusReporter reporter = new ContextWrappedStatusReporter(context);
        
        // gc before we get into the tokenization piece
        keys = null;
        
        // stream the tokens to the context writer here
        count += tokenizeEvent(event, context, contextWriter, reporter);
        
        // return the number of records written
        return count;
    }
    
    public boolean isTokenizerTimeWarned() {
        return tokenizerTimeWarned;
    }
    
    /**
     * Tokenize the event, and write all of the shard, shardIndex, and shardReverseIndex keys out to the context
     * 
     * @param event
     * @param context
     * @param contextWriter
     * @return
     * @throws IOException
     * @throws InterruptedException
     */
    protected abstract long tokenizeEvent(RawRecordContainer event, TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context,
                    ContextWriter<KEYOUT,VALUEOUT> contextWriter, StatusReporter reporter) throws IOException, InterruptedException;
    
    /**
     * Process a term and zone by writting all applicable keys to the context.
     * 
     * @param event
     * @param position
     * @param termAndZone
     * @param alreadyIndexedTerms
     * @param context
     * @param contextWriter
     * @param reporter
     * @throws IOException
     * @throws InterruptedException
     */
    private void processTermAndZone(RawRecordContainer event, int position, TermAndZone termAndZone, BloomFilter alreadyIndexedTerms,
                    TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context, ContextWriter<KEYOUT,VALUEOUT> contextWriter,
                    StatusReporter reporter) throws IOException, InterruptedException {
        
        // Make sure the term length is greater than the minimum allowed length
        if (termAndZone.term.length() < tokenHelper.getTermLengthMinimum()) {
            log.debug("Ignoring token of length " + termAndZone.term.length() + " because it is too short");
            counters.increment(ContentIndexCounters.TOO_SHORT_COUNTER, reporter);
            return;
        }
        
        // Track all tokens (including synonyms) processed
        counters.increment(ContentIndexCounters.ALL_PROCESSED_COUNTER, reporter);
        
        // Normalize the term since it won't be auto-normalized through the eventFields map
        NormalizedFieldAndValue normFnV = new NormalizedFieldAndValue(termAndZone.zone, termAndZone.term);
        Set<NormalizedContentInterface> ncis = this.ingestHelper.normalize(normFnV);
        // nfv = (NormalizedFieldAndValue) this.ingestHelper.normalize(nfv);
        
        for (NormalizedContentInterface nci : ncis) {
            if (!(nci instanceof NormalizedFieldAndValue)) {
                log.warn("Can't handle a " + nci.getClass() + "; must be a NormalizedFieldAndValue.");
            }
            NormalizedFieldAndValue nfv = (NormalizedFieldAndValue) nci;
            byte[] fieldVisibility = getVisibility(event, nfv);
            
            // Build the event column key/value
            createShardEventColumn(event, contextWriter, context, nfv, this.shardId, fieldVisibility);
            
            // Create a index normalized variant of the term and zone for indexing purposes
            TermAndZone indexedTermAndZone = new TermAndZone(nfv.getIndexedFieldValue(), nfv.getIndexedFieldName());
            
            org.apache.hadoop.util.bloom.Key alreadySeen = null;
            if ((alreadyIndexedTerms != null)
                            && alreadyIndexedTerms.membershipTest(alreadySeen = new org.apache.hadoop.util.bloom.Key(indexedTermAndZone.getToken().getBytes()))) {
                if (log.isDebugEnabled()) {
                    log.debug("Not creating index mutations for " + termAndZone + " as we've already created mutations for it.");
                }
                counters.increment(ContentIndexCounters.BLOOM_FILTER_EXISTS, reporter);
            } else if ((tokenOffsetCache != null) && tokenOffsetCache.containsKey(indexedTermAndZone)) {
                if (log.isDebugEnabled()) {
                    log.debug("Not creating index mutations for " + termAndZone + " as we've already created mutations for it.");
                }
                counters.increment(ContentIndexCounters.TOKEN_OFFSET_CACHE_EXISTS, reporter);
            } else {
                // create the index
                createShardIndexColumns(event, contextWriter, context, nfv, this.shardId, fieldVisibility);
                
                if (alreadyIndexedTerms != null) {
                    alreadyIndexedTerms.add(alreadySeen);
                    counters.increment(ContentIndexCounters.BLOOM_FILTER_ADDED, reporter);
                }
            }
            
            // Now add the offset to the token offset queue, and if we overflow then output the overflow
            if (tokenOffsetCache != null) {
                OffsetList<Integer> overflow = tokenOffsetCache.addOffset(indexedTermAndZone, position);
                if (overflow != null) {
                    // no need to normalize as that was already done upon insertion into the token offset cache
                    NormalizedFieldAndValue overflowNfv = new NormalizedFieldAndValue(overflow.termAndZone.zone, overflow.termAndZone.term);
                    byte[] overflowFieldVisibility = getVisibility(event, overflowNfv);
                    
                    // Build the field index key/value
                    createTermFrequencyIndex(event, contextWriter, context, this.shardId, overflowNfv, overflow.offsets, overflowFieldVisibility,
                                    this.ingestHelper.getDeleteMode());
                    counters.increment(ContentIndexCounters.TOKENIZER_OFFSET_CACHE_OVERFLOWS, reporter);
                    counters.incrementValue(ContentIndexCounters.TOKENIZER_OFFSET_CACHE_POSITIONS_OVERFLOWED, overflow.offsets.size(), reporter);
                }
            } else {
                createTermFrequencyIndex(event, contextWriter, context, this.shardId, nfv, Arrays.asList(position), fieldVisibility,
                                this.ingestHelper.getDeleteMode());
            }
        }
    }
    
    protected void buildAllPhrases(ArrayList<Collection<String>> terms, String zone, RawRecordContainer event, int position, BloomFilter alreadyIndexedTerms,
                    TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context, ContextWriter<KEYOUT,VALUEOUT> contextWriter,
                    StatusReporter reporter) throws IOException, InterruptedException {
        if (terms.size() < 2) {
            // An empty list has no tokens/phrases to emit and phrases of length one
            // were already handled
            return;
        }
        StringBuilder sb = new StringBuilder();
        for (String term : terms.get(0)) {
            if (term.length() <= tokenHelper.getTermLengthMinimum()) {
                continue;
            }
            sb.append(term);
            // Need to move the position pointer back by the amount of the phrase lengths
            // accounting for zero-indexing
            completePhrase(sb, terms.subList(1, terms.size()), zone, event, position - (terms.size() - 1), alreadyIndexedTerms, context, contextWriter,
                            reporter);
            
            sb.setLength(0);
        }
    }
    
    private void completePhrase(StringBuilder baseTerm, List<Collection<String>> terms, String zone, RawRecordContainer event, int position,
                    BloomFilter alreadyIndexedTerms, TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context,
                    ContextWriter<KEYOUT,VALUEOUT> contextWriter, StatusReporter reporter) throws IOException, InterruptedException {
        if (terms.isEmpty()) {
            return;
        }
        for (String term : terms.get(0)) {
            if (term == null) {
                continue;
            }
            boolean properLen = term.length() >= tokenHelper.getTermLengthMinimum();
            // Add the current term and emit the phrase if the current term isn't empty
            if (properLen) {
                baseTerm.append(SPACE).append(term);
                
                counters.increment(ContentIndexCounters.PHRASES_PROCESSED_COUNTER, reporter);
                
                processTermAndZone(event, position, new TermAndZone(baseTerm.toString(), zone), alreadyIndexedTerms, context, contextWriter, reporter);
            }
            
            // If we have more terms to add to this phrase, recurse
            if (terms.size() > 1) {
                completePhrase(baseTerm, terms.subList(1, terms.size()), zone, event, position, alreadyIndexedTerms, context, contextWriter, reporter);
            }
            
            // Only remove the space and term if we actually added one
            if (properLen) {
                // Remove the space and the token we appended last
                baseTerm.setLength(baseTerm.length() - 1 - term.length());
            }
        }
    }
    
    static final Pattern EMPTY_PATTERN = Pattern.compile("\\s*");
    
    /**
     * Return true if this term appears to be empty (all spaces)
     *
     * @param term
     * @return true if term is zero or more spaces
     */
    protected static boolean isEmptyTerm(String term) {
        return ((term.isEmpty()) || EMPTY_PATTERN.matcher(term).matches());
    }
    
    /**
     * Creates and writes the BulkIngestKey for the event's field/value to the ContextWriter (instead of the Multimap that the {@link ShardedDataTypeHandler}
     * uses).
     * 
     * @param event
     * @param contextWriter
     * @param context
     * @param nFV
     * @param shardId
     * @param visibility
     * @throws IOException
     * @throws InterruptedException
     */
    protected void createShardEventColumn(RawRecordContainer event, ContextWriter<KEYOUT,VALUEOUT> contextWriter,
                    TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context, NormalizedContentInterface nFV, byte[] shardId,
                    byte[] visibility) throws IOException, InterruptedException {
        
        String fieldName = nFV.getEventFieldName();
        String fieldValue = nFV.getEventFieldValue();
        
        if (this.ingestHelper.isIndexOnlyField(fieldName) || (this.ingestHelper.isCompositeField(fieldName) && !helper.isOverloadedCompositeField(fieldName)))
            return;
        
        if (StringUtils.isEmpty(fieldValue))
            return;
        
        Text colf = new Text(event.getDataType().outputName());
        TextUtil.textAppend(colf, event.getId().toString(), this.eventReplaceMalformedUTF8);
        
        Text colq = new Text(fieldName);
        TextUtil.textAppend(colq, fieldValue, this.ingestHelper.getReplaceMalformedUTF8());
        Key k = createKey(shardId, colf, colq, visibility, event.getDate(), this.ingestHelper.getDeleteMode());
        BulkIngestKey bKey = new BulkIngestKey(new Text(this.getShardTableName()), k);
        contextWriter.write(bKey, DataTypeHandler.NULL_VALUE, context);
    }
    
    /**
     * Creates and writes the BulkIngestKey for the event's field and global indexes to the ContextWriter
     * 
     * @param event
     * @param contextWriter
     * @param context
     * @param nFV
     * @param shardId
     * @param fieldVisibility
     * @throws IOException
     * @throws InterruptedException
     */
    protected void createShardIndexColumns(RawRecordContainer event, ContextWriter<KEYOUT,VALUEOUT> contextWriter,
                    TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context, NormalizedContentInterface nFV, byte[] shardId,
                    byte[] fieldVisibility) throws IOException, InterruptedException {
        
        if (log.isDebugEnabled()) {
            log.debug("Creating a mutation for " + nFV.getIndexedFieldValue() + ':' + nFV.getIndexedFieldName());
        }
        
        // Still need the field index record for the token
        createShardFieldIndexColumn(event, contextWriter, context, nFV, shardId, null, fieldVisibility, this.ingestHelper.getReplaceMalformedUTF8(),
                        this.ingestHelper.getDeleteMode());
        
        // If we're creating index terms
        if ((null != this.getShardIndexTableName()) && this.ingestHelper != null) {
            if (this.ingestHelper.isIndexedField(nFV.getIndexedFieldName())) {
                // Throw it into the index
                createIndexColumn(event, contextWriter, context, nFV, shardId, this.getShardIndexTableName(), fieldVisibility,
                                this.ingestHelper.getReplaceMalformedUTF8(), this.ingestHelper.getDeleteMode());
            }
        }
        
        // If we're creating reverse index terms
        if ((null != this.getShardReverseIndexTableName()) && this.ingestHelper != null) {
            if (this.ingestHelper.isReverseIndexedField(nFV.getIndexedFieldName())) {
                // Throw the reversed term into the reverse index
                NormalizedContentInterface reverseNfv = new NormalizedFieldAndValue(nFV);
                reverseNfv.setIndexedFieldValue(new StringBuilder(nFV.getIndexedFieldValue()).reverse().toString());
                createIndexColumn(event, contextWriter, context, reverseNfv, shardId, this.getShardReverseIndexTableName(), fieldVisibility,
                                this.ingestHelper.getReplaceMalformedUTF8(), this.ingestHelper.getDeleteMode());
            }
        }
    }
    
    /**
     * Writes the document's content into the {@link #FULL_CONTENT_COLUMN_FAMILY} column family. The data is compressed (GZIP) and Base64 encoded before being
     * placed into the value.
     * 
     * @param event
     * @param contextWriter
     * @param context
     * @param reporter
     * @param uid
     * @param visibility
     * @param shardId
     * @param rawValue
     * @throws IOException
     * @throws InterruptedException
     * @throws MutationsRejectedException
     */
    protected void createContentRecord(RawRecordContainer event, ContextWriter<KEYOUT,VALUEOUT> contextWriter,
                    TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context, StatusReporter reporter, Text uid, byte[] visibility,
                    byte[] shardId, byte[] rawValue) throws IOException, InterruptedException, MutationsRejectedException {
        
        Key k = createKey(shardId, new Text(ExtendedDataTypeHandler.FULL_CONTENT_COLUMN_FAMILY), uid, visibility, event.getDate(),
                        this.ingestHelper.getDeleteMode());
        
        ByteArrayOutputStream baos = null;
        Base64.OutputStream b64os = null;
        GZIPOutputStream gzos = null;
        Value value = null;
        try {
            baos = new ByteArrayOutputStream(Math.max(rawValue.length / 2, 1024));
            if (useBase64Encoding) {
                b64os = new Base64.OutputStream(baos, Base64.ENCODE);
            }
            gzos = new GZIPOutputStream(useBase64Encoding ? b64os : baos);
            
            gzos.write(rawValue);
        } finally {
            closeOutputStreams(gzos, b64os, baos);
            if (baos != null) {
                value = new Value(baos.toByteArray());
            }
            gzos = null;
            b64os = null;
            baos = null;
        }
        counters.increment(ContentIndexCounters.CONTENT_RECORDS_CREATED, reporter);
        if (!disableDCol) {
            if (offlineDocProcessing) {
                BulkIngestKey bKey = new BulkIngestKey(new Text(this.getShardTableName()), k);
                contextWriter.write(bKey, value, context);
            } else {
                DocWriter dw = new DocWriter();
                dw.k = k;
                dw.shardId = shardId;
                dw.visibility = visibility;
                dw.value = value;
                this.docWriterService.execute(dw);
            }
        }
    }
    
    /**
     * Ensures all of the output streams are closed
     * 
     * @param streams
     *            order to attempt closing: outermost first, innermost last
     */
    public static void closeOutputStreams(OutputStream... streams) {
        for (OutputStream stream : streams) {
            if (null != stream) {
                try {
                    stream.close();
                    return; // if outermost one closed, then we can stop
                } catch (IOException e) {
                    log.trace("Failed to close stream: " + stream.getClass().getCanonicalName(), e);
                }
            }
        }
    }
    
    /**
     * Used to track tokenization execution time. It's too expensive to perform a call to System.currentTimeMillis() each time we produce a new token, so spawn
     * a thread that increments a counter every 500ms.
     * <p>
     * The main thread will check the counter value each time it produces a new token and thus track the number of ticks that have elapsed.
     */
    protected static class HeartBeatThread extends Thread {
        public static final long INTERVAL = 500; // half second resolution
        public static volatile int counter = 0;
        public static long lastRun;
        
        static {
            new HeartBeatThread().start();
        }
        
        private HeartBeatThread() {
            super("HeartBeatThread");
            setDaemon(true);
        }
        
        public void run() {
            while (true) {
                try {
                    Thread.sleep(INTERVAL);
                } catch (InterruptedException e) {
                    throw new RuntimeException(e);
                }
                
                // verify that we're exeuting in a timely fashion
                // ..if not warn.
                long currentRun = System.currentTimeMillis();
                long delta = currentRun - lastRun;
                if (delta > (INTERVAL * 1.5)) {
                    log.warn("HeartBeatThread starved for cpu, " + "should execute every " + INTERVAL + " ms, " + "latest: " + delta + " ms.");
                }
                lastRun = currentRun;
                counter++;
            }
        }
    }
    
    private class DocWriter implements Runnable {
        Key k;
        byte[] shardId;
        byte[] visibility;
        Value value;
        
        @Override
        public void run() {
            log.debug("Writing out a document of size " + value.get().length + " bytes.");
            Mutation m = new Mutation(new Text(shardId));
            m.put(k.getColumnFamily(), k.getColumnQualifier(), new ColumnVisibility(visibility), k.getTimestamp(), value);
            try {
                docWriter.addMutation(m);
            } catch (MutationsRejectedException e) {
                log.error("Could not write document payload to Accumulo!", e);
            }
        }
    }
    
    // Used to indicate that there was a case where the tokenizer took too
    // long.
    public static class TokenizerTimeoutException extends IOException {
        
        private static final long serialVersionUID = 2307696490675641276L;
        
        public TokenizerTimeoutException(String message) {
            super(message);
        }
    }
    
    /**
     * Creates and writes the BulkIngestKey for the field index to the ContextWriter (instead of the Multimap that the {@link ShardedDataTypeHandler} uses).
     * 
     * @param event
     * @param contextWriter
     * @param context
     * @param nFV
     * @param shardId
     * @param value
     * @param visibility
     * @param replaceMalformedUTF8
     * @param deleteMode
     * @throws IOException
     * @throws InterruptedException
     */
    protected void createShardFieldIndexColumn(RawRecordContainer event, ContextWriter<KEYOUT,VALUEOUT> contextWriter,
                    TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context, NormalizedContentInterface nFV, byte[] shardId,
                    Value value, byte[] visibility, boolean replaceMalformedUTF8, boolean deleteMode) throws IOException, InterruptedException {
        Text colf = new Text("fi");
        TextUtil.textAppend(colf, nFV.getIndexedFieldName(), replaceMalformedUTF8);
        Text colq = new Text(nFV.getIndexedFieldValue());
        TextUtil.textAppend(colq, this.eventDataTypeName, replaceMalformedUTF8);
        TextUtil.textAppend(colq, this.eventUid, replaceMalformedUTF8);
        
        if (value == null) {
            value = DataTypeHandler.NULL_VALUE;
        }
        
        Key k = createKey(shardId, colf, colq, visibility, event.getDate(), deleteMode);
        BulkIngestKey bKey = new BulkIngestKey(new Text(this.getShardTableName()), k);
        contextWriter.write(bKey, value, context);
    }
    
    /**
     * Creates a Term Frequency index key in the "tf" column family.
     * 
     * @param event
     * @param contextWriter
     * @param context
     * @param shardId
     * @param nfv
     * @param offsets
     * @param visibility
     * @param deleteMode
     * @throws IOException
     * @throws InterruptedException
     */
    protected void createTermFrequencyIndex(RawRecordContainer event, ContextWriter<KEYOUT,VALUEOUT> contextWriter,
                    TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context, byte[] shardId, NormalizedFieldAndValue nfv,
                    List<Integer> offsets, byte[] visibility, boolean deleteMode) throws IOException, InterruptedException {
        
        TermWeight.Info.Builder builder = TermWeight.Info.newBuilder();
        for (Integer offset : offsets) {
            builder.addTermOffset(offset);
        }
        Value value = new Value(builder.build().toByteArray());
        
        StringBuilder colq = new StringBuilder(this.eventDataTypeName.length() + this.eventUid.length() + nfv.getIndexedFieldName().length()
                        + nfv.getIndexedFieldValue().length() + 3);
        colq.append(this.eventDataTypeName).append('\u0000').append(this.eventUid).append('\u0000').append(nfv.getIndexedFieldValue()).append('\u0000')
                        .append(nfv.getIndexedFieldName());
        
        BulkIngestKey bKey = new BulkIngestKey(new Text(this.getShardTableName()), new Key(shardId,
                        ExtendedDataTypeHandler.TERM_FREQUENCY_COLUMN_FAMILY.getBytes(), colq.toString().getBytes(), visibility, event.getDate(), deleteMode));
        
        contextWriter.write(bKey, value, context);
    }
    
    /**
     * Creates and writes the BulkIngestKey for the global (reverse) index to the ContextWriter (instead of the Multimap that the {@link ShardedDataTypeHandler}
     * uses).
     * 
     * @param event
     * @param contextWriter
     * @param context
     * @param nFV
     * @param shardId
     * @param tableName
     * @param visibility
     * @param replacedMalformedUTF8
     * @param deleteMode
     * @throws IOException
     * @throws InterruptedException
     */
    protected void createIndexColumn(RawRecordContainer event, ContextWriter<KEYOUT,VALUEOUT> contextWriter,
                    TaskInputOutputContext<KEYIN,? extends RawRecordContainer,KEYOUT,VALUEOUT> context, NormalizedContentInterface nFV, byte[] shardId,
                    Text tableName, byte[] visibility, boolean replacedMalformedUTF8, boolean deleteMode) throws IOException, InterruptedException {
        
        // Shard Global Index Table Structure
        // Row: Field Value
        // Colf: Field Name
        // Colq: Shard Id : DataType
        // Value: UID
        Text colf = new Text(nFV.getIndexedFieldName());
        Text colq = new Text(shardId);
        TextUtil.textAppend(colq, this.eventDataTypeName, replacedMalformedUTF8);
        
        Key k = this.createIndexKey(nFV.getIndexedFieldValue().getBytes(), colf, colq, visibility, event.getDate(), deleteMode);
        
        // Create a UID object for the Value
        Uid.List.Builder uidBuilder = Uid.List.newBuilder();
        uidBuilder.setIGNORE(false);
        if (!deleteMode) {
            uidBuilder.setCOUNT(1);
            uidBuilder.addUID(this.eventUid);
        } else {
            uidBuilder.setCOUNT(-1);
            uidBuilder.addUID(this.eventUid);
        }
        Uid.List uidList = uidBuilder.build();
        Value val = new Value(uidList.toByteArray());
        
        BulkIngestKey bKey = new BulkIngestKey(tableName, k);
        contextWriter.write(bKey, val, context);
    }
}