java source code of TestRemoveOrphanFilesAction

iceberg-master
- jitpack.yml
- spark3
  - src
    - main
      - resources
        META-INF
        services
        org.apache.spark.sql.sources.DataSourceRegister
      - java
        org
        apache
        iceberg
        spark
        SparkFilters.java
        source
        SparkStreamingWrite.java
        SparkBatchWrite.java
        StagedSparkTable.java
        IcebergSource.java
        Stats.java
        SparkBatchScan.java
        SparkWriteBuilder.java
        SparkTable.java
        SparkScanBuilder.java
        SparkSessionCatalog.java
        Spark3Util.java
        SparkCatalog.java
    - test
      - java
        org
        apache
        iceberg
        spark
        source
        TestSparkReadProjection3.java
        TestStructuredStreaming3.java
        TestAvroScan3.java
        TestDataSourceOptions3.java
        TestParquetScan3.java
        TestForwardCompatibility3.java
        TestIdentityPartitionData3.java
        TestSparkDataWrite3.java
        TestIcebergSource.java
        TestSparkDataFile3.java
        TestSparkSchema3.java
        TestDataFrameWrites3.java
        TestPartitionValues3.java
        TestFilteredScan.java
        TestSnapshotSelection3.java
        TestWriteMetricsConfig3.java
- .asf.yaml
- tasks.gradle
- versions.props
- arrow
  - src
    - main
      - java
        org
        apache
        iceberg
        arrow
        ArrowAllocation.java
        vectorized
        IcebergArrowVectors.java
        NullabilityHolder.java
        VectorizedArrowReader.java
        VectorHolder.java
        parquet
        VectorizedPageIterator.java
        VectorizedDictionaryEncodedParquetValuesReader.java
        VectorizedParquetDefinitionLevelReader.java
        VectorizedColumnIterator.java
        BaseVectorizedParquetValuesReader.java
        ArrowSchemaUtil.java
    - test
      - java
        org
        apache
        iceberg
        arrow
        ArrowSchemaUtilTest.java
  - dependencies.lock
- orc
  - src
    - main
      - java
        org
        apache
        iceberg
        orc
        OrcValueReader.java
        ORC.java
        OrcValueReaders.java
        VectorizedRowBatchIterator.java
        IdToOrcName.java
        ExpressionToSearchArgument.java
        OrcSchemaWithTypeVisitor.java
        OrcFileAppender.java
        OrcMetrics.java
        OrcIterable.java
        OrcRowReader.java
        ORCSchemaUtil.java
        OrcValueWriter.java
    - test
      - java
        org
        apache
        iceberg
        orc
        TestExpressionToSearchArgument.java
        TestBuildOrcProjection.java
        TestIdToOrcName.java
        TestORCSchemaUtil.java
  - dependencies.lock
- gradle.properties
- gradle
  - wrapper
    - gradle-wrapper.properties
- examples
  - Convert table to Iceberg.ipynb
- flink
  - src
    - main
      - java
        org
        apache
        iceberg
        flink
        FlinkSchemaUtil.java
        FlinkTypeToType.java
        FlinkTypeVisitor.java
        data
        FlinkParquetReaders.java
        FlinkParquetWriters.java
    - test
      - java
        org
        apache
        iceberg
        flink
        TestFlinkSchemaUtil.java
        data
        RandomData.java
        TestFlinkParquetReaderWriter.java
- site
  - mkdocs.yml
  - README.md
  - docs
    - how-to-release.md
    - getting-started.md
    - img
      - favicon.ico
    - partitioning.md
    - performance.md
    - java-api-quickstart.md
    - configuration.md
    - python-feature-support.md
    - python-quickstart.md
    - releases.md
    - index.md
    - terms.md
    - javadoc
      - master
        package-list
        script.js
        overview-summary.html
        overview-frame.html
        overview-tree.html
        serialized-form.html
        help-doc.html
        constant-values.html
        deprecated-list.html
        allclasses-frame.html
        allclasses-noframe.html
        index.html
        org
        apache
        iceberg
        Schema.html
        package-frame.html
        catalog
        package-frame.html
        package-tree.html
        Namespace.html
        TableIdentifier.html
        package-summary.html
        Catalog.html
        OverwriteFiles.html
        ReplaceManifests.html
        avro
        ValueWriters.html
        package-frame.html
        AvroIterable.html
        LogicalMap.html
        ValueReaders.StructReader.html
        AvroSchemaVisitor.html
        package-tree.html
        ProjectionDatumReader.html
        Avro.WriteBuilder.html
        Avro.html
        UUIDConversion.html
        ValueWriter.html
        ValueWriters.StructWriter.html
        ValueReaders.html
        ValueReader.html
        Avro.ReadBuilder.html
        package-summary.html
        AvroSchemaUtil.html
        SnapshotSummary.Builder.html
        HasTableOperations.html
        LocationProviders.html
        DataFiles.Builder.html
        Transaction.html
        SystemProperties.html
        ManifestWriter.html
        SchemaParser.html
        Filterable.html
        orc
        package-frame.html
        OrcValueReader.html
        ORC.WriteBuilder.html
        OrcMetrics.html
        ORC.ReadBuilder.html
        package-tree.html
        VectorizedRowBatchIterator.html
        OrcValueWriter.html
        ORC.html
        package-summary.html
        TypeConversion.html
        ColumnIdMap.html
        PartitionField.html
        CombinedScanTask.html
        DeleteFiles.html
        ReplacePartitionsOperation.html
        TableMetadataParser.html
        ReplacePartitions.html
        GenericPartitionFieldSummary.html
        SetLocation.html
        Accessor.html
        SnapshotUpdate.html
        package-tree.html
        hadoop
        HadoopFileIO.html
        package-frame.html
        package-tree.html
        HadoopOutputFile.html
        SerializableConfiguration.html
        HadoopTables.html
        HadoopInputFile.html
        package-summary.html
        HadoopTableOperations.html
        BaseMetastoreTables.html
        BaseMetastoreCatalog.html
        TableScan.html
        GenericManifestFile.html
        Metrics.html
        ManifestReader.html
        ScanSummary.html
        RewriteFiles.html
        common
        package-frame.html
        DynClasses.Builder.html
        DynConstructors.html
        DynMethods.UnboundMethod.html
        package-tree.html
        DynFields.UnboundField.html
        DynMethods.StaticMethod.html
        DynMethods.html
        DynMethods.BoundMethod.html
        DynFields.StaticField.html
        DynConstructors.Builder.html
        DynFields.Builder.html
        DynFields.BoundField.html
        DynFields.html
        DynConstructors.Ctor.html
        DynClasses.html
        DynMethods.Builder.html
        package-summary.html
        DataFile.html
        BaseCombinedScanTask.html
        ScanSummary.PartitionMetrics.html
        PendingUpdate.html
        util
        ParallelIterable.html
        package-frame.html
        Tasks.UnrecoverableException.html
        Tasks.Task.html
        ThreadPools.html
        CharSequenceWrapper.html
        BinPacking.ListPacker.html
        BinPacking.PackingIterable.html
        package-tree.html
        ExceptionUtil.html
        Tasks.FailureTask.html
        Exceptions.html
        Tasks.Builder.html
        BinPacking.html
        PropertyUtil.html
        Pair.html
        JsonUtil.html
        ByteBuffers.html
        package-summary.html
        StructLikeWrapper.html
        Tasks.html
        Files.html
        ScanSummary.Builder.html
        TableMetadata.html
        parquet
        ParquetValueReaders.ListReader.html
        package-frame.html
        ParquetValueReaders.ReusableEntry.html
        ParquetValueWriters.RepeatedKeyValueWriter.html
        ParquetDictionaryRowGroupFilter.html
        ParquetValueWriters.RepeatedWriter.html
        ParquetAvroValueReaders.html
        ParquetWriteAdapter.html
        ParquetAvroValueReaders.TimestampMillisReader.html
        TypeToMessageType.html
        package-tree.html
        ParquetValueReaders.html
        ParquetValueReaders.RepeatedKeyValueReader.html
        ParquetValueReaders.StringReader.html
        ParquetUtil.html
        ParquetValueWriters.StructWriter.html
        ParquetValueReaders.IntAsLongReader.html
        ParquetValueReaders.BytesReader.html
        ParquetValueWriters.PrimitiveWriter.html
        ParquetIterable.html
        ColumnIterator.html
        ParquetValueReaders.MapReader.html
        ParquetValueReader.html
        ParquetTypeVisitor.html
        TripleWriter.html
        ParquetSchemaUtil.html
        ParquetValueReaders.UnboxedReader.html
        ParquetAvroWriter.html
        ParquetValueReaders.LongAsDecimalReader.html
        ParquetValueReaders.IntegerAsDecimalReader.html
        ParquetValueWriters.html
        Parquet.WriteBuilder.html
        ParquetValueReaders.RepeatedReader.html
        ParquetAvroReader.html
        Parquet.html
        ParquetValueWriter.html
        ParquetMetricsRowGroupFilter.html
        ParquetValueReaders.FloatAsDoubleReader.html
        ParquetReader.html
        ParquetValueReaders.StructReader.html
        TypeWithSchemaVisitor.html
        ColumnWriter.html
        package-summary.html
        ParquetValueReaders.BinaryAsDecimalReader.html
        ParquetValueReaders.PrimitiveReader.html
        Parquet.ReadBuilder.html
        ParquetAvroValueReaders.TimeMillisReader.html
        RewriteManifests.html
        Rollback.html
        PartitionSpecParser.html
        spark
        package-frame.html
        source
        package-frame.html
        IcebergSource.html
        StreamingWriter.html
        package-tree.html
        package-summary.html
        package-tree.html
        PruneColumnsWithReordering.html
        PruneColumnsWithoutReordering.html
        data
        package-frame.html
        SparkValueReaders.html
        SparkOrcWriter.html
        SparkOrcReader.html
        SparkValueWriters.html
        SparkParquetWriters.html
        package-tree.html
        SparkAvroReader.html
        SparkAvroWriter.html
        SparkParquetReaders.html
        package-summary.html
        SparkSchemaUtil.html
        SparkFilters.html
        package-summary.html
        hacks
        package-frame.html
        package-tree.html
        Hive.html
        package-summary.html
        Tables.html
        expressions
        Projections.html
        Binder.html
        package-frame.html
        Projections.ProjectionEvaluator.html
        BoundPredicate.html
        Literal.html
        Predicate.html
        Expression.html
        Reference.html
        package-tree.html
        NamedReference.html
        Or.html
        Not.html
        ExpressionVisitors.ExpressionVisitor.html
        Evaluator.html
        And.html
        UnboundPredicate.html
        Expressions.html
        True.html
        InclusiveMetricsEvaluator.html
        Expression.Operation.html
        ExpressionVisitors.html
        InclusiveManifestEvaluator.html
        StrictMetricsEvaluator.html
        False.html
        package-summary.html
        ResidualEvaluator.html
        BoundReference.html
        ExpressionVisitors.BoundExpressionVisitor.html
        ManifestFile.html
        FilteredManifest.html
        ConfigProperties.html
        SnapshotSummary.html
        OverwriteData.html
        ManifestFile.PartitionFieldSummary.html
        FileFormat.html
        FileHistory.html
        DataFiles.html
        pig
        package-frame.html
        IcebergStorage.html
        package-tree.html
        IcebergPigInputFormat.IcebergRecordReader.html
        IcebergPigInputFormat.html
        SchemaUtil.html
        package-summary.html
        PigParquetReader.html
        data
        package-frame.html
        avro
        package-frame.html
        DataReader.html
        DataWriter.html
        IcebergEncoder.html
        package-tree.html
        IcebergDecoder.html
        package-summary.html
        IcebergGenerics.html
        package-tree.html
        IcebergGenerics.ScanBuilder.html
        Record.html
        parquet
        package-frame.html
        GenericParquetWriter.html
        package-tree.html
        GenericParquetReaders.html
        package-summary.html
        GenericRecord.html
        package-summary.html
        FileHistory.Builder.html
        types
        package-frame.html
        Types.FixedType.html
        Types.DateType.html
        Types.ListType.html
        Types.TimeType.html
        Type.NestedType.html
        Type.PrimitiveType.html
        Types.UUIDType.html
        TypeUtil.NextID.html
        Types.StructType.html
        TypeUtil.SchemaVisitor.html
        package-tree.html
        Types.IntegerType.html
        Types.BooleanType.html
        Types.DecimalType.html
        Types.LongType.html
        Types.StringType.html
        Types.MapType.html
        Type.html
        Types.DoubleType.html
        Types.TimestampType.html
        TypeUtil.html
        Conversions.html
        Types.BinaryType.html
        Types.FloatType.html
        Types.NestedField.html
        TypeUtil.CustomOrderSchemaVisitor.html
        package-summary.html
        CheckCompatibility.html
        Types.html
        Comparators.html
        IndexByName.html
        Type.TypeID.html
        TableProperties.html
        io
        package-frame.html
        DelegatingOutputStream.html
        CloseableIterable.html
        OutputFile.html
        package-tree.html
        CloseableIterable.ConcatCloseableIterable.html
        LocationProvider.html
        CloseableGroup.html
        InputFile.html
        FileIO.html
        DelegatingInputStream.html
        SeekableInputStream.html
        package-summary.html
        FileAppender.html
        PositionOutputStream.html
        DataOperations.html
        Transactions.html
        hive
        package-frame.html
        HiveCatalogs.html
        package-tree.html
        HiveTables.html
        HiveTypeConverter.html
        RuntimeMetaException.html
        HiveCatalog.html
        package-summary.html
        HiveTableOperations.html
        exceptions
        package-frame.html
        package-tree.html
        NoSuchTableException.html
        RuntimeIOException.html
        CommitFailedException.html
        AlreadyExistsException.html
        package-summary.html
        ValidationException.html
        TableMetadata.SnapshotLogEntry.html
        FileScanTask.html
        SnapshotParser.html
        PartitionSpec.html
        TableOperations.html
        ExpireSnapshots.html
        BaseTable.html
        Table.html
        UpdateSchema.html
        AppendFiles.html
        package-summary.html
        PartitionSpec.Builder.html
        Snapshot.html
        StructLike.html
        Accessors.html
        BaseMetastoreTableOperations.html
        encryption
        EncryptionKeyMetadatas.html
        package-frame.html
        PlaintextEncryptionManager.html
        package-tree.html
        EncryptedOutputFile.html
        EncryptionManager.html
        EncryptedInputFile.html
        package-summary.html
        EncryptedFiles.html
        EncryptionKeyMetadata.html
        transforms
        package-frame.html
        Transforms.html
        package-tree.html
        Transform.html
        PartitionSpecVisitor.html
        package-summary.html
        UpdateProperties.html
        ScanTask.html
        events
        package-frame.html
        ScanEvent.html
        Listener.html
        package-tree.html
        Listeners.html
        package-summary.html
        UpdateLocation.html
        stylesheet.css
      - 0.8.0-incubating
        package-list
        script.js
        overview-summary.html
        overview-frame.html
        overview-tree.html
        serialized-form.html
        help-doc.html
        constant-values.html
        deprecated-list.html
        allclasses-frame.html
        allclasses-noframe.html
        index.html
        org
        apache
        iceberg
        Schema.html
        package-frame.html
        catalog
        package-frame.html
        package-tree.html
        Namespace.html
        TableIdentifier.html
        package-summary.html
        Catalog.html
        SupportsNamespaces.html
        OverwriteFiles.html
        avro
        ValueWriters.html
        package-frame.html
        AvroIterable.html
        LogicalMap.html
        ValueReaders.StructReader.html
        AvroSchemaVisitor.html
        package-tree.html
        ProjectionDatumReader.html
        Avro.WriteBuilder.html
        Avro.html
        UUIDConversion.html
        ValueWriter.html
        ValueWriters.StructWriter.html
        ValueReaders.html
        ValueReader.html
        Avro.ReadBuilder.html
        package-summary.html
        AvroSchemaWithTypeVisitor.html
        AvroSchemaUtil.html
        SnapshotSummary.Builder.html
        DataFilesTable.FilesTableScan.html
        HasTableOperations.html
        LocationProviders.html
        DataFiles.Builder.html
        Transaction.html
        SystemProperties.html
        ManifestWriter.html
        SchemaParser.html
        arrow
        package-frame.html
        package-tree.html
        ArrowSchemaUtil.html
        vectorized
        package-frame.html
        IcebergArrowVectors.html
        NullabilityHolder.html
        IcebergArrowVectors.VarcharArrowVector.html
        package-tree.html
        IcebergArrowVectors.DecimalArrowVector.html
        VectorizedArrowReader.html
        parquet
        package-frame.html
        VectorizedPageIterator.html
        package-tree.html
        VectorizedDictionaryEncodedParquetValuesReader.html
        BaseVectorizedParquetValuesReader.html
        VectorizedColumnIterator.html
        package-summary.html
        VectorizedParquetDefinitionLevelReader.html
        VectorHolder.html
        IcebergArrowVectors.VarBinaryArrowVector.html
        package-summary.html
        package-summary.html
        Filterable.html
        ManifestFiles.html
        orc
        package-frame.html
        OrcValueReader.html
        ORC.WriteBuilder.html
        ORCSchemaUtil.LongType.html
        OrcMetrics.html
        ORC.ReadBuilder.html
        package-tree.html
        VectorizedRowBatchIterator.html
        ORCSchemaUtil.html
        OrcValueWriter.html
        ORCSchemaUtil.BinaryType.html
        ORC.html
        package-summary.html
        ManifestsTable.html
        PartitionField.html
        CombinedScanTask.html
        actions
        package-frame.html
        RewriteManifestsAction.html
        package-tree.html
        RemoveOrphanFilesAction.html
        Actions.html
        Action.html
        RewriteManifestsActionResult.html
        SnapshotUpdateAction.html
        package-summary.html
        DeleteFiles.html
        TableMetadataParser.html
        ReplacePartitions.html
        mapping
        package-frame.html
        MappedField.html
        MappedFields.html
        package-tree.html
        NameMappingParser.html
        NameMapping.html
        package-summary.html
        MappingUtil.html
        GenericPartitionFieldSummary.html
        SetLocation.html
        Accessor.html
        AllManifestsTable.html
        SnapshotUpdate.html
        package-tree.html
        hadoop
        HadoopFileIO.html
        package-frame.html
        HiddenPathFilter.html
        package-tree.html
        HadoopOutputFile.html
        SerializableConfiguration.html
        HadoopTables.html
        HadoopInputFile.html
        package-summary.html
        Util.html
        HadoopTableOperations.html
        HadoopCatalog.html
        AllManifestsTable.AllManifestsTableScan.html
        BaseMetastoreCatalog.html
        TableScan.html
        GenericManifestFile.html
        Metrics.html
        ManifestReader.html
        MetricsModes.Truncate.html
        TableMetadata.MetadataLogEntry.html
        ScanSummary.html
        MetricsModes.MetricsMode.html
        MetricsModes.html
        RewriteFiles.html
        SnapshotManager.html
        common
        package-frame.html
        DynClasses.Builder.html
        DynConstructors.html
        DynMethods.UnboundMethod.html
        package-tree.html
        DynFields.UnboundField.html
        DynMethods.StaticMethod.html
        DynMethods.html
        DynMethods.BoundMethod.html
        DynFields.StaticField.html
        DynConstructors.Builder.html
        DynFields.Builder.html
        DynFields.BoundField.html
        DynFields.html
        DynConstructors.Ctor.html
        DynClasses.html
        DynMethods.Builder.html
        package-summary.html
        HistoryEntry.html
        DataFile.html
        mr
        package-frame.html
        package-tree.html
        SerializationUtil.html
        package-summary.html
        mapreduce
        package-frame.html
        package-tree.html
        IcebergInputFormat.html
        IcebergInputFormat.ConfigBuilder.html
        package-summary.html
        MetricsConfig.html
        BaseCombinedScanTask.html
        PartitionsTable.html
        ScanSummary.PartitionMetrics.html
        PendingUpdate.html
        util
        BinaryUtil.html
        ParallelIterable.html
        package-frame.html
        CharSequenceSet.html
        Tasks.UnrecoverableException.html
        Tasks.Task.html
        WapUtil.html
        ThreadPools.html
        CharSequenceWrapper.html
        SnapshotUtil.html
        BinPacking.ListPacker.html
        BinPacking.PackingIterable.html
        package-tree.html
        ExceptionUtil.html
        Tasks.FailureTask.html
        Exceptions.html
        Tasks.Builder.html
        BinPacking.html
        PropertyUtil.html
        Pair.html
        PartitionUtil.html
        JsonUtil.html
        ManifestFileUtil.html
        ByteBuffers.html
        SerializableSupplier.html
        package-summary.html
        StructLikeWrapper.html
        UnicodeUtil.html
        Tasks.html
        Files.html
        FindFiles.Builder.html
        ScanSummary.Builder.html
        MetricsModes.Counts.html
        TableMetadata.html
        parquet
        ParquetValueReaders.ListReader.html
        package-frame.html
        ParquetValueReaders.ReusableEntry.html
        BaseColumnIterator.html
        ParquetValueWriters.RepeatedKeyValueWriter.html
        ParquetDictionaryRowGroupFilter.html
        ParquetValueWriters.RepeatedWriter.html
        ParquetAvroValueReaders.html
        ParquetWriteAdapter.html
        ParquetAvroValueReaders.TimestampMillisReader.html
        TypeToMessageType.html
        package-tree.html
        VectorizedReader.html
        BasePageIterator.html
        ParquetValueReaders.html
        ParquetValueReaders.RepeatedKeyValueReader.html
        ParquetValueReaders.StringReader.html
        ParquetUtil.html
        ParquetValueWriters.StructWriter.html
        ParquetValueReaders.IntAsLongReader.html
        ParquetValueReaders.BytesReader.html
        ParquetValueWriters.PrimitiveWriter.html
        VectorizedParquetReader.html
        ParquetIterable.html
        ColumnIterator.html
        ParquetValueReaders.MapReader.html
        ParquetValueReader.html
        ParquetTypeVisitor.html
        TripleWriter.html
        BasePageIterator.IntIterator.html
        ParquetSchemaUtil.html
        ParquetValueReaders.UnboxedReader.html
        ParquetAvroWriter.html
        ParquetValueReaders.LongAsDecimalReader.html
        ParquetValueReaders.IntegerAsDecimalReader.html
        ParquetValueWriters.html
        Parquet.WriteBuilder.html
        ParquetValueReaders.RepeatedReader.html
        ValuesAsBytesReader.html
        ParquetAvroReader.html
        Parquet.html
        ParquetValueWriter.html
        ParquetMetricsRowGroupFilter.html
        ParquetValueReaders.FloatAsDoubleReader.html
        ParquetReader.html
        ParquetValueReaders.StructReader.html
        TypeWithSchemaVisitor.html
        ColumnWriter.html
        package-summary.html
        ParquetValueReaders.BinaryAsDecimalReader.html
        ParquetValueReaders.PrimitiveReader.html
        Parquet.ReadBuilder.html
        ParquetAvroValueReaders.TimeMillisReader.html
        RewriteManifests.html
        Rollback.html
        DataTask.html
        PartitionSpecParser.html
        spark
        package-frame.html
        source
        package-frame.html
        IcebergSource.html
        StreamingWriter.html
        package-tree.html
        package-summary.html
        package-tree.html
        PruneColumnsWithReordering.html
        PruneColumnsWithoutReordering.html
        data
        package-frame.html
        SparkValueReaders.html
        SparkOrcWriter.html
        SparkOrcReader.html
        SparkValueWriters.html
        SparkParquetWriters.html
        package-tree.html
        SparkAvroReader.html
        SparkAvroWriter.html
        SparkParquetReaders.html
        package-summary.html
        SparkSchemaUtil.html
        SparkDataFile.html
        SparkFilters.html
        package-summary.html
        SparkValueConverter.html
        SparkStructLike.html
        AllDataFilesTable.html
        TableMetadataParser.Codec.html
        Tables.html
        MetadataTableType.html
        expressions
        Projections.html
        Binder.html
        package-frame.html
        UnboundTransform.html
        Projections.ProjectionEvaluator.html
        BoundPredicate.html
        Literal.html
        Predicate.html
        Expression.html
        Term.html
        Reference.html
        package-tree.html
        NamedReference.html
        Or.html
        Not.html
        ExpressionVisitors.ExpressionVisitor.html
        ExpressionVisitors.BoundVisitor.html
        Evaluator.html
        And.html
        UnboundPredicate.html
        UnboundTerm.html
        Expressions.html
        BoundTerm.html
        True.html
        InclusiveMetricsEvaluator.html
        BoundSetPredicate.html
        Expression.Operation.html
        ExpressionVisitors.html
        Bound.html
        Unbound.html
        BoundLiteralPredicate.html
        StrictMetricsEvaluator.html
        False.html
        BoundTransform.html
        package-summary.html
        ResidualEvaluator.html
        BoundReference.html
        BoundUnaryPredicate.html
        ManifestEvaluator.html
        ExpressionVisitors.BoundExpressionVisitor.html
        ManifestFile.html
        FilteredManifest.html
        SnapshotSummary.html
        ManifestFile.PartitionFieldSummary.html
        AllEntriesTable.html
        FileFormat.html
        FileHistory.html
        DataFiles.html
        pig
        package-frame.html
        IcebergStorage.html
        package-tree.html
        IcebergPigInputFormat.IcebergRecordReader.html
        IcebergPigInputFormat.html
        SchemaUtil.html
        package-summary.html
        PigParquetReader.html
        data
        package-frame.html
        avro
        package-frame.html
        DataReader.html
        DataWriter.html
        IcebergEncoder.html
        package-tree.html
        IcebergDecoder.html
        package-summary.html
        orc
        package-frame.html
        package-tree.html
        GenericOrcWriter.html
        GenericOrcReader.html
        package-summary.html
        IcebergGenerics.html
        package-tree.html
        IcebergGenerics.ScanBuilder.html
        Record.html
        parquet
        package-frame.html
        GenericParquetWriter.html
        package-tree.html
        GenericParquetReaders.html
        package-summary.html
        DateTimeUtil.html
        GenericRecord.html
        package-summary.html
        FileHistory.Builder.html
        FindFiles.html
        types
        package-frame.html
        Types.FixedType.html
        Types.DateType.html
        Types.ListType.html
        Types.TimeType.html
        Type.NestedType.html
        Type.PrimitiveType.html
        Types.UUIDType.html
        TypeUtil.NextID.html
        Types.StructType.html
        TypeUtil.SchemaVisitor.html
        package-tree.html
        Types.IntegerType.html
        Types.BooleanType.html
        Types.DecimalType.html
        Types.LongType.html
        Types.StringType.html
        Types.MapType.html
        Type.html
        Types.DoubleType.html
        Types.TimestampType.html
        TypeUtil.html
        Conversions.html
        Types.BinaryType.html
        Types.FloatType.html
        Types.NestedField.html
        TypeUtil.CustomOrderSchemaVisitor.html
        package-summary.html
        CheckCompatibility.html
        Types.html
        Comparators.html
        IndexByName.html
        Type.TypeID.html
        TableProperties.html
        ManageSnapshots.html
        DataTableScan.html
        io
        package-frame.html
        DelegatingOutputStream.html
        CloseableIterable.html
        OutputFile.html
        package-tree.html
        CloseableIterable.ConcatCloseableIterable.html
        LocationProvider.html
        CloseableGroup.html
        InputFile.html
        FileIO.html
        DelegatingInputStream.html
        SeekableInputStream.html
        package-summary.html
        FileAppender.html
        PositionOutputStream.html
        DataOperations.html
        DataFilesTable.html
        BaseOverwriteFiles.html
        Transactions.html
        AllDataFilesTable.AllDataFilesTableScan.html
        hive
        package-frame.html
        HiveClientPool.html
        HiveCatalogs.html
        package-tree.html
        HiveTypeConverter.html
        ClientPool.Action.html
        RuntimeMetaException.html
        HiveCatalog.html
        ClientPool.html
        package-summary.html
        HiveTableOperations.html
        exceptions
        package-frame.html
        package-tree.html
        NoSuchTableException.html
        RuntimeIOException.html
        NotFoundException.html
        CommitFailedException.html
        NamespaceNotEmptyException.html
        NoSuchNamespaceException.html
        AlreadyExistsException.html
        package-summary.html
        CherrypickAncestorCommitException.html
        DuplicateWAPCommitException.html
        ValidationException.html
        TableMetadata.SnapshotLogEntry.html
        FileScanTask.html
        MetricsModes.Full.html
        ManifestEntriesTable.html
        SnapshotParser.html
        BaseRewriteManifests.html
        PartitionSpec.html
        TableOperations.html
        ExpireSnapshots.html
        CachingCatalog.html
        BaseTable.html
        Table.html
        UpdateSchema.html
        AppendFiles.html
        package-summary.html
        PartitionSpec.Builder.html
        BaseReplacePartitions.html
        SnapshotsTable.html
        Snapshot.html
        StructLike.html
        Accessors.html
        HistoryTable.html
        BaseMetastoreTableOperations.html
        encryption
        EncryptionKeyMetadatas.html
        package-frame.html
        PlaintextEncryptionManager.html
        package-tree.html
        EncryptedOutputFile.html
        EncryptionManager.html
        EncryptedInputFile.html
        package-summary.html
        EncryptedFiles.html
        EncryptionKeyMetadata.html
        transforms
        package-frame.html
        UnknownTransform.html
        Transforms.html
        package-tree.html
        Transform.html
        PartitionSpecVisitor.html
        package-summary.html
        UpdateProperties.html
        ScanTask.html
        events
        package-frame.html
        ScanEvent.html
        Listener.html
        package-tree.html
        Listeners.html
        package-summary.html
        GenericManifestFile.CopyBuilder.html
        MetricsModes.None.html
        UpdateLocation.html
        stylesheet.css
      - index.html
      - 0.7.0-incubating
        package-list
        script.js
        overview-summary.html
        overview-frame.html
        overview-tree.html
        serialized-form.html
        help-doc.html
        constant-values.html
        deprecated-list.html
        allclasses-frame.html
        allclasses-noframe.html
        index.html
        org
        apache
        iceberg
        Schema.html
        package-frame.html
        catalog
        package-frame.html
        package-tree.html
        Namespace.html
        TableIdentifier.html
        package-summary.html
        Catalog.html
        OverwriteFiles.html
        avro
        ValueWriters.html
        package-frame.html
        AvroIterable.html
        LogicalMap.html
        ValueReaders.StructReader.html
        AvroSchemaVisitor.html
        package-tree.html
        ProjectionDatumReader.html
        Avro.WriteBuilder.html
        Avro.html
        UUIDConversion.html
        ValueWriter.html
        ValueWriters.StructWriter.html
        ValueReaders.html
        ValueReader.html
        Avro.ReadBuilder.html
        package-summary.html
        AvroSchemaUtil.html
        SnapshotSummary.Builder.html
        DataFilesTable.FilesTableScan.html
        HasTableOperations.html
        LocationProviders.html
        DataFiles.Builder.html
        Transaction.html
        SystemProperties.html
        ManifestWriter.html
        SchemaParser.html
        Filterable.html
        orc
        package-frame.html
        OrcValueReader.html
        ORC.WriteBuilder.html
        OrcMetrics.html
        ORC.ReadBuilder.html
        package-tree.html
        VectorizedRowBatchIterator.html
        OrcValueWriter.html
        ORC.html
        package-summary.html
        TypeConversion.html
        ColumnIdMap.html
        ManifestsTable.html
        PartitionField.html
        CombinedScanTask.html
        DeleteFiles.html
        TableMetadataParser.html
        ReplacePartitions.html
        mapping
        package-frame.html
        MappedField.html
        MappedFields.html
        package-tree.html
        NameMappingParser.html
        NameMapping.html
        package-summary.html
        MappingUtil.html
        GenericPartitionFieldSummary.html
        SetLocation.html
        Accessor.html
        SnapshotUpdate.html
        package-tree.html
        hadoop
        HadoopFileIO.html
        package-frame.html
        package-tree.html
        HadoopOutputFile.html
        SerializableConfiguration.html
        HadoopTables.html
        HadoopInputFile.html
        package-summary.html
        HadoopTableOperations.html
        BaseMetastoreCatalog.html
        TableScan.html
        GenericManifestFile.html
        Metrics.html
        ManifestReader.html
        MetricsModes.Truncate.html
        ScanSummary.html
        MetricsModes.MetricsMode.html
        MetricsModes.html
        RewriteFiles.html
        common
        package-frame.html
        DynClasses.Builder.html
        DynConstructors.html
        DynMethods.UnboundMethod.html
        package-tree.html
        DynFields.UnboundField.html
        DynMethods.StaticMethod.html
        DynMethods.html
        DynMethods.BoundMethod.html
        DynFields.StaticField.html
        DynConstructors.Builder.html
        DynFields.Builder.html
        DynFields.BoundField.html
        DynFields.html
        DynConstructors.Ctor.html
        DynClasses.html
        DynMethods.Builder.html
        package-summary.html
        HistoryEntry.html
        DataFile.html
        MetricsConfig.html
        BaseCombinedScanTask.html
        ScanSummary.PartitionMetrics.html
        PendingUpdate.html
        util
        BinaryUtil.html
        ParallelIterable.html
        package-frame.html
        Tasks.UnrecoverableException.html
        Tasks.Task.html
        ThreadPools.html
        CharSequenceWrapper.html
        SnapshotUtil.html
        BinPacking.ListPacker.html
        BinPacking.PackingIterable.html
        package-tree.html
        ExceptionUtil.html
        Tasks.FailureTask.html
        Exceptions.html
        Tasks.Builder.html
        BinPacking.html
        PropertyUtil.html
        Pair.html
        JsonUtil.html
        ManifestFileUtil.html
        ByteBuffers.html
        package-summary.html
        StructLikeWrapper.html
        UnicodeUtil.html
        Tasks.html
        Files.html
        FindFiles.Builder.html
        ScanSummary.Builder.html
        MetricsModes.Counts.html
        TableMetadata.html
        parquet
        ParquetValueReaders.ListReader.html
        package-frame.html
        ParquetValueReaders.ReusableEntry.html
        ParquetValueWriters.RepeatedKeyValueWriter.html
        ParquetDictionaryRowGroupFilter.html
        ParquetValueWriters.RepeatedWriter.html
        ParquetAvroValueReaders.html
        ParquetWriteAdapter.html
        ParquetAvroValueReaders.TimestampMillisReader.html
        TypeToMessageType.html
        package-tree.html
        ParquetValueReaders.html
        ParquetValueReaders.RepeatedKeyValueReader.html
        ParquetValueReaders.StringReader.html
        ParquetUtil.html
        ParquetValueWriters.StructWriter.html
        ParquetValueReaders.IntAsLongReader.html
        ParquetValueReaders.BytesReader.html
        ParquetValueWriters.PrimitiveWriter.html
        ParquetIterable.html
        ColumnIterator.html
        ParquetValueReaders.MapReader.html
        ParquetValueReader.html
        ParquetTypeVisitor.html
        TripleWriter.html
        ParquetSchemaUtil.html
        ParquetValueReaders.UnboxedReader.html
        ParquetAvroWriter.html
        ParquetValueReaders.LongAsDecimalReader.html
        ParquetValueReaders.IntegerAsDecimalReader.html
        ParquetValueWriters.html
        Parquet.WriteBuilder.html
        ParquetValueReaders.RepeatedReader.html
        ParquetAvroReader.html
        Parquet.html
        ParquetValueWriter.html
        ParquetMetricsRowGroupFilter.html
        ParquetValueReaders.FloatAsDoubleReader.html
        ParquetReader.html
        ParquetValueReaders.StructReader.html
        TypeWithSchemaVisitor.html
        ColumnWriter.html
        package-summary.html
        ParquetValueReaders.BinaryAsDecimalReader.html
        ParquetValueReaders.PrimitiveReader.html
        Parquet.ReadBuilder.html
        ParquetAvroValueReaders.TimeMillisReader.html
        RewriteManifests.html
        Rollback.html
        DataTask.html
        PartitionSpecParser.html
        spark
        package-frame.html
        source
        package-frame.html
        IcebergSource.html
        StreamingWriter.html
        package-tree.html
        package-summary.html
        package-tree.html
        PruneColumnsWithReordering.html
        PruneColumnsWithoutReordering.html
        data
        package-frame.html
        SparkValueReaders.html
        SparkOrcWriter.html
        SparkOrcReader.html
        SparkValueWriters.html
        SparkParquetWriters.html
        package-tree.html
        SparkAvroReader.html
        SparkAvroWriter.html
        SparkParquetReaders.html
        package-summary.html
        SparkSchemaUtil.html
        SparkFilters.html
        package-summary.html
        hacks
        package-frame.html
        package-tree.html
        Hive.html
        package-summary.html
        TableMetadataParser.Codec.html
        Tables.html
        MetadataTableType.html
        expressions
        Projections.html
        Binder.html
        package-frame.html
        Projections.ProjectionEvaluator.html
        BoundPredicate.html
        Literal.html
        Predicate.html
        Expression.html
        Reference.html
        package-tree.html
        NamedReference.html
        Or.html
        Not.html
        ExpressionVisitors.ExpressionVisitor.html
        Evaluator.html
        And.html
        UnboundPredicate.html
        Expressions.html
        True.html
        InclusiveMetricsEvaluator.html
        Expression.Operation.html
        ExpressionVisitors.html
        StrictMetricsEvaluator.html
        False.html
        package-summary.html
        ResidualEvaluator.html
        BoundReference.html
        ManifestEvaluator.html
        ExpressionVisitors.BoundExpressionVisitor.html
        ManifestFile.html
        FilteredManifest.html
        SnapshotSummary.html
        ManifestFile.PartitionFieldSummary.html
        FileFormat.html
        FileHistory.html
        DataFiles.html
        pig
        package-frame.html
        IcebergStorage.html
        package-tree.html
        IcebergPigInputFormat.IcebergRecordReader.html
        IcebergPigInputFormat.html
        SchemaUtil.html
        package-summary.html
        PigParquetReader.html
        data
        package-frame.html
        avro
        package-frame.html
        DataReader.html
        DataWriter.html
        IcebergEncoder.html
        package-tree.html
        IcebergDecoder.html
        package-summary.html
        IcebergGenerics.html
        package-tree.html
        IcebergGenerics.ScanBuilder.html
        Record.html
        parquet
        package-frame.html
        GenericParquetWriter.html
        package-tree.html
        GenericParquetReaders.html
        package-summary.html
        GenericRecord.html
        package-summary.html
        FileHistory.Builder.html
        FindFiles.html
        types
        package-frame.html
        Types.FixedType.html
        Types.DateType.html
        Types.ListType.html
        Types.TimeType.html
        Type.NestedType.html
        Type.PrimitiveType.html
        Types.UUIDType.html
        TypeUtil.NextID.html
        Types.StructType.html
        TypeUtil.SchemaVisitor.html
        package-tree.html
        Types.IntegerType.html
        Types.BooleanType.html
        Types.DecimalType.html
        Types.LongType.html
        Types.StringType.html
        Types.MapType.html
        Type.html
        Types.DoubleType.html
        Types.TimestampType.html
        TypeUtil.html
        Conversions.html
        Types.BinaryType.html
        Types.FloatType.html
        Types.NestedField.html
        TypeUtil.CustomOrderSchemaVisitor.html
        package-summary.html
        CheckCompatibility.html
        Types.html
        Comparators.html
        IndexByName.html
        Type.TypeID.html
        TableProperties.html
        DataTableScan.html
        io
        package-frame.html
        DelegatingOutputStream.html
        CloseableIterable.html
        OutputFile.html
        package-tree.html
        CloseableIterable.ConcatCloseableIterable.html
        LocationProvider.html
        CloseableGroup.html
        InputFile.html
        FileIO.html
        DelegatingInputStream.html
        SeekableInputStream.html
        package-summary.html
        FileAppender.html
        PositionOutputStream.html
        DataOperations.html
        DataFilesTable.html
        BaseOverwriteFiles.html
        Transactions.html
        hive
        package-frame.html
        HiveClientPool.html
        HiveCatalogs.html
        package-tree.html
        HiveTypeConverter.html
        ClientPool.Action.html
        RuntimeMetaException.html
        HiveCatalog.html
        ClientPool.html
        package-summary.html
        HiveTableOperations.html
        exceptions
        package-frame.html
        package-tree.html
        NoSuchTableException.html
        RuntimeIOException.html
        NotFoundException.html
        CommitFailedException.html
        AlreadyExistsException.html
        package-summary.html
        ValidationException.html
        TableMetadata.SnapshotLogEntry.html
        FileScanTask.html
        MetricsModes.Full.html
        ManifestEntriesTable.html
        SnapshotParser.html
        BaseRewriteManifests.html
        PartitionSpec.html
        TableOperations.html
        ExpireSnapshots.html
        BaseTable.html
        Table.html
        UpdateSchema.html
        AppendFiles.html
        package-summary.html
        PartitionSpec.Builder.html
        BaseReplacePartitions.html
        SnapshotsTable.html
        Snapshot.html
        StructLike.html
        Accessors.html
        HistoryTable.html
        BaseMetastoreTableOperations.html
        encryption
        EncryptionKeyMetadatas.html
        package-frame.html
        PlaintextEncryptionManager.html
        package-tree.html
        EncryptedOutputFile.html
        EncryptionManager.html
        EncryptedInputFile.html
        package-summary.html
        EncryptedFiles.html
        EncryptionKeyMetadata.html
        transforms
        package-frame.html
        UnknownTransform.html
        Transforms.html
        package-tree.html
        Transform.html
        PartitionSpecVisitor.html
        package-summary.html
        UpdateProperties.html
        ScanTask.html
        events
        package-frame.html
        ScanEvent.html
        Listener.html
        package-tree.html
        Listeners.html
        package-summary.html
        MetricsModes.None.html
        UpdateLocation.html
        stylesheet.css
    - python-api-intro.md
    - api.md
    - schemas.md
    - api-quickstart.md
    - presto.md
    - community.md
    - evolution.md
    - reliability.md
    - trademarks.md
    - spark.md
    - snapshots.md
    - css
      - extra.css
    - custom-catalog.md
    - spec.md
- versions.lock
- LICENSE
- api
  - src
    - main
      - java
        org
        apache
        iceberg
        FileScanTask.java
        catalog
        TableIdentifier.java
        Namespace.java
        Catalog.java
        SupportsNamespaces.java
        ReplacePartitions.java
        StructLike.java
        UpdateSchema.java
        ManifestContent.java
        Rollback.java
        CombinedScanTask.java
        FileFormat.java
        Snapshot.java
        Accessors.java
        PendingUpdate.java
        Transaction.java
        Schema.java
        FileContent.java
        RewriteFiles.java
        PartitionSpec.java
        util
        BinaryUtil.java
        CharSequenceSet.java
        UnicodeUtil.java
        CharSequenceWrapper.java
        UpdateProperties.java
        Files.java
        SnapshotUpdate.java
        DataOperations.java
        expressions
        Expressions.java
        True.java
        ResidualEvaluator.java
        Projections.java
        Bound.java
        Binder.java
        SerializationProxies.java
        BoundPredicate.java
        Evaluator.java
        Or.java
        False.java
        Unbound.java
        BoundTransform.java
        Not.java
        RewriteNot.java
        Term.java
        UnboundTerm.java
        BoundReference.java
        And.java
        BoundTerm.java
        BoundSetPredicate.java
        Reference.java
        NamedReference.java
        ExpressionVisitors.java
        Literals.java
        ManifestEvaluator.java
        InclusiveMetricsEvaluator.java
        BoundLiteralPredicate.java
        Literal.java
        UnboundTransform.java
        Predicate.java
        StrictMetricsEvaluator.java
        BoundUnaryPredicate.java
        UnboundPredicate.java
        Expression.java
        ScanTask.java
        DeleteFile.java
        Metrics.java
        data
        Record.java
        HistoryEntry.java
        types
        IndexById.java
        PruneColumns.java
        FindTypeVisitor.java
        AssignFreshIds.java
        ReassignIds.java
        CheckCompatibility.java
        Types.java
        PrimitiveHolder.java
        IndexParents.java
        TypeUtil.java
        Conversions.java
        Comparators.java
        IndexByName.java
        GetProjectedIds.java
        Type.java
        ExpireSnapshots.java
        DataFile.java
        RewriteManifests.java
        ManifestFile.java
        Tables.java
        PartitionField.java
        io
        PositionOutputStream.java
        LocationProvider.java
        FileIO.java
        FileAppender.java
        DelegatingInputStream.java
        SeekableInputStream.java
        CloseableIterable.java
        InputFile.java
        OutputFile.java
        CloseableGroup.java
        DelegatingOutputStream.java
        CloseableIterator.java
        ContentFile.java
        DataTask.java
        exceptions
        RuntimeIOException.java
        NoSuchNamespaceException.java
        CommitFailedException.java
        NoSuchTableException.java
        DuplicateWAPCommitException.java
        NamespaceNotEmptyException.java
        ValidationException.java
        AlreadyExistsException.java
        CherrypickAncestorCommitException.java
        NotFoundException.java
        Accessor.java
        RowDelta.java
        Table.java
        UpdateLocation.java
        TableScan.java
        OverwriteFiles.java
        encryption
        EncryptionKeyMetadata.java
        EncryptedOutputFile.java
        EncryptionManager.java
        EncryptedInputFile.java
        AppendFiles.java
        transforms
        Identity.java
        Transforms.java
        ProjectionUtil.java
        SerializationProxies.java
        Timestamps.java
        TransformUtil.java
        Truncate.java
        PartitionSpecVisitor.java
        Bucket.java
        Dates.java
        UnknownTransform.java
        VoidTransform.java
        Transform.java
        DeleteFiles.java
        events
        ScanEvent.java
        Listener.java
        Listeners.java
        ManageSnapshots.java
    - test
      - java
        org
        apache
        iceberg
        catalog
        TestTableIdentifier.java
        TestPartitionSpecValidation.java
        TestHelpers.java
        AssertHelpers.java
        util
        RandomUtil.java
        TestTransformSerialization.java
        expressions
        TestNumericLiteralConversions.java
        TestPredicateBinding.java
        TestEvaluator.java
        TestInclusiveMetricsEvaluator.java
        TestMiscLiteralConversions.java
        TestStringLiteralConversions.java
        TestStrictMetricsEvaluator.java
        TestLiteralSerialization.java
        TestInclusiveManifestEvaluator.java
        TestExpressionBinding.java
        TestExpressionHelpers.java
        TestExpressionSerialization.java
        PartitionSpecTestBase.java
        types
        TestReadabilityChecks.java
        TestConversions.java
        TestSerializableTypes.java
        TestComparableComparator.java
        TestBinaryComparator.java
        TestTypeUtil.java
        TestCharSeqComparator.java
        io
        TestCloseableIterable.java
        TestPartitionPaths.java
        transforms
        TestProjection.java
        TestStartsWith.java
        TestBucketing.java
        TestBucketingProjection.java
        TestTimestampsProjection.java
        TestIdentity.java
        TestTruncatesResiduals.java
        TestDatesProjection.java
        TestDates.java
        TestResiduals.java
        TestTruncatesProjection.java
        TestTimestamps.java
        TestTruncate.java
        events
        TestListeners.java
  - dependencies.lock
- gradlew
- common
  - src
    - main
      - java
        org
        apache
        iceberg
        common
        DynClasses.java
        DynConstructors.java
        DynMethods.java
        DynFields.java
  - dependencies.lock
- spark2
  - src
    - main
      - resources
        META-INF
        services
        org.apache.spark.sql.sources.DataSourceRegister
      - java
        org
        apache
        iceberg
        spark
        SparkFilters.java
        source
        Reader.java
        Writer.java
        StreamingWriter.java
        IcebergSource.java
        Stats.java
    - jmh
      - java
        org
        apache
        iceberg
        spark
        source
        avro
        IcebergSourceNestedAvroDataReadBenchmark.java
        IcebergSourceFlatAvroDataReadBenchmark.java
        orc
        IcebergSourceNestedORCDataReadBenchmark.java
        IcebergSourceFlatORCDataBenchmark.java
        IcebergSourceFlatORCDataReadBenchmark.java
        IcebergSourceFlatDataBenchmark.java
        IcebergSourceNestedDataBenchmark.java
        parquet
        IcebergSourceFlatParquetDataWriteBenchmark.java
        IcebergSourceNestedParquetDataWriteBenchmark.java
        vectorized
        VectorizedReadFlatParquetDataBenchmark.java
        VectorizedReadDictionaryEncodedFlatParquetDataBenchmark.java
        IcebergSourceFlatParquetDataFilterBenchmark.java
        IcebergSourceFlatParquetDataReadBenchmark.java
        IcebergSourceNestedParquetDataReadBenchmark.java
        IcebergSourceNestedParquetDataFilterBenchmark.java
        IcebergSourceBenchmark.java
        Action.java
        SparkBenchmarkUtil.java
        data
        parquet
        SparkParquetReadersNestedDataBenchmark.java
        SparkParquetWritersNestedDataBenchmark.java
        SparkParquetReadersFlatDataBenchmark.java
        SparkParquetWritersFlatDataBenchmark.java
    - test
      - resources
        data
        books.json
        new-books.json
      - java
        org
        apache
        iceberg
        actions
        TestRewriteDataFilesAction.java
        TestRewriteManifestsAction.java
        TestRemoveOrphanFilesAction.java
        examples
        ConcurrencyTest.java
        ReadAndWriteTablesTest.java
        SnapshotFunctionalityTest.java
        SchemaEvolutionTest.java
        README.md
        SimpleRecord.java
        spark
        source
        TestDataSourceOptions24.java
        TestSparkTableUtilWithInMemoryCatalog.java
        TestSparkDataFile24.java
        TestDataFrameWrites24.java
        TestIdentityPartitionData24.java
        TestSparkSchema24.java
        TestSnapshotSelection24.java
        TestPartitionValues24.java
        TestIcebergSourceHiveTables.java
        TestStructuredStreaming24.java
        TestIcebergSourceTablesBase.java
        TestIcebergSource.java
        TestIcebergSourceHadoopTables.java
        TestForwardCompatibility24.java
        TestSparkReadProjection24.java
        TestSparkDataWrite24.java
        TestParquetScan24.java
        TestFilteredScan.java
        TestAvroScan24.java
        TestSparkTableUtil.java
        TestNameMappingProjection.java
        TestWriteMetricsConfig24.java
- mr
  - src
    - main
      - java
        org
        apache
        iceberg
        mr
        SerializationUtil.java
        mapreduce
        IcebergInputFormat.java
    - test
      - java
        org
        apache
        iceberg
        mr
        mapreduce
        TestIcebergInputFormat.java
  - dependencies.lock
- .baseline
  - checkstyle
    - checkstyle.xml
    - checkstyle-suppressions.xml
  - idea
    - intellij-java-palantir-style.xml
  - copyright
    - 001_apache-2.0.txt
  - eclipse
    - org.eclipse.jdt.core.prefs
    - dynamic
      - dotfile.checkstyle
    - static
      - dotfile.settings
        org.eclipse.jdt.ui.prefs
- jmh.gradle
- parquet
  - src
    - main
      - java
        org
        apache
        iceberg
        parquet
        TypeToMessageType.java
        ParquetAvroWriter.java
        VectorizedReader.java
        PruneColumns.java
        ApplyNameMapping.java
        BaseColumnIterator.java
        ParquetDictionaryRowGroupFilter.java
        TypeWithSchemaVisitor.java
        ValuesAsBytesReader.java
        Parquet.java
        ColumnIterator.java
        ParquetAvroValueReaders.java
        ParquetTypeVisitor.java
        ParquetFilters.java
        ParquetValueWriters.java
        ParquetWriter.java
        ParquetWriteSupport.java
        ParquetIO.java
        RemoveIds.java
        ParquetReadSupport.java
        TripleIterator.java
        ColumnWriter.java
        ReadConf.java
        ParquetAvro.java
        ParquetReader.java
        ParquetConversions.java
        ParquetValueWriter.java
        ParquetAvroReader.java
        ParquetUtil.java
        ParquetWriteAdapter.java
        TripleWriter.java
        ParquetValueReaders.java
        ParquetValueReader.java
        ParquetSchemaUtil.java
        PageIterator.java
        VectorizedParquetReader.java
        MessageTypeToType.java
        ParquetIterable.java
        ParquetMetricsRowGroupFilter.java
        BasePageIterator.java
    - test
      - java
        org
        apache
        iceberg
        avro
        TestReadProjection.java
        TestParquetReadProjection.java
        TestHelpers.java
        parquet
        TestParquetSchemaUtil.java
        TestParquet.java
        ParquetWritingTestUtils.java
        TestDictionaryRowGroupFilter.java
  - dependencies.lock
- spark
  - src
    - main
      - java
        org
        apache
        iceberg
        actions
        BaseSnapshotUpdateAction.java
        RewriteManifestsAction.java
        SnapshotUpdateAction.java
        Actions.java
        RemoveOrphanFilesAction.java
        BaseAction.java
        RewriteManifestsActionResult.java
        RewriteDataFilesActionResult.java
        RewriteDataFilesAction.java
        Action.java
        spark
        SparkTypeVisitor.java
        source
        UnpartitionedWriter.java
        SparkAppenderFactory.java
        BatchDataReader.java
        BaseWriter.java
        TaskResult.java
        BaseDataReader.java
        PartitionedWriter.java
        OutputFileFactory.java
        RowDataReader.java
        StructInternalRow.java
        PartitionKey.java
        RowDataRewriter.java
        SparkExceptionUtil.java
        SparkValueConverter.java
        SparkSchemaUtil.java
        TypeToSparkType.java
        SparkDataFile.java
        FixupTypes.java
        SparkTableUtil.java
        data
        SparkOrcValueReaders.java
        SparkOrcWriter.java
        SparkValueWriters.java
        vectorized
        ArrowVectorAccessor.java
        NullValuesColumnVector.java
        IcebergArrowColumnVector.java
        ColumnarBatchReader.java
        VectorizedSparkParquetReaders.java
        ArrowVectorAccessors.java
        SparkParquetWriters.java
        SparkOrcReader.java
        AvroWithSparkSchemaVisitor.java
        SparkAvroWriter.java
        SparkValueReaders.java
        ParquetWithSparkSchemaVisitor.java
        SparkAvroReader.java
        SparkParquetReaders.java
        SparkUtil.java
        PruneColumnsWithoutReordering.java
        PruneColumnsWithReordering.java
        SparkStructLike.java
        SparkTypeToType.java
    - test
      - java
        org
        apache
        iceberg
        spark
        source
        TestAvroScan.java
        ThreeColumnRecord.java
        TestReadProjection.java
        TestTables.java
        TestStructuredStreaming.java
        TestSnapshotSelection.java
        TestSparkDataFile.java
        TestWriteMetricsConfig.java
        TestSparkReadProjection.java
        TestSparkDataWrite.java
        TestParquetScan.java
        TestDataFrameWrites.java
        TestForwardCompatibility.java
        TestPartitionValues.java
        SimpleRecord.java
        TestSparkSchema.java
        LogMessage.java
        TestIdentityPartitionData.java
        TestDataSourceOptions.java
        data
        TestOrcWrite.java
        TestSparkAvroEnums.java
        TestHelpers.java
        GenericsHelpers.java
        RandomData.java
        parquet
        vectorized
        TestParquetDictionaryEncodedVectorizedReads.java
        TestParquetDictionaryFallbackToPlainEncodingVectorizedReads.java
        TestParquetVectorizedReads.java
        TestSparkOrcReader.java
        TestParquetAvroWriter.java
        TestParquetAvroReader.java
        TestSparkDateTimes.java
        TestSparkParquetWriter.java
        TestSparkParquetReader.java
        TestSparkAvroReader.java
        AvroDataTest.java
        TestManifestFileSerialization.java
        TestDataFileSerialization.java
- deploy.gradle
- build.gradle
- dev
  - source-release.sh
  - stage-binaries.sh
  - .rat-excludes
  - check-license
- python
  - iceberg
    - api
      - filterable.py
      - filtered_snapshot.py
      - snapshot.py
      - combined_scan_task.py
      - manifest_file.py
      - files.py
      - table_scan.py
      - replace_partitions.py
      - metrics.py
      - expire_snapshots.py
      - pending_update.py
      - schema.py
      - table.py
      - struct_like.py
      - rewrite_files.py
      - data_operations.py
      - file_scan_task.py
      - data_file.py
      - expressions
        expression_parser.py
        evaluator.py
        predicate.py
        residual_evaluator.py
        expression.py
        expressions.py
        literals.py
        projections.py
        strict_metrics_evaluator.py
        binder.py
        inclusive_manifest_evaluator.py
        __init__.py
        java_variables
        __init__.py
        inclusive_metrics_evaluator.py
        reference.py
      - partition_spec.py
      - transaction.py
      - file_format.py
      - rollback.py
      - tables.py
      - partition_field.py
      - types
        type.py
        type_util.py
        __init__.py
        conversions.py
        types.py
      - io
        input_file.py
        closeable_group.py
        delegating_input_stream.py
        output_file.py
        position_output_stream.py
        file_appender.py
        delegating_output_stream.py
        __init__.py
        seekable_input_stream.py
        closeable_iterable.py
      - overwrite_files.py
      - update_schema.py
      - __init__.py
      - snapshot_iterable.py
      - scan_task.py
      - delete_files.py
      - update_properties.py
      - transforms
        identity.py
        truncate.py
        timestamps.py
        transform.py
        transform_util.py
        dates.py
        bucket.py
        projection_util.py
        __init__.py
        transforms.py
      - append_files.py
    - __init__.py
    - hive
      - hive_tables.py
      - hive_table_operations.py
      - __init__.py
    - exceptions
      - exceptions.py
      - __init__.py
    - core
      - scan_summary.py
      - avro
        iceberg_to_avro.py
        avro_to_iceberg.py
        __init__.py
        avro_schema_util.py
      - filesystem
        util.py
        local_filesystem.py
        filesystem_tables.py
        s3_filesystem.py
        file_system.py
        file_status.py
        __init__.py
        filesystem_table_operations.py
      - generic_partition_field_summary.py
      - base_file_scan_task.py
      - base_snapshot.py
      - filtered_manifest.py
      - base_table.py
      - manifest_entry.py
      - schema_parser.py
      - util
        atomic_integer.py
        bin_packing.py
        __init__.py
      - generic_data_file.py
      - partition_spec_parser.py
      - base_transaction.py
      - table_metadata_parser.py
      - partition_data.py
      - table_metadata.py
      - base_table_scan.py
      - schema_update.py
      - __init__.py
      - table_properties.py
      - data_files.py
      - table_operations.py
      - snapshot_parser.py
      - generic_manifest_file.py
      - manifest_list_writer.py
      - base_metastore_table_operations.py
      - base_combined_scan_task.py
      - config_properties.py
      - partition_summary.py
      - base_metastore_tables.py
      - data_table_scan.py
      - manifest_reader.py
  - CHANGELOG.md
  - setup.py
  - README.md
  - tests
    - api
      - test_conversions.py
      - test_helpers.py
      - test_file_format.py
      - expressions
        test_inclusive_metrics_evaluator.py
        test_literal_serialization.py
        test_expression_helpers.py
        test_strict_metrics_evaluator.py
        test_expression_serializations.py
        test_str_to_expr.py
        test_string_literal_conversions.py
        test_misc_literal_conversions.py
        test_predicate_binding.py
        __init__.py
        test_inclusive_manifest_evaluator.py
        test_evaluator.py
        test_numeric_literal_conversions.py
        test_expression_binding.py
        conftest.py
      - types
        test_binary_comparator.py
        test_char_seq_comparator.py
        test_readabilty_checks.py
        test_comparable_comparator.py
        __init__.py
      - __init__.py
      - transforms
        test_truncate.py
        test_bucketing.py
        test_dates.py
        __init__.py
        test_timestamps.py
        test_identity.py
    - __init__.py
    - hive
      - test_hive_tables.py
      - __init__.py
      - conftest.py
    - core
      - avro
        test_avro.py
        test_read_projection.py
        __init__.py
        conftest.py
      - utils
        test_bin_packing.py
        __init__.py
      - test_table_metadata_parser.py
      - test_partition_spec_parser.py
      - test_table_metadata_json.py
      - __init__.py
      - test_partition_spec.py
      - test_snapshot_json.py
      - conftest.py
      - test_base_table_scan.py
  - tox.ini
- pig
  - src
    - main
      - java
        org
        apache
        iceberg
        pig
        IcebergPigInputFormat.java
        SchemaUtil.java
        PigParquetReader.java
        IcebergStorage.java
    - test
      - java
        org
        apache
        iceberg
        pig
        SchemaUtilTest.java
- data
  - src
    - main
      - java
        org
        apache
        iceberg
        data
        orc
        GenericOrcReader.java
        GenericOrcReaders.java
        GenericOrcWriter.java
        IcebergGenerics.java
        parquet
        GenericParquetReaders.java
        GenericParquetWriter.java
        TableScanIterable.java
        InternalRecordWrapper.java
    - test
      - java
        org
        apache
        iceberg
        orc
        TestOrcMetrics.java
        TestSplitScan.java
        parquet
        TestParquetMetrics.java
        data
        TestLocalScan.java
        avro
        TestGenericReadProjection.java
        TestGenericData.java
        TestSingleMessageEncoding.java
        orc
        TestGenericReadProjection.java
        TestGenericData.java
        TestReadProjection.java
        TestMetricsRowGroupFilter.java
        TestGenericRecord.java
        TestMetricsRowGroupFilterTypes.java
        parquet
        TestGenericReadProjection.java
        TestGenericData.java
        DataTest.java
        DataTestHelpers.java
        RandomGenericData.java
  - dependencies.lock
- spark-runtime
  - LICENSE
  - dependencies.lock
  - NOTICE
- .travis.yml
- README.md
- hive
  - src
    - main
      - java
        org
        apache
        iceberg
        hive
        HiveTableOperations.java
        ClientPool.java
        HiveClientPool.java
        HiveCatalogs.java
        RuntimeMetaException.java
        HiveCatalog.java
        HiveTypeConverter.java
    - test
      - resources
        hive-schema-3.1.0.derby.sql
      - java
        org
        apache
        iceberg
        hive
        HiveMetastoreTest.java
        ScriptRunner.java
        TestHiveCommits.java
        HiveTableTest.java
        TestHiveMetastore.java
        TestHiveTableConcurrency.java
        HiveTableBaseTest.java
        HiveCreateReplaceTableTest.java
        TestHiveCatalog.java
- baseline.gradle
- core
  - src
    - main
      - java
        org
        apache
        iceberg
        ManifestFiles.java
        AllDataFilesTable.java
        avro
        AvroIO.java
        TypeToSchema.java
        PruneColumns.java
        AvroSchemaUtil.java
        Avro.java
        AvroFileAppender.java
        SchemaToType.java
        GenericAvroReader.java
        ValueReaders.java
        AvroSchemaVisitor.java
        GenericAvroWriter.java
        LogicalMap.java
        BuildAvroProjection.java
        RemoveIds.java
        UUIDConversion.java
        ProjectionDatumReader.java
        HasIds.java
        ValueReader.java
        AvroCustomOrderSchemaVisitor.java
        ValueWriters.java
        AvroIterable.java
        ValueWriter.java
        AvroSchemaWithTypeVisitor.java
        ScanSummary.java
        MetricsModes.java
        GenericPartitionFieldSummary.java
        BaseMetastoreCatalog.java
        StaticDataTask.java
        ManifestLists.java
        MergeAppend.java
        PartitionsTable.java
        BaseRowDelta.java
        FileMetadata.java
        StreamingDelete.java
        RollbackToSnapshot.java
        GenericManifestEntry.java
        SystemProperties.java
        IncrementalDataTableScan.java
        LocationProviders.java
        mapping
        MappingUtil.java
        NameMapping.java
        NameMappingParser.java
        MappedFields.java
        MappedField.java
        MetricsConfig.java
        hadoop
        HadoopInputFile.java
        HiddenPathFilter.java
        HadoopFileIO.java
        HadoopTables.java
        HadoopOutputFile.java
        SerializableConfiguration.java
        HadoopCatalog.java
        Util.java
        HadoopTableOperations.java
        HadoopStreams.java
        SerializableByteBufferMap.java
        GenericDataFile.java
        ManifestGroup.java
        BaseMetadataTable.java
        ManifestsTable.java
        FindFiles.java
        SchemaParser.java
        InheritableMetadataFactory.java
        ManifestFilterManager.java
        TableMetadata.java
        Transactions.java
        PartitionSpecParser.java
        TableProperties.java
        ManifestListWriter.java
        BaseFileScanTask.java
        PartitionData.java
        SetLocation.java
        MetadataTableType.java
        util
        PropertyUtil.java
        DateTimeUtil.java
        TableScanUtil.java
        WapUtil.java
        Tasks.java
        ParallelIterable.java
        ManifestFileUtil.java
        BinPacking.java
        PartitionUtil.java
        Exceptions.java
        ByteBuffers.java
        SerializableSupplier.java
        JsonUtil.java
        ExceptionUtil.java
        StructLikeWrapper.java
        Pair.java
        ThreadPools.java
        SnapshotUtil.java
        V2Metadata.java
        SnapshotsTable.java
        CommitCallbackTransaction.java
        BaseTable.java
        BaseAllMetadataTableScan.java
        FastAppend.java
        GenericManifestFile.java
        ManifestReader.java
        BaseMetastoreTableOperations.java
        IndexedStructLike.java
        BaseFile.java
        BaseRewriteFiles.java
        TableOperations.java
        DataFilesTable.java
        data
        avro
        GenericReaders.java
        IcebergDecoder.java
        DataWriter.java
        GenericWriters.java
        IcebergEncoder.java
        DataReader.java
        IdentityPartitionConverters.java
        GenericRecord.java
        PropertiesUpdate.java
        ManifestEntriesTable.java
        StaticTableScan.java
        BaseOverwriteFiles.java
        ManifestEntry.java
        BaseRewriteManifests.java
        SnapshotParser.java
        AllManifestsTable.java
        V1Metadata.java
        CachingCatalog.java
        BaseTransaction.java
        RemoveSnapshots.java
        TableScanContext.java
        TableMetadataParser.java
        HistoryTable.java
        DataTableScan.java
        SnapshotProducer.java
        ManifestWriter.java
        AllEntriesTable.java
        ManifestMergeManager.java
        SnapshotSummary.java
        GenericDeleteFile.java
        DataFiles.java
        PartitionSummary.java
        BaseReplacePartitions.java
        SchemaUpdate.java
        InheritableMetadata.java
        SnapshotManager.java
        BaseSnapshot.java
        encryption
        EncryptionKeyMetadatas.java
        BaseEncryptedOutputFile.java
        EncryptedFiles.java
        PlaintextEncryptionManager.java
        BaseEncryptionKeyMetadata.java
        BaseEncryptedInputFile.java
        BaseTableScan.java
        BaseCombinedScanTask.java
        events
        CreateSnapshotEvent.java
        MergingSnapshotProducer.java
        HasTableOperations.java
    - test
      - java
        org
        apache
        iceberg
        TestScanDataFileColumns.java
        avro
        TestGenericAvro.java
        TestSchemaConversions.java
        TestAvroReadProjection.java
        RandomAvroData.java
        TestReadProjection.java
        TestAvroEnums.java
        TestAvroNameMapping.java
        AvroTestHelpers.java
        TestAvroOptionsWithNonNullDefaults.java
        TestHasIds.java
        AvroDataTest.java
        TestSchemaAndMappingUpdate.java
        TestMetadataTableScans.java
        TestTableMetadata.java
        TableMetadataParserCodecTest.java
        TestOffsetsBasedSplitScanTaskIterator.java
        TestSnapshotJson.java
        TestManifestCleanup.java
        TestSnapshot.java
        mapping
        TestNameMapping.java
        TestMappingUpdates.java
        TestReplacePartitions.java
        TestCreateTransaction.java
        TestReplaceTransaction.java
        TestRowDelta.java
        TestWapWorkflow.java
        TestEntriesMetadataTable.java
        hadoop
        TestHadoopCommits.java
        HadoopTableTestBase.java
        TestHadoopCatalog.java
        TestManifestWriter.java
        TestTables.java
        V2TableTestBase.java
        LocalTableOperations.java
        TestDeleteFiles.java
        TestOverwrite.java
        TestMetricsTruncation.java
        TestPartitionSpecInfo.java
        TestSnapshotSelection.java
        TestSchemaUpdate.java
        util
        TestBinPacking.java
        TestSplitPlanning.java
        TestRemoveSnapshots.java
        MockFileScanTask.java
        TestOverwriteWithValidation.java
        TestDataTableScan.java
        TestManifestListVersions.java
        TestTableMetadataSerialization.java
        TestRewriteManifests.java
        TableMetadataParserTest.java
        TestSnapshotManager.java
        TestFindFiles.java
        TestManifestWriterVersions.java
        TestPartitionSpecParser.java
        TestFastAppend.java
        TestMetricsModes.java
        TestMetrics.java
        TestScansAndSchemaEvolution.java
        TestMergeAppend.java
        TestFormatVersions.java
        TestManifestReader.java
        TestIncrementalDataTableScan.java
        TestTimestampPartitions.java
        TestFilterFiles.java
        TestSequenceNumberForV2Table.java
        TestScanSummary.java
        TestRewriteFiles.java
        TestFixedSizeSplitScanTaskIterator.java
        TestTransaction.java
        TableTestBase.java
  - dependencies.lock
- settings.gradle
- NOTICE
- .gitignore
- spark3-runtime
  - LICENSE
  - dependencies.lock
  - NOTICE
- bundled-guava
  - src
    - main
      - java
        org
        apache
        iceberg
        GuavaClasses.java
  - LICENSE
  - dependencies.lock
  - NOTICE

/*
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 * with the License.  You may obtain a copy of the License at
 *
 *   http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing,
 * software distributed under the License is distributed on an
 * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
 * KIND, either express or implied.  See the License for the
 * specific language governing permissions and limitations
 * under the License.
 */

package org.apache.iceberg.actions;

import java.io.File;
import java.io.IOException;
import java.util.Arrays;
import java.util.List;
import java.util.Map;
import java.util.stream.Collectors;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.iceberg.PartitionSpec;
import org.apache.iceberg.Schema;
import org.apache.iceberg.Snapshot;
import org.apache.iceberg.Table;
import org.apache.iceberg.TableProperties;
import org.apache.iceberg.hadoop.HadoopTables;
import org.apache.iceberg.hadoop.HiddenPathFilter;
import org.apache.iceberg.relocated.com.google.common.collect.Lists;
import org.apache.iceberg.relocated.com.google.common.collect.Maps;
import org.apache.iceberg.spark.source.ThreeColumnRecord;
import org.apache.iceberg.types.Types;
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Encoders;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;
import org.junit.AfterClass;
import org.junit.Assert;
import org.junit.Before;
import org.junit.BeforeClass;
import org.junit.Rule;
import org.junit.Test;
import org.junit.rules.TemporaryFolder;

import static org.apache.iceberg.types.Types.NestedField.optional;

public class TestRemoveOrphanFilesAction {

  private static final HadoopTables TABLES = new HadoopTables(new Configuration());
  private static final Schema SCHEMA = new Schema(
      optional(1, "c1", Types.IntegerType.get()),
      optional(2, "c2", Types.StringType.get()),
      optional(3, "c3", Types.StringType.get())
  );
  private static final PartitionSpec SPEC = PartitionSpec.builderFor(SCHEMA)
      .truncate("c2", 2)
      .identity("c3")
      .build();

  private static SparkSession spark;

  @BeforeClass
  public static void startSpark() {
    TestRemoveOrphanFilesAction.spark = SparkSession.builder()
        .master("local[2]")
        .getOrCreate();
  }

  @AfterClass
  public static void stopSpark() {
    SparkSession currentSpark = TestRemoveOrphanFilesAction.spark;
    TestRemoveOrphanFilesAction.spark = null;
    currentSpark.stop();
  }

  @Rule
  public TemporaryFolder temp = new TemporaryFolder();
  private File tableDir = null;
  private String tableLocation = null;

  @Before
  public void setupTableLocation() throws Exception {
    this.tableDir = temp.newFolder();
    this.tableLocation = tableDir.toURI().toString();
  }

  @Test
  public void testDryRun() throws IOException, InterruptedException {
    Table table = TABLES.create(SCHEMA, PartitionSpec.unpartitioned(), Maps.newHashMap(), tableLocation);

    List<ThreeColumnRecord> records = Lists.newArrayList(
        new ThreeColumnRecord(1, "AAAAAAAAAA", "AAAA")
    );

    Dataset<Row> df = spark.createDataFrame(records, ThreeColumnRecord.class).coalesce(1);

    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    List<String> validFiles = spark.read().format("iceberg")
        .load(tableLocation + "#files")
        .select("file_path")
        .as(Encoders.STRING())
        .collectAsList();
    Assert.assertEquals("Should be 2 valid files", 2, validFiles.size());

    df.write().mode("append").parquet(tableLocation + "/data");

    Path dataPath = new Path(tableLocation + "/data");
    FileSystem fs = dataPath.getFileSystem(spark.sessionState().newHadoopConf());
    List<String> allFiles = Arrays.stream(fs.listStatus(dataPath, HiddenPathFilter.get()))
        .filter(FileStatus::isFile)
        .map(file -> file.getPath().toString())
        .collect(Collectors.toList());
    Assert.assertEquals("Should be 3 files", 3, allFiles.size());

    List<String> invalidFiles = Lists.newArrayList(allFiles);
    invalidFiles.removeAll(validFiles);
    Assert.assertEquals("Should be 1 invalid file", 1, invalidFiles.size());

    // sleep for 1 second to unsure files will be old enough
    Thread.sleep(1000);

    Actions actions = Actions.forTable(table);

    List<String> result1 = actions.removeOrphanFiles()
        .deleteWith(s -> { })
        .execute();
    Assert.assertTrue("Default olderThan interval should be safe", result1.isEmpty());

    List<String> result2 = actions.removeOrphanFiles()
        .olderThan(System.currentTimeMillis())
        .deleteWith(s -> { })
        .execute();
    Assert.assertEquals("Action should find 1 file", invalidFiles, result2);
    Assert.assertTrue("Invalid file should be present", fs.exists(new Path(invalidFiles.get(0))));

    List<String> result3 = actions.removeOrphanFiles()
        .olderThan(System.currentTimeMillis())
        .execute();
    Assert.assertEquals("Action should delete 1 file", invalidFiles, result3);
    Assert.assertFalse("Invalid file should not be present", fs.exists(new Path(invalidFiles.get(0))));

    List<ThreeColumnRecord> expectedRecords = Lists.newArrayList();
    expectedRecords.addAll(records);
    expectedRecords.addAll(records);

    Dataset<Row> resultDF = spark.read().format("iceberg").load(tableLocation);
    List<ThreeColumnRecord> actualRecords = resultDF
        .as(Encoders.bean(ThreeColumnRecord.class))
        .collectAsList();
    Assert.assertEquals("Rows must match", expectedRecords, actualRecords);
  }

  @Test
  public void testAllValidFilesAreKept() throws IOException, InterruptedException {
    Table table = TABLES.create(SCHEMA, SPEC, Maps.newHashMap(), tableLocation);

    List<ThreeColumnRecord> records1 = Lists.newArrayList(
        new ThreeColumnRecord(1, "AAAAAAAAAA", "AAAA")
    );
    Dataset<Row> df1 = spark.createDataFrame(records1, ThreeColumnRecord.class).coalesce(1);

    // original append
    df1.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    List<ThreeColumnRecord> records2 = Lists.newArrayList(
        new ThreeColumnRecord(2, "AAAAAAAAAA", "AAAA")
    );
    Dataset<Row> df2 = spark.createDataFrame(records2, ThreeColumnRecord.class).coalesce(1);

    // dynamic partition overwrite
    df2.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("overwrite")
        .save(tableLocation);

    // second append
    df2.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    List<Snapshot> snapshots = Lists.newArrayList(table.snapshots());

    List<String> snapshotFiles1 = snapshotFiles(snapshots.get(0).snapshotId());
    Assert.assertEquals(1, snapshotFiles1.size());

    List<String> snapshotFiles2 = snapshotFiles(snapshots.get(1).snapshotId());
    Assert.assertEquals(1, snapshotFiles2.size());

    List<String> snapshotFiles3 = snapshotFiles(snapshots.get(2).snapshotId());
    Assert.assertEquals(2, snapshotFiles3.size());

    df2.coalesce(1).write().mode("append").parquet(tableLocation + "/data");
    df2.coalesce(1).write().mode("append").parquet(tableLocation + "/data/c2_trunc=AA");
    df2.coalesce(1).write().mode("append").parquet(tableLocation + "/data/c2_trunc=AA/c3=AAAA");
    df2.coalesce(1).write().mode("append").parquet(tableLocation + "/data/invalid/invalid");

    // sleep for 1 second to unsure files will be old enough
    Thread.sleep(1000);

    Actions actions = Actions.forTable(table);

    List<String> result = actions.removeOrphanFiles()
        .olderThan(System.currentTimeMillis())
        .execute();

    Assert.assertEquals("Should delete 4 files", 4, result.size());

    Path dataPath = new Path(tableLocation + "/data");
    FileSystem fs = dataPath.getFileSystem(spark.sessionState().newHadoopConf());

    for (String fileLocation : snapshotFiles1) {
      Assert.assertTrue("All snapshot files must remain", fs.exists(new Path(fileLocation)));
    }

    for (String fileLocation : snapshotFiles2) {
      Assert.assertTrue("All snapshot files must remain", fs.exists(new Path(fileLocation)));
    }

    for (String fileLocation : snapshotFiles3) {
      Assert.assertTrue("All snapshot files must remain", fs.exists(new Path(fileLocation)));
    }
  }

  @Test
  public void testWapFilesAreKept() throws InterruptedException {
    Map<String, String> props = Maps.newHashMap();
    props.put(TableProperties.WRITE_AUDIT_PUBLISH_ENABLED, "true");
    Table table = TABLES.create(SCHEMA, SPEC, props, tableLocation);

    List<ThreeColumnRecord> records = Lists.newArrayList(
        new ThreeColumnRecord(1, "AAAAAAAAAA", "AAAA")
    );
    Dataset<Row> df = spark.createDataFrame(records, ThreeColumnRecord.class);

    // normal write
    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    spark.conf().set("spark.wap.id", "1");

    // wap write
    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    Dataset<Row> resultDF = spark.read().format("iceberg").load(tableLocation);
    List<ThreeColumnRecord> actualRecords = resultDF
        .as(Encoders.bean(ThreeColumnRecord.class))
        .collectAsList();
    Assert.assertEquals("Should not return data from the staged snapshot", records, actualRecords);

    // sleep for 1 second to unsure files will be old enough
    Thread.sleep(1000);

    Actions actions = Actions.forTable(table);

    List<String> result = actions.removeOrphanFiles()
        .olderThan(System.currentTimeMillis())
        .execute();

    Assert.assertTrue("Should not delete any files", result.isEmpty());
  }

  @Test
  public void testMetadataFolderIsIntact() throws InterruptedException {
    // write data directly to the table location
    Map<String, String> props = Maps.newHashMap();
    props.put(TableProperties.WRITE_NEW_DATA_LOCATION, tableLocation);
    Table table = TABLES.create(SCHEMA, SPEC, props, tableLocation);

    List<ThreeColumnRecord> records = Lists.newArrayList(
        new ThreeColumnRecord(1, "AAAAAAAAAA", "AAAA")
    );
    Dataset<Row> df = spark.createDataFrame(records, ThreeColumnRecord.class).coalesce(1);

    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    df.write().mode("append").parquet(tableLocation + "/c2_trunc=AA/c3=AAAA");

    // sleep for 1 second to unsure files will be old enough
    Thread.sleep(1000);

    Actions actions = Actions.forTable(table);

    List<String> result = actions.removeOrphanFiles()
        .olderThan(System.currentTimeMillis())
        .execute();

    Assert.assertEquals("Should delete 1 file", 1, result.size());

    Dataset<Row> resultDF = spark.read().format("iceberg").load(tableLocation);
    List<ThreeColumnRecord> actualRecords = resultDF
        .as(Encoders.bean(ThreeColumnRecord.class))
        .collectAsList();
    Assert.assertEquals("Rows must match", records, actualRecords);
  }

  @Test
  public void testOlderThanTimestamp() throws InterruptedException {
    Table table = TABLES.create(SCHEMA, SPEC, Maps.newHashMap(), tableLocation);

    List<ThreeColumnRecord> records = Lists.newArrayList(
        new ThreeColumnRecord(1, "AAAAAAAAAA", "AAAA")
    );
    Dataset<Row> df = spark.createDataFrame(records, ThreeColumnRecord.class).coalesce(1);

    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    df.write().mode("append").parquet(tableLocation + "/data/c2_trunc=AA/c3=AAAA");
    df.write().mode("append").parquet(tableLocation + "/data/c2_trunc=AA/c3=AAAA");

    Thread.sleep(1000);

    long timestamp = System.currentTimeMillis();

    Thread.sleep(1000);

    df.write().mode("append").parquet(tableLocation + "/data/c2_trunc=AA/c3=AAAA");

    Actions actions = Actions.forTable(table);

    List<String> result = actions.removeOrphanFiles()
        .olderThan(timestamp)
        .execute();

    Assert.assertEquals("Should delete only 2 files", 2, result.size());
  }

  @Test
  public void testRemoveUnreachableMetadataVersionFiles() throws InterruptedException {
    Map<String, String> props = Maps.newHashMap();
    props.put(TableProperties.WRITE_NEW_DATA_LOCATION, tableLocation);
    props.put(TableProperties.METADATA_PREVIOUS_VERSIONS_MAX, "1");
    Table table = TABLES.create(SCHEMA, SPEC, props, tableLocation);

    List<ThreeColumnRecord> records = Lists.newArrayList(
        new ThreeColumnRecord(1, "AAAAAAAAAA", "AAAA")
    );
    Dataset<Row> df = spark.createDataFrame(records, ThreeColumnRecord.class);

    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    // sleep for 1 second to unsure files will be old enough
    Thread.sleep(1000);

    Actions actions = Actions.forTable(table);

    List<String> result = actions.removeOrphanFiles()
        .olderThan(System.currentTimeMillis())
        .execute();

    Assert.assertEquals("Should delete 1 file", 1, result.size());
    Assert.assertTrue("Should remove v1 file", result.get(0).contains("v1.metadata.json"));

    List<ThreeColumnRecord> expectedRecords = Lists.newArrayList();
    expectedRecords.addAll(records);
    expectedRecords.addAll(records);

    Dataset<Row> resultDF = spark.read().format("iceberg").load(tableLocation);
    List<ThreeColumnRecord> actualRecords = resultDF
        .as(Encoders.bean(ThreeColumnRecord.class))
        .collectAsList();
    Assert.assertEquals("Rows must match", expectedRecords, actualRecords);
  }

  @Test
  public void testManyTopLevelPartitions() throws InterruptedException {
    Table table = TABLES.create(SCHEMA, SPEC, Maps.newHashMap(), tableLocation);

    List<ThreeColumnRecord> records = Lists.newArrayList();
    for (int i = 0; i < 100; i++) {
      records.add(new ThreeColumnRecord(i, String.valueOf(i), String.valueOf(i)));
    }

    Dataset<Row> df = spark.createDataFrame(records, ThreeColumnRecord.class);

    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    // sleep for 1 second to unsure files will be old enough
    Thread.sleep(1000);

    Actions actions = Actions.forTable(table);

    List<String> result = actions.removeOrphanFiles()
        .olderThan(System.currentTimeMillis())
        .execute();

    Assert.assertTrue("Should not delete any files", result.isEmpty());

    Dataset<Row> resultDF = spark.read().format("iceberg").load(tableLocation);
    List<ThreeColumnRecord> actualRecords = resultDF
        .as(Encoders.bean(ThreeColumnRecord.class))
        .collectAsList();
    Assert.assertEquals("Rows must match", records, actualRecords);
  }

  @Test
  public void testManyLeafPartitions() throws InterruptedException {
    Table table = TABLES.create(SCHEMA, SPEC, Maps.newHashMap(), tableLocation);

    List<ThreeColumnRecord> records = Lists.newArrayList();
    for (int i = 0; i < 100; i++) {
      records.add(new ThreeColumnRecord(i, String.valueOf(i % 3), String.valueOf(i)));
    }

    Dataset<Row> df = spark.createDataFrame(records, ThreeColumnRecord.class);

    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableLocation);

    // sleep for 1 second to unsure files will be old enough
    Thread.sleep(1000);

    Actions actions = Actions.forTable(table);

    List<String> result = actions.removeOrphanFiles()
        .olderThan(System.currentTimeMillis())
        .execute();

    Assert.assertTrue("Should not delete any files", result.isEmpty());

    Dataset<Row> resultDF = spark.read().format("iceberg").load(tableLocation);
    List<ThreeColumnRecord> actualRecords = resultDF
        .as(Encoders.bean(ThreeColumnRecord.class))
        .collectAsList();
    Assert.assertEquals("Rows must match", records, actualRecords);
  }

  private List<String> snapshotFiles(long snapshotId) {
    return spark.read().format("iceberg")
        .option("snapshot-id", snapshotId)
        .load(tableLocation + "#files")
        .select("file_path")
        .as(Encoders.STRING())
        .collectAsList();
  }

  @Test
  public void testRemoveOrphanFilesWithRelativeFilePath() throws IOException, InterruptedException {
    Table table = TABLES.create(SCHEMA, PartitionSpec.unpartitioned(), Maps.newHashMap(), tableDir.getAbsolutePath());

    List<ThreeColumnRecord> records = Lists.newArrayList(
        new ThreeColumnRecord(1, "AAAAAAAAAA", "AAAA")
    );

    Dataset<Row> df = spark.createDataFrame(records, ThreeColumnRecord.class).coalesce(1);

    df.select("c1", "c2", "c3")
        .write()
        .format("iceberg")
        .mode("append")
        .save(tableDir.getAbsolutePath());

    List<String> validFiles = spark.read().format("iceberg")
        .load(tableLocation + "#files")
        .select("file_path")
        .as(Encoders.STRING())
        .collectAsList();
    Assert.assertEquals("Should be 1 valid files", 1, validFiles.size());
    String validFile = validFiles.get(0);

    df.write().mode("append").parquet(tableLocation + "/data");

    Path dataPath = new Path(tableLocation + "/data");
    FileSystem fs = dataPath.getFileSystem(spark.sessionState().newHadoopConf());
    List<String> allFiles = Arrays.stream(fs.listStatus(dataPath, HiddenPathFilter.get()))
        .filter(FileStatus::isFile)
        .map(file -> file.getPath().toString())
        .collect(Collectors.toList());
    Assert.assertEquals("Should be 2 files", 2, allFiles.size());

    List<String> invalidFiles = Lists.newArrayList(allFiles);
    invalidFiles.removeIf(file -> file.contains(validFile));
    Assert.assertEquals("Should be 1 invalid file", 1, invalidFiles.size());

    // sleep for 1 second to unsure files will be old enough
    Thread.sleep(1000);

    Actions actions = Actions.forTable(table);
    List<String> result = actions.removeOrphanFiles()
        .olderThan(System.currentTimeMillis())
        .deleteWith(s -> { })
        .execute();
    Assert.assertEquals("Action should find 1 file", invalidFiles, result);
    Assert.assertTrue("Invalid file should be present", fs.exists(new Path(invalidFiles.get(0))));
  }
}