scala source code of EvolvabilitySuite

delta-master
- NOTICE.txt
- src
  - main
    - resources
      - NOTICE.txt
      - META-INF
        services
        org.apache.spark.sql.sources.DataSourceRegister
    - antlr4
      - io
        delta
        sql
        parser
        DeltaSqlBase.g4
    - scala
      - io
        delta
        sql
        parser
        DeltaSqlParser.scala
        DeltaSparkSessionExtension.scala
        tables
        DeltaMergeBuilder.scala
        execution
        VacuumTableCommand.scala
        DeltaConvert.scala
        DeltaTableOperations.scala
        DeltaTable.scala
      - com
        databricks
        spark
        util
        DatabricksLogging.scala
      - org
        apache
        spark
        sql
        catalyst
        plans
        logical
        DeltaUpdateTable.scala
        DeltaDelete.scala
        deltaMerge.scala
        delta
        catalog
        DeltaCatalog.scala
        DeltaTableV2.scala
        DeltaTableIdentifier.scala
        DeltaOptions.scala
        actions
        actions.scala
        InMemoryLogReplay.scala
        storage
        HDFSLogStore.scala
        LocalLogStore.scala
        LogStore.scala
        AzureLogStore.scala
        S3SingleDriverLogStore.scala
        HadoopFileSystemLogStore.scala
        PreprocessTableDelete.scala
        OptimisticTransaction.scala
        DeltaTimeTravelSpec.scala
        Checkpoints.scala
        hooks
        GenerateSymlinkManifest.scala
        PostCommitHook.scala
        DeltaLog.scala
        DeltaUnsupportedOperationsCheck.scala
        Snapshot.scala
        PartitionFiltering.scala
        sources
        DeltaSourceUtils.scala
        DeltaDataSource.scala
        DeltaSource.scala
        DeltaSink.scala
        DeltaSourceOffset.scala
        DeltaSQLConf.scala
        limits.scala
        isolationLevels.scala
        files
        TransactionalWrite.scala
        DelayedCommitProtocol.scala
        TahoeFileIndex.scala
        DeltaSourceSnapshot.scala
        SQLMetricsReporting.scala
        commands
        DeltaCommand.scala
        DeleteCommand.scala
        VacuumCommand.scala
        MergeIntoCommand.scala
        CreateDeltaTableCommand.scala
        UpdateCommand.scala
        WriteIntoDelta.scala
        DeltaGenerateCommand.scala
        DescribeDeltaHistoryCommand.scala
        ConvertToDeltaCommand.scala
        alterDeltaTableCommands.scala
        DescribeDeltaDetailsCommand.scala
        DeltaFileFormat.scala
        UpdateExpressionsSupport.scala
        DeltaHistoryManager.scala
        util
        AnalysisHelper.scala
        DeltaFileOperations.scala
        StateCache.scala
        DeltaProgressReporter.scala
        SetAccumulator.scala
        SerializableFileStatus.scala
        DateTimeFormatterHelper.scala
        JsonUtils.scala
        TimestampFormatter.scala
        FileNames.scala
        DateTimeUtils.scala
        DatasetRefCache.scala
        DateFormatter.scala
        PartitionUtils.scala
        PreprocessTableUpdate.scala
        MetadataCleanup.scala
        PreprocessTableMerge.scala
        DeltaErrors.scala
        SnapshotManagement.scala
        DeltaOperations.scala
        Checksum.scala
        stats
        DeltaScan.scala
        ArrayAccumulator.scala
        DeltaConfig.scala
        metering
        DeltaLogging.scala
        schema
        ImplicitMetadataOperation.scala
        InvariantViolationException.scala
        CheckDeltaInvariant.scala
        Invariants.scala
        SchemaUtils.scala
        DeltaInvariantCheckerExec.scala
        DeltaAnalysis.scala
        DeltaLogFileIndex.scala
        DeltaTable.scala
  - test
    - resources
      - log4j.properties
      - delta
        delta-0.1.0
        _delta_log
        .00000000000000000001.json.crc
        _last_checkpoint
        .00000000000000000003.json.crc
        00000000000000000002.json
        00000000000000000000.json
        00000000000000000003.checkpoint.parquet
        .00000000000000000003.checkpoint.parquet.crc
        .00000000000000000002.json.crc
        00000000000000000001.json
        00000000000000000003.json
        .00000000000000000000.json.crc
        .part-00001-f1cb1cf9-7a73-439c-b0ea-dcba5c2280a6-c000.snappy.parquet.crc
        .part-00001-6d252218-2632-416e-9e46-f32316ec314a-c000.snappy.parquet.crc
        .part-00000-f4aeebd0-a689-4e1b-bc7a-bbb0ec59dce5-c000.snappy.parquet.crc
        part-00000-f4aeebd0-a689-4e1b-bc7a-bbb0ec59dce5-c000.snappy.parquet
        .part-00000-348d7f43-38f6-4778-88c7-45f379471c49-c000.snappy.parquet.crc
        part-00001-6d252218-2632-416e-9e46-f32316ec314a-c000.snappy.parquet
        id=6
        .part-00000-adb59f54-6b8f-4bfd-9915-ae26bd0f0e2c.c000.snappy.parquet.crc
        part-00000-adb59f54-6b8f-4bfd-9915-ae26bd0f0e2c.c000.snappy.parquet
        part-00001-f1cb1cf9-7a73-439c-b0ea-dcba5c2280a6-c000.snappy.parquet
        id=5
        .part-00000-f1e0b560-ca00-409e-a274-f1ab264bc412.c000.snappy.parquet.crc
        part-00000-f1e0b560-ca00-409e-a274-f1ab264bc412.c000.snappy.parquet
        id=4
        part-00001-36c738bf-7836-479b-9cc1-7a4934207856.c000.snappy.parquet
        .part-00001-36c738bf-7836-479b-9cc1-7a4934207856.c000.snappy.parquet.crc
        part-00000-348d7f43-38f6-4778-88c7-45f379471c49-c000.snappy.parquet
        history
        delta-0.2.0
        part-00000-cb6b150b-30b8-4662-ad28-ff32ddab96d2-c000.snappy.parquet
        .part-00001-c373a5bd-85f0-4758-815e-7eb62007a15c-c000.snappy.parquet.crc
        part-00001-c373a5bd-85f0-4758-815e-7eb62007a15c-c000.snappy.parquet
        .part-00001-4327c977-2734-4477-9507-7ccf67924649-c000.snappy.parquet.crc
        _delta_log
        _last_checkpoint
        .._last_checkpoint.477ba875-7a14-4e57-9973-1349c21a152c.tmp.crc
        00000000000000000002.json
        00000000000000000000.json
        ..00000000000000000001.json.641a776e-6e56-4423-a9b0-7efc9e58826a.tmp.crc
        00000000000000000003.checkpoint.parquet
        .00000000000000000003.checkpoint.parquet.crc
        ..00000000000000000002.json.e64807e6-437c-44c9-abd2-50e6514d236e.tmp.crc
        00000000000000000001.json
        ..00000000000000000003.json.b374eda7-fa09-48ce-b06c-56025163f6ae.tmp.crc
        ..00000000000000000000.json.c6b312ca-665d-46ab-93a9-9f87ad2baa92.tmp.crc
        00000000000000000003.json
        part-00000-b44fcdb0-8b06-4f3a-8606-f8311a96f6dc-c000.snappy.parquet
        .part-00000-b44fcdb0-8b06-4f3a-8606-f8311a96f6dc-c000.snappy.parquet.crc
        part-00000-7c2deba3-1994-4fb8-bc07-d46c948aa415-c000.snappy.parquet
        .part-00000-7c2deba3-1994-4fb8-bc07-d46c948aa415-c000.snappy.parquet.crc
        .part-00000-cb6b150b-30b8-4662-ad28-ff32ddab96d2-c000.snappy.parquet.crc
        part-00000-512e1537-8aaa-4193-b8b4-bef3de0de409-c000.snappy.parquet
        .part-00000-512e1537-8aaa-4193-b8b4-bef3de0de409-c000.snappy.parquet.crc
        part-00001-4327c977-2734-4477-9507-7ccf67924649-c000.snappy.parquet
        .part-00001-185eca06-e017-4dea-ae49-fc48b973e37e-c000.snappy.parquet.crc
        part-00001-185eca06-e017-4dea-ae49-fc48b973e37e-c000.snappy.parquet
    - scala
      - io
        delta
        sql
        DeltaExtensionAndCatalogSuite.scala
        parser
        DeltaSqlParserSuite.scala
        tables
        DeltaTableTestUtils.scala
        DeltaTableSuite.scala
      - org
        apache
        spark
        sql
        delta
        EvolvabilitySuiteBase.scala
        DeltaDataFrameWriterV2Suite.scala
        MergeIntoAccumulatorSuite.scala
        MergeIntoSQLSuite.scala
        DescribeDeltaDetailSuite.scala
        HiveConvertToDeltaSuite.scala
        DeltaOptionSuite.scala
        DeltaAlterTableTests.scala
        DescribeDeltaHistorySuite.scala
        HiveDeltaNotSupportedDDLSuite.scala
        DeltaProtocolVersionSuite.scala
        SchemaValidationSuite.scala
        HiveDeltaDDLSuite.scala
        ActionSerializerSuite.scala
        DeltaDDLSuite.scala
        DeleteSuiteBase.scala
        ConvertToDeltaSQLSuite.scala
        test
        DeltaHiveTest.scala
        DeltaSQLCommandTest.scala
        DeltaSourceSuite.scala
        DeltaSuite.scala
        DeltaInsertIntoTableSuite.scala
        UpdateScalaSuite.scala
        DeleteScalaSuite.scala
        util
        DatasetRefCacheSuite.scala
        DeltaRetentionSuite.scala
        DeltaTimeTravelSuite.scala
        UpdateSQLSuite.scala
        UpdateSuiteBase.scala
        FileNamesSuite.scala
        DeltaConfigSuite.scala
        ConvertToDeltaScalaSuite.scala
        DeltaSourceSuiteBase.scala
        DeltaRetentionSuiteBase.scala
        DeleteSQLSuite.scala
        DeltaTableCreationTests.scala
        MergeIntoScalaSuite.scala
        S3LikeLocalFileSystem.scala
        ConvertToDeltaSuiteBase.scala
        MergeIntoSuiteBase.scala
        DeltaTestUtils.scala
        OptimisticTransactionSuite.scala
        EvolvabilitySuite.scala
        DeltaVacuumSuite.scala
        DeltaNotSupportedDDLSuite.scala
        DeltaLogSuite.scala
        DeltaDDLUsingPathSuite.scala
        LogStoreSuite.scala
        schema
        SchemaEnforcementSuite.scala
        CaseSensitivitySuite.scala
        SchemaUtilsSuite.scala
        InvariantEnforcementSuite.scala
        DeltaErrorsSuite.scala
        DeltaGenerateSymlinkManifestSuite.scala
        DeltaSinkSuite.scala
    - java
      - io
        delta
        sql
        JavaDeltaSparkSessionExtensionSuite.java
        tables
        JavaDeltaTableSuite.java
      - org
        apache
        spark
        sql
        delta
        DeleteJavaSuite.java
        MergeIntoJavaSuite.java
        DeltaSQLCommandJavaTest.java
        UpdateJavaSuite.java
- .circleci
  - config.yml
- scalastyle-config.xml
- build
  - sbt
  - sbt-launch-lib.bash
  - sbt-config
    - repositories
- examples
  - scala
    - src
      - main
        resources
        log4j.properties
        scala
        example
        QuickstartSQLOnPaths.scala
        Quickstart.scala
        Streaming.scala
        QuickstartSQL.scala
        Utilities.scala
    - build
      - sbt
      - sbt-launch-lib.bash
      - sbt-config
        repositories
    - project
      - build.properties
    - build.sbt
  - tutorials
    - saiseu19
      - SAISEu19 - Delta Lake Scala Tutorial.scala
      - readme.md
      - SAISEu19 - Delta Lake Python Tutorial.py
  - python
    - utilities.py
    - streaming.py
    - quickstart.py
    - quickstart_sql.py
    - quickstart_sql_on_paths.py
  - README.md
- PROTOCOL.md
- run-integration-tests.py
- project
  - build.properties
  - project
    - plugins.sbt
  - MimaExcludes.scala
  - plugins.sbt
- CONTRIBUTING.md
- .gitattributes
- dev
  - lint-python
  - tox.ini
- python
  - delta
    - tables.py
    - __init__.py
    - tests
      - test_sql.py
      - test_deltatable.py
      - __init__.py
    - testing
      - log4j.properties
      - __init__.py
      - utils.py
  - run-tests.py
- README.md
- Dockerfile
- build.sbt
- .gitignore
- docs
  - api-javadocs.js
  - api-docs.css
  - api-docs.js
  - python
    - Makefile
    - index.rst
    - conf.py
  - generate_api_docs.py
  - api-javadocs.css
- LICENSE.txt
- run-tests.py
- version.sbt

/*
 * Copyright (2020) The Delta Lake Project Authors.
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 * http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

package org.apache.spark.sql.delta

import org.apache.spark.sql.delta.util.{FileNames, JsonUtils}
import org.apache.hadoop.fs.Path

import org.apache.spark.sql.functions.typedLit
import org.apache.spark.sql.internal.SQLConf
import org.apache.spark.sql.test.SQLTestUtils
import org.apache.spark.util.Utils

class EvolvabilitySuite extends EvolvabilitySuiteBase with SQLTestUtils {

  import testImplicits._

  test("delta 0.1.0") {
    testEvolvability("src/test/resources/delta/delta-0.1.0")
  }

  test("delta 0.1.0 - case sensitivity enabled") {
    withSQLConf(SQLConf.CASE_SENSITIVE.key -> "true") {
      testEvolvability("src/test/resources/delta/delta-0.1.0")
    }
  }

  testQuietly("future proofing against new features") {
    val tempDir = Utils.createTempDir().toString
    Seq(1, 2, 3).toDF().write.format("delta").save(tempDir)

    val deltaLog = DeltaLog.forTable(spark, tempDir)
    deltaLog.store.write(new Path(deltaLog.logPath, "00000000000000000001.json"),
      Iterator("""{"some_new_feature":{"a":1}}"""))

    // Shouldn't fail here
    deltaLog.update()

    val sq = spark.readStream.format("delta").load(tempDir.toString)
      .groupBy()
      .count()
      .writeStream
      .outputMode("complete")
      .format("console")
      .start()

    // Also shouldn't fail
    sq.processAllAvailable()
    Seq(1, 2, 3).toDF().write.format("delta").mode("append").save(tempDir)
    sq.processAllAvailable()
    deltaLog.store.write(new Path(deltaLog.logPath, "00000000000000000003.json"),
      Iterator("""{"some_new_feature":{"a":1}}"""))
    sq.processAllAvailable()
    sq.stop()
  }

  test("serialized partition values must contain null values") {
    val tempDir = Utils.createTempDir().toString
    val df1 = spark.range(5).withColumn("part", typedLit[String](null))
    val df2 = spark.range(5).withColumn("part", typedLit("1"))
    df1.union(df2).coalesce(1).write.partitionBy("part").format("delta").save(tempDir)

    // Clear the cache
    DeltaLog.clearCache()
    val deltaLog = DeltaLog.forTable(spark, tempDir)

    val dataThere = deltaLog.snapshot.allFiles.collect().forall { addFile =>
      if (!addFile.partitionValues.contains("part")) {
        fail(s"The partition values: ${addFile.partitionValues} didn't contain the column 'part'.")
      }
      val value = addFile.partitionValues("part")
      value === null || value === "1"
    }

    assert(dataThere, "Partition values didn't match with null or '1'")

    // Check serialized JSON as well
    val contents = deltaLog.store.read(FileNames.deltaFile(deltaLog.logPath, 0L))
    assert(contents.exists(_.contains(""""part":null""")), "null value should be written in json")
  }

  testQuietly("parse old version CheckpointMetaData") {
    assert(JsonUtils.mapper.readValue[CheckpointMetaData]("""{"version":1,"size":1}""")
      == CheckpointMetaData(1, 1, None))
  }
}