scala source code of MetadataIteratorSpec

Project: jgit-spark-connector (GitHub Link)

jgit-spark-connector-master
- src
  - main
    - scala
      - tech
        sourced
        engine
        Schema.scala
        provider
        ReadOnlyFileRepository.scala
        RepositoryRDDProvider.scala
        RepositoryProvider.scala
        udf
        ClassifyLanguagesUDF.scala
        ExtractUASTsUDF.scala
        CustomUDF.scala
        QueryXPathUDF.scala
        ExtractTokensUDF.scala
        ConcatArrayUDF.scala
        package.scala
        iterator
        MetadataIterator.scala
        GitTreeEntryIterator.scala
        RootedRepo.scala
        ReferenceIterator.scala
        CommitIterator.scala
        BlobIterator.scala
        ChainableIterator.scala
        RepositoryIterator.scala
        CleanupIterator.scala
        compat
        compat.scala
        util
        Filters.scala
        GitUrlsParser.scala
        Bblfsh.scala
        MD5Gen.scala
        QueryBuilder.scala
        Engine.scala
        exception
        RepositoryException.scala
        Sources.scala
        DefaultSource.scala
        MetadataSource.scala
        rule
        SquashGitRelationsJoin.scala
        AddSourceToAttributes.scala
        SquashMetadataRelationsJoin.scala
        RelationOptimizer.scala
        TableBuilder.scala
      - org
        apache
        spark
        UtilsWrapper.scala
  - test
    - resources
      - log4j.properties
      - zip-slip-siva-files
        git-zipslip.siva
      - siva-files
        not-siva.txt
    - scala
      - tech
        sourced
        engine
        QueryBuilderSpec.scala
        provider
        RepositoryProviderSpec.scala
        RepositoryRDDProviderSpec.scala
        udf
        CustomUDFSpec.scala
        StorageLevelSpec.scala
        BaseSourceSpec.scala
        DefaultSourceSpec.scala
        BaseSivaSpec.scala
        iterator
        ReferenceIteratorSpec.scala
        CommitIteratorSpec.scala
        RepositoryIteratorSpec.scala
        BlobIteratorSpec.scala
        MetadataIteratorSpec.scala
        BaseChainableIterator.scala
        GitTreeEntryIteratorSpec.scala
        EngineSpec.scala
        util
        RepoUtils.scala
        FilterSpec.scala
        MetadataSourceSpec.scala
        BaseSparkSpec.scala
        FilterUDFSpec.scala
- scalastyle-config.xml
- Makefile
- LICENSE
- project
  - Dependencies.scala
  - build.properties
  - plugins.sbt
- MAINTAINERS
- key.asc.enc
- sbt
- ISSUE_TEMPLATE.md
- python
  - Makefile
  - test
    - test_sourced_dataframe.py
    - test_engine.py
    - __init__.py
    - base.py
  - README.rst
  - setup.py
  - sourced
    - examples
      - repo_references.py
      - repos.py
      - repo_files.py
      - basic.py
      - uasts.py
      - __init__.py
    - engine
      - engine.py
      - __init__.py
    - __init__.py
  - setup.cfg
  - .gitignore
  - LICENSE.txt
  - MANIFEST.in
- documentation
  - proposals
    - ENIP-003.md
    - ENIP-001.md
    - ENIP-000.md
    - ENIP-004.md
    - ENIP-002.md
    - README.md
- .travis.yml
- README.md
- CODE_OF_CONDUCT.md
- _examples
  - pyspark
    - pyspark-shell-classifying-languages.md
    - pyspark-shell-uast-extraction.md
    - pyspark-shell-raw-repositories.md
    - pyspark-shell-basic.md
    - pyspark-shell-schemas.md
    - pyspark-shell-lang-and-uast.md
    - pyspark-shell-xpath-query.md
  - scala
    - spark-shell-xpath-query.md
    - spark-shell-schemas.md
    - spark-shell-basic.md
    - spark-shell-classifying-languages.md
    - spark-shell-lang-and-uast.md
    - spark-shell-raw-repositories.md
    - spark-shell-uast-extraction.md
  - notebooks
    - Example.ipynb
  - README.md
  - siva-files
    - aac052c42c501abf6aa8c3509424e837bb27e188.siva
- Dockerfile
- build.sbt
- .gitignore
- .dockerignore
- DCO

package tech.sourced.engine.iterator

import java.nio.file.Paths
import java.util.{Properties, UUID}

import org.apache.commons.io.FileUtils
import org.apache.spark.sql.Row
import org.apache.spark.sql.catalyst.expressions.{Attribute, AttributeReference}
import org.apache.spark.sql.types.{Metadata, StringType, StructType}
import org.scalatest.{BeforeAndAfterAll, FlatSpec, Matchers}
import tech.sourced.engine.{BaseSparkSpec, Schema}

class JDBCQueryIteratorSpec
  extends FlatSpec with Matchers with BeforeAndAfterAll with BaseSparkSpec {
  private val tmpPath = Paths.get(
    System.getProperty("java.io.tmpdir"),
    UUID.randomUUID.toString
  )

  private val dbPath = tmpPath.resolve("test.db")

  override def beforeAll(): Unit = {
    super.beforeAll()
    tmpPath.toFile.mkdir()
    val rdd = ss.sparkContext.parallelize(Seq(
      Row("id1"),
      Row("id2"),
      Row("id3")
    ))

    val properties = new Properties()
    properties.put("driver", "org.sqlite.JDBC")
    val df = ss.createDataFrame(rdd, StructType(Seq(Schema.repositories.head)))
    df.write.jdbc(s"jdbc:sqlite:${dbPath.toString}", "repositories", properties)
  }

  override def afterAll(): Unit = {
    super.afterAll()
    FileUtils.deleteQuietly(tmpPath.toFile)
  }

  "JDBCQueryIterator" should "return all rows for the query" in {
    val iter = new JDBCQueryIterator(
      Seq(attr("id")),
      dbPath.toString,
      "SELECT id FROM repositories ORDER BY id"
    )

    // calling hasNext more than one time does not cause rows to be lost
    iter.hasNext
    iter.hasNext
    val rows = (for (row <- iter) yield row).toArray
    rows.length should be(3)
    rows(0).length should be(1)
    rows(0)(0).toString should be("id1")
    rows(1)(0).toString should be("id2")
    rows(2)(0).toString should be("id3")
  }

  private def attr(name: String): Attribute = AttributeReference(
    name, StringType, nullable = false, Metadata.empty
  )()
}